GoForum › 🌐 V2EX

Claude Opus 似乎是官方降智了，洗车题失败

germain · 2026-04-09 08:00 · 0 次点赞 · 5 条回复

如图 https://i.imgur.com/h6yDuC3.png

5 条回复

b309f3337 · 2026-04-09 08:30

我最近也发感觉 opus 4.5 好像有点变傻了，以前让它做的很多功能一次性就能解决了，甚至超出我的预料，最近好几次也不算是很复杂的问题，来回好几次都搞不定

murmur · 2026-04-09 08:35

这题我见过攻击性最强的回答是米哈游那个 AI ，直接扛着车去

germain · 2026-04-09 08:45

@b309f3337 甚至有几个 Opus 没能干净解决的历史问题我用免费的 qwen3.6 plus 搞定了，这几天 Claude 问题一堆，还有很多 billing 相关的问题他们的那个 fin bot 无法解决，说让我等真人 email 联系，都一周过去了，音讯全无

@murmur 这题是快速验证模型真正算力的最简单方法了,不过这扛过去的模型我是不大敢用，怕闪着钱包

jchencode · 2026-04-09 08:55

Opus 确实降智了，应该是跟新出的 Glasswing 有关系，Glasswing 吃掉了很多算力。

而且，Glasswing 模型推理能力比 Opus 高出几十个百分点。。。。

[img]https://ft.wzznft.com/i/2026/04/09/e4iicp.jpg[/img]

99185302 · 2026-04-09 09:00

@b309f3337 跟 GPT 和 Gemini 聊过这种问题，得出的结果都差不多，后台会有一个叫”用户画像”的用户数据，模型会根据这个用户画像决定第一时间调用的算力和子模型。简单点说就是如果用户画像倾向于逻辑和推理，那模型会优先调用逻辑和推型的子模型会给到更高的算力；如果用户画像倾向于闲聊的话，就会优先调用简单的聊天子模型，只需要低算力就足够的这种。还有就是别拿这种问题去测试 AI ，你测试越多，就越会变傻，闲聊越多也会越来越傻。

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: germain

发布: 2026-04-09

点赞: 0

回复: 0