GoForum🌐 V2EX

Claude Opus 似乎是官方降智了,洗车题失败

germain · 2026-04-09 08:00 · 0 次点赞 · 5 条回复
5 条回复
b309f3337 · 2026-04-09 08:30
#1

我最近也发感觉 opus 4.5 好像有点变傻了,以前让它做的很多功能一次性就能解决了,甚至超出我的预料,最近好几次也不算是很复杂的问题,来回好几次都搞不定

murmur · 2026-04-09 08:35
#2

这题我见过攻击性最强的回答是米哈游那个 AI ,直接扛着车去

germain · 2026-04-09 08:45
#3

@b309f3337 甚至有几个 Opus 没能干净解决的历史问题我用免费的 qwen3.6 plus 搞定了,这几天 Claude 问题一堆,还有很多 billing 相关的问题他们的那个 fin bot 无法解决,说让我等真人 email 联系,都一周过去了,音讯全无

@murmur 这题是快速验证模型真正算力的最简单方法了,不过这扛过去的模型我是不大敢用,怕闪着钱包

jchencode · 2026-04-09 08:55
#4

Opus 确实降智了,应该是跟新出的 Glasswing 有关系,Glasswing 吃掉了很多算力。

而且,Glasswing 模型推理能力比 Opus 高出几十个百分点。。。。

[img]https://ft.wzznft.com/i/2026/04/09/e4iicp.jpg[/img]

99185302 · 2026-04-09 09:00
#5

@b309f3337 跟 GPT 和 Gemini 聊过这种问题,得出的结果都差不多,后台会有一个叫”用户画像”的用户数据,模型会根据这个用户画像决定第一时间调用的算力和子模型。简单点说就是如果用户画像倾向于逻辑和推理,那模型会优先调用逻辑和推型的子模型会给到更高的算力;如果用户画像倾向于闲聊的话,就会优先调用简单的聊天子模型,只需要低算力就足够的这种。还有就是别拿这种问题去测试 AI ,你测试越多,就越会变傻,闲聊越多也会越来越傻。

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: germain
发布: 2026-04-09
点赞: 0
回复: 0