GoForum🌐 V2EX

谷歌号风控了,深度体验了下 k2.5。还是很垃圾啊

uuundefined · 2026-02-02 02:17 · 0 次点赞 · 1 条回复

opencode 加 kimi k2.5 。

结论,蠢得要死,逻辑推理还是稀烂。完全不理解需求,幻觉依然多,花了 4 个小时,最后我手动给他找 bug 把一个简单程序跑通了。 试了下 gemini3flash ,20 分钟自己搞定

完全是垃圾。

但是有几点好的,1 在 opencode 的依序执行时,哪怕执行出错也能中断继续,虽然慢,但是能执行完。gemini 偶尔傻掉会无限循环输出。2 比较听话,gemini 和 qwen 是很不听话的,gemini 你给他写个 rules 或者 agents.md ,里面哪怕就一句,永远用中文回复。他都不听话。claude 是最守规矩的

估摸着实际编码能力只能和 claude 3.5 haiku 比下,应该还落后御三家一年以上。 比 GLM4.7 要好,GLM4.7 最恶心的是非常经常的,没做的需求他说他做了。。。最后和他对质,他还会说,我就是忽悠你的。我没做。要气吐血。

K2.5 会坦诚接受错误,可是他真的跑多少次,简单的错误都改不好。

所以用御三家做设计,k2.5 做执行可能还马马虎虎吧。

1 条回复
gap · 2026-02-02 07:27
#1

“ 最后和他对质,他还会说,我就是忽悠你的。我没做。要气吐血。”还有这种展开,笑死 🤣

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: uuundefined
发布: 2026-02-02
点赞: 0
回复: 0