GoForum › 🌐 V2EX

记录下我感觉的 AI 模型的几个「里程碑」

SingeeKing · 2026-02-13 14:32 · 0 次点赞 · 2 条回复

纯个人感受，十分主观

gpt-3.5/4：不用多说，开启了 LLM 的时代

gpt-4o：真正的统一多模态（好像也是至今唯一真正做到文字、语音、图片合一的？ OpenAI 的新模型不是、其它厂商好像也没有）

o1/o3 & DeepResearch：开启了模型思考的时代

Claude Sonnet 3.7 & Claude Code：开启了 AI 编程的时代

Claude Opus 4：我个人感觉 AI 可以开始写程序了（之前的模型虽然也能写，但是效果实在一言难尽，这个版本我感觉是对我而言第一个我可以真的开始日常用 AI 写程序的模型）

gpt-5.2：我感觉终于可以依赖 AI 写代码了（我不再需要逐行审阅 AI 写的代码，而是可以默认信任它、只需要做整体架构、找 bug ）

还有几个值得一说的

o1 开始，模型可以在思考时调用工具；而其他家支持思考时调用工具似乎晚了很久
Claude Code 的 Plan 模式完全模拟了日常「先调研、再开发」的思路，也算是开创了一个先河
虽然我现在日常用的 gpt-5.3-codex ，但我并没有觉得它相比 gpt-5.2 有多好，更多的还是提升了速度；而且细节上我感觉 gpt-5.2-codex 和 gpt-5.3-codex 都没有 gpt-5.2 处理的好，所以对于某些复杂的模块我还是会让 gpt-5.2 做一次 Code Review
昨晚刚发布的 gpt-5.3-codex-spark ，怎么说呢，我感觉更像是 gpt-5.1-codex-mini 的升级版（效果 & 速度的双重提升），实际效果目前我并没有觉得有多好，我也仅仅是测试了下、仍然在继续用 gpt-5.3-codex （不过官方说了 spark 是独立速率限制，所以或许等我这周用量用完了会去再着重用用它
作为 Google AI Pro 会员，Gemini 的各种模型我也都给过机会，我对它的评价就是 —— 除了便宜一无是处
我个人没有使用过任何国产模型，所以不做任何相关评价

2 条回复

LxExExl · 2026-02-13 14:42

#1

差不多，我也觉得 Claude code 是真的好用，基本不需要反复质疑了。

labubu · 2026-02-13 15:07

#2

opus > gemini 3 pro

添加回复

你还需要登录后发表回复