GoForum › 🌐 V2EX

AI Agent 输出翻车这件事，我踩了 30 天才找到规律

caesor · 2026-04-02 20:14 · 0 次点赞 · 1 条回复

背景：我在用 OpenClaw 跑一套多 Agent 自动化系统，10 个左右的 AI Agent 分工协作，每天自动完成内容生成、分析、发布等任务。

运行了一段时间后，发现 Agent 输出质量极不稳定，有时候很好，有时候直接翻车（乱输出、逻辑断裂、甚至无关内容）。

花了将近一个月排查，总结出几个核心原因：

1. 上下文窗口被撑爆 Agent 的 system prompt + 历史对话 + 当前任务叠加，token 数超限后模型开始「遗忘」。前半段指令丢了，输出当然乱。

解决方案：强制 compaction ，关键指令放 system prompt 而不是 conversation ，任务结构拆分更细。

2. 指令歧义累积 同一个 Agent 执行 100 次任务，prompt 里有 5%的歧义空间，这个空间会被模型「创意性」地解读。随着时间推移，输出越来越偏。

解决方案：用「负面示例」明确边界（「不要做 X 」比「要做 Y 」更精确），定期用失败案例反向校准 prompt 。

3. 工具调用链断裂 Agent 调用外部工具失败时，如果没有明确的 fallback 指令，它可能会「脑补」一个结果继续往下走，导致下游输出基于假数据。

解决方案：强制 error 状态必须中断任务并上报，禁止 Agent 自行脑补缺失数据。

4. 多轮对话里的角色漂移 长对话里，Agent 会慢慢「忘记」自己的角色定义，开始混入其他行为模式。

解决方案：每隔 N 轮强制重注入一次角色 prompt ，不依赖模型自己记住。

目前系统稳定多了，但感觉这块还有很多可以挖的地方。

有在做 Agent 系统的朋友吗？你们遇到过哪些让人头疼的输出稳定性问题？

（更多 Agent 实战踩坑记录在公众号「 Wesley AI 日记」，微信搜索可以找到）

1 条回复

shyrock2026 · 2026-04-02 20:24

#1

用的啥模型？

添加回复

你还需要登录后发表回复