GoForum › 🌐 V2EX
“AI 内容检测”从技术上,功能是如何实现的?
xkwdm ·
2026-03-30 09:14 ·
0 次点赞 · 5 条回复
用 AI 写了一篇 3000 多字的文章,中间掺了一点人工修改(大概几百字),然后拿去给几个检测工具测,结果基本都不太行。
只要稍微调整一下风格,比如句子长短不均、加点口语表达、偶尔写得没那么通顺,检测结果就会明显偏向人类写作。
AI 说了 2 种方案
1:基于语言统计特征。 比如:困惑度( perplexity );句式重复率;用词分布;连接词密度
只要让模型“写得更口语一点”,再手动改几段,这些统计特征基本就被打散了。
2:embedding + 风格一致性。 比如用 Sentence-BERT 把文章切段,算段落之间的相似度。
如果控制了写作风格(比如统一语气),这个特征也会失效。
AI 检测感觉就是“伪命题”。有没有人做过类似的东西,或者踩过坑的?
5 条回复
添加回复
你还需要 登录
后发表回复
让 AI 检测一下