GoForum🌐 V2EX

“AI 内容检测”从技术上,功能是如何实现的?

xkwdm · 2026-03-30 09:14 · 0 次点赞 · 5 条回复

用 AI 写了一篇 3000 多字的文章,中间掺了一点人工修改(大概几百字),然后拿去给几个检测工具测,结果基本都不太行。

只要稍微调整一下风格,比如句子长短不均、加点口语表达、偶尔写得没那么通顺,检测结果就会明显偏向人类写作。


AI 说了 2 种方案

1:基于语言统计特征。 比如:困惑度( perplexity );句式重复率;用词分布;连接词密度

只要让模型“写得更口语一点”,再手动改几段,这些统计特征基本就被打散了。

2:embedding + 风格一致性。 比如用 Sentence-BERT 把文章切段,算段落之间的相似度。

如果控制了写作风格(比如统一语气),这个特征也会失效。


AI 检测感觉就是“伪命题”。有没有人做过类似的东西,或者踩过坑的?

5 条回复
NoDataNoBB · 2026-03-30 09:19
#1

让 AI 检测一下

miyuki · 2026-03-30 09:29
#2

比如毕业论文现在多数学校都要求额外再查 AI 率,很搞笑了属于是,同一份论文每次结果都不一样

whoosy · 2026-03-30 09:29
#3

让 ai 去检测都比手动设计算法强

RTX440 · 2026-03-30 09:29
#4

@miyuki 用 AI 写的东西再用 AI 查重,假几把插飞机杯了一刚

106npo · 2026-03-30 09:29
#5

针对单独模型的有,有些模型有文字隐水印,其他是扯蛋。

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: xkwdm
发布: 2026-03-30
点赞: 0
回复: 0