GoForum › 🌐 V2EX

“AI 内容检测”从技术上，功能是如何实现的？

xkwdm · 2026-03-30 09:14 · 0 次点赞 · 5 条回复

用 AI 写了一篇 3000 多字的文章，中间掺了一点人工修改（大概几百字），然后拿去给几个检测工具测，结果基本都不太行。

只要稍微调整一下风格，比如句子长短不均、加点口语表达、偶尔写得没那么通顺，检测结果就会明显偏向人类写作。

AI 说了 2 种方案

1：基于语言统计特征。比如：困惑度（ perplexity ）；句式重复率；用词分布；连接词密度

只要让模型“写得更口语一点”，再手动改几段，这些统计特征基本就被打散了。

2：embedding + 风格一致性。比如用 Sentence-BERT 把文章切段，算段落之间的相似度。

如果控制了写作风格（比如统一语气），这个特征也会失效。

AI 检测感觉就是“伪命题”。有没有人做过类似的东西，或者踩过坑的？

5 条回复

NoDataNoBB · 2026-03-30 09:19

让 AI 检测一下

miyuki · 2026-03-30 09:29

比如毕业论文现在多数学校都要求额外再查 AI 率，很搞笑了属于是，同一份论文每次结果都不一样

whoosy · 2026-03-30 09:29

让 ai 去检测都比手动设计算法强

RTX440 · 2026-03-30 09:29

@miyuki 用 AI 写的东西再用 AI 查重，假几把插飞机杯了一刚

106npo · 2026-03-30 09:29

针对单独模型的有，有些模型有文字隐水印，其他是扯蛋。

添加回复

你还需要登录后发表回复

登录后可发帖和回复

登录注册

主题信息

作者: xkwdm

发布: 2026-03-30

点赞: 0

回复: 0