连DeepSeek发布的论文也被识别成AI所写？AI率检测，坑惨毕业生

出品｜搜狐科技

作者｜常博硕

编辑｜杨锦

又是一年毕业季，伴随着盛夏的蝉鸣和对未来的憧憬，毕业生们迎来了自己大学生涯的最后一课——毕业论文。然而，随着人工智能应用的普及，原本应该作为学术助手而存在的AI今年却给毕业生带来了新的挑战。

为遏制学术不端，多所高校出台规定，除了一直以来要求的常规查重要求之外，还对毕业论文中的人工智能生成内容比例提出严格要求。

天津科技大学、广东医科大学要求学生的毕业论文AIGC检测结果不超过40%，江西师范大学规定AIGC率30%以上的论文将通报学院督促整改，四川大学教务处在2025届本科毕业生论文学术不端行为检测工作的通知中要求，文科类毕业论文AI生成内容占比不超过20%，理工医科类毕业论文不能超过15%，还有大学直接将论文AIGC率作为硬性指标，与毕业论文能否通过挂钩。

在知网，连DeepSeek的论文也难幸免

AIGC检测也就是我们说的AI率检测，其实是指用论文查重工具对论文里人工智能生成内容的检测，不少学校将其作为鉴别论文原创性的指标之一。在这场对AI生成内容的围剿背后，一个无法忽视的问题一直牵动着不少毕业生的心——目前论文查重工具所提供的AIGC检测率结果到底是不是准确的？

有北京语言大学学生对搜狐科技表示，“有时候自己写的内容也会被识别成AI写的，要把话改成不是人话才行。”

遇到这一问题的学生并不是少数，有毕业生表示担忧，虽然明知检测结果错误，但为了能按时毕业，自己不得不反复修改自己的原创内容，最后原本逻辑严谨的论文被改得像聊天，甚至要删掉一些精彩的段落。

此前有大河报记者进行试验，将朱自清的名篇《荷塘月色》与刘慈欣《流浪地球》的片段上传至某常用论文检测系统。结果显示，两篇经典作品的AI生成内容疑似度竟分别达到62.88%与52.88%。此前还有网友发帖称《滕王阁序》AI率达到100%，戏称应该取消王勃“进士”学位。

展开全文

就AI检测系统的原理搜狐科技采访多位业内人士，有大厂算法从业者猜测：“目前AI检测工具的技术可能是用较小的模型测算文本的困惑度和波动，因为机器生成的句式往往起伏比较小，同时工具还可能和文本库中的AI论文进行高频词、连接词等进行比对，这种检测的本质是概率检索。”

就此问题，搜狐科技进一步采访到中国人民大学高瓴人工智能学院教授卢志武。

卢志武对于目前论文检测工具将朱自清的名篇《荷塘月色》的AI率标记为62.88%这一事件表示震惊，“如果是大模型，应该不会有这么大的失误。”

谈到目前查重工具的技术路线，卢志武向搜狐科技解释道：“查重的逻辑是这样，先把论文全部入库，把我们的论文和库里的论文进行比对就能得出重复率。AI率的判断我认为应该是使用了人工智能的技术，虽然不能说百分百准确，但出现这种严重的失误至少证明技术并没有收敛，这些公司的技术可能也不是那么厉害。”

“如果让我来做这件事，我会用大模型来做，因为传统的统计方法太麻烦了，目前大模型的能力已经很强了。”

谈及更细节的技术路线，卢志武进一步表示：“按照正规的训练流程应该先收集正样本与负样本，正样本是AI生成的且被模型检测为AI生成的数据，负样本是人写的但被识别成AI生成的数据，两类数据大模型都要去学习，按照目前的大模型的学习能力至少准确率不会像现在看到的这么低。这些模型有没有收集到足够的正负样本去训练，这个事情就存疑了，但我想再过一年半年应该不会像现在这么惨了。”

谈及目前的AI率检测工具的评价，卢志武直言不讳：“至少从你描述的结果来看，我觉得技术不成熟，至少不够好。出现这种结果，我甚至怀疑现在的产品是不是用大模型做的，从目前的结果来看更像是规则或比对出的结果。论文的事情太复杂了，如果是这样做的，那可能就不太靠谱了。”

为了验证市面上论文检测工具的效果，搜狐科技也选取了一篇论文，同时用三种市面上常见的论文查重工具检测分别检测了该篇论文的AI率。

本次选取的论文是DeepSeek公司在今年1月发布的名为《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》的论文，论文通过详细的实验和分析，展示了如何通过强化学习提升LLMs的推理能力，并通过知识蒸馏将这些能力传递给小型模型，为未来开发更智能、更高效的LLMs提供了重要的参考和启示。论文一经发布就广受关注，也受到业内人士诸多好评。

搜狐科技将该篇论文分别提交至知网、维普以及免费论文查重工具Paper YY进行AI率检测，三种工具所测得结果相差较大。

知网检测该篇论文的AI特征值为31.9%。

连DeepSeek发布的论文也被识别成AI所写？AI率检测，坑惨毕业生