您的位置 首页 科技

连DeepSeek发布的论文也被识别成AI所写?AI率检测,坑惨毕业生

出品|搜狐科技作者|常博硕编辑|杨锦又是一年毕业季,伴随着盛夏的蝉鸣和对未来的憧憬,毕业生们迎来了自己大学生涯的最后一课——毕业论文。然而,随着人工智能应用的普及,原本应该作为学术助手而存在的AI今年却给毕业生带来了新的挑战。

出品|搜狐科技

作者|常博硕

编辑|杨锦

又是一年毕业季,伴随着盛夏的蝉鸣和对未来的憧憬,毕业生们迎来了自己大学生涯的最后一课——毕业论文。然而,随着人工智能应用的普及,原本应该作为学术助手而存在的AI今年却给毕业生带来了新的挑战。

为遏制学术不端,多所高校出台规定,除了一直以来要求的常规查重要求之外,还对毕业论文中的人工智能生成内容比例提出严格要求。

天津科技大学、广东医科大学要求学生的毕业论文AIGC检测结果不超过40%,江西师范大学规定AIGC率30%以上的论文将通报学院督促整改,四川大学教务处在2025届本科毕业生论文学术不端行为检测工作的通知中要求,文科类毕业论文AI生成内容占比不超过20%,理工医科类毕业论文不能超过15%,还有大学直接将论文AIGC率作为硬性指标,与毕业论文能否通过挂钩。

在知网,连DeepSeek的论文也难幸免

AIGC检测也就是我们说的AI率检测,其实是指用论文查重工具对论文里人工智能生成内容的检测,不少学校将其作为鉴别论文原创性的指标之一。在这场对AI生成内容的围剿背后,一个无法忽视的问题一直牵动着不少毕业生的心——目前论文查重工具所提供的AIGC检测率结果到底是不是准确的?

有北京语言大学学生对搜狐科技表示,“有时候自己写的内容也会被识别成AI写的,要把话改成不是人话才行。”

遇到这一问题的学生并不是少数,有毕业生表示担忧,虽然明知检测结果错误,但为了能按时毕业,自己不得不反复修改自己的原创内容,最后原本逻辑严谨的论文被改得像聊天,甚至要删掉一些精彩的段落。

此前有大河报记者进行试验,将朱自清的名篇《荷塘月色》与刘慈欣《流浪地球》的片段上传至某常用论文检测系统。结果显示,两篇经典作品的AI生成内容疑似度竟分别达到62.88%与52.88%。此前还有网友发帖称《滕王阁序》AI率达到100%,戏称应该取消王勃“进士”学位。

展开全文

就AI检测系统的原理搜狐科技采访多位业内人士,有大厂算法从业者猜测:“目前AI检测工具的技术可能是用较小的模型测算文本的困惑度和波动,因为机器生成的句式往往起伏比较小,同时工具还可能和文本库中的AI论文进行高频词、连接词等进行比对,这种检测的本质是概率检索。”

就此问题,搜狐科技进一步采访到中国人民大学高瓴人工智能学院教授卢志武。

卢志武对于目前论文检测工具将朱自清的名篇《荷塘月色》的AI率标记为62.88%这一事件表示震惊,“如果是大模型,应该不会有这么大的失误。”

谈到目前查重工具的技术路线,卢志武向搜狐科技解释道:“查重的逻辑是这样,先把论文全部入库,把我们的论文和库里的论文进行比对就能得出重复率。AI率的判断我认为应该是使用了人工智能的技术,虽然不能说百分百准确,但出现这种严重的失误至少证明技术并没有收敛,这些公司的技术可能也不是那么厉害。”

“如果让我来做这件事,我会用大模型来做,因为传统的统计方法太麻烦了,目前大模型的能力已经很强了。”

谈及更细节的技术路线,卢志武进一步表示:“按照正规的训练流程应该先收集正样本与负样本,正样本是AI生成的且被模型检测为AI生成的数据,负样本是人写的但被识别成AI生成的数据,两类数据大模型都要去学习,按照目前的大模型的学习能力至少准确率不会像现在看到的这么低。这些模型有没有收集到足够的正负样本去训练,这个事情就存疑了,但我想再过一年半年应该不会像现在这么惨了。”

谈及目前的AI率检测工具的评价,卢志武直言不讳:“至少从你描述的结果来看,我觉得技术不成熟,至少不够好。出现这种结果,我甚至怀疑现在的产品是不是用大模型做的,从目前的结果来看更像是规则或比对出的结果。论文的事情太复杂了,如果是这样做的,那可能就不太靠谱了。”

为了验证市面上论文检测工具的效果,搜狐科技也选取了一篇论文,同时用三种市面上常见的论文查重工具检测分别检测了该篇论文的AI率。

本次选取的论文是DeepSeek公司在今年1月发布的名为《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》的论文,论文通过详细的实验和分析,展示了如何通过强化学习提升LLMs的推理能力,并通过知识蒸馏将这些能力传递给小型模型,为未来开发更智能、更高效的LLMs提供了重要的参考和启示。论文一经发布就广受关注,也受到业内人士诸多好评。

搜狐科技将该篇论文分别提交至知网、维普以及免费论文查重工具Paper YY进行AI率检测,三种工具所测得结果相差较大。

知网检测该篇论文的AI特征值为31.9%。

连DeepSeek发布的论文也被识别成AI所写?AI率检测,坑惨毕业生

维普则认为该论文全文AIGC生成率达到57.62%。

连DeepSeek发布的论文也被识别成AI所写?AI率检测,坑惨毕业生

Paper YY的结果是三者中最低的,AI率为16.2%。

连DeepSeek发布的论文也被识别成AI所写?AI率检测,坑惨毕业生

由此来看,不同检测工具之间存在的差异较大,也侧面反映出当前市面存在的AI检测工具技术的不成熟。

搜狐科技通过进一步比对发现,同样的内容,不同工具之间的检测也存在判定差异。例如,针对本篇论文中的同一段落,知网判定为原创,而维普则判定为AI生成。

连DeepSeek发布的论文也被识别成AI所写?AI率检测,坑惨毕业生知网检测结果

连DeepSeek发布的论文也被识别成AI所写?AI率检测,坑惨毕业生维普检测结果

由此可见,AI生成内容检测技术仍有很长的路要走。

论文AI率检测,坑惨毕业生

除了关于论文检测是否准确的争议之外,让学生们叫苦连天的是高昂的论文检测和“降AI率”费用。

搜狐科技调查发现,所有论文检测平台都同时推出“论文降重”“论文降AI率”服务,此种服务往往根据论文字数收费,一篇论文收费可达到几百甚至千元,对于学生来说可谓“天价”,几次检测加上降重服务下来,生活费就所剩无几。

不少同学为了降低AI率,按时毕业,不得不忍痛选择“花钱买安心”。但面对官方平台高昂的是错成本,不少同学开始在淘宝、小红书等平台寻找私人商家购买相关服务。

搜狐科技也咨询了电商平台称提供降AI率服务的商家,针对论文降重或降AI率的技术,商家们往往含糊其辞,只透露说是“人工修改”或留下一句“不满意包退款”后就再无回音。

有同学向搜狐科技表示,有商家修改后的论文语句质量明显下降,甚至很多句意都被改变了。由于缺乏统一的标准,目前论文服务市场混乱,售后也难以保证,不少学生因此叫苦不迭。

华南理工大学经济与金融学院雷玉桃教授向搜狐科技坦言:“目前华南理工大学的本科和研究生论文均未要求使用AIGC检测。部分平台这种一边收费检测AI率一边兜售降AI率服务,形成了灰色产业链。”

更有业内人士表示,在还没有出现成熟统一检测系统的时候,不应该风风火火出来收割学生,现在明显就是大家谁都没有成熟准确的算法,都存在误判。

目前国内高校针对毕业论文AI率检测主要有以下几种态度:

1. 管控边界型

比如复旦大学,明确规定禁止用AI生成数据、图标和结论,但允许使用AI进行文献检索等辅助工作。

2. 严格划定论文AIGC率

比如上述提到的一些学校,对有严格的AIGC率要求,以此鼓励学生原创精神,但也催生了一些问题。

3. 披露导向

比如中国传媒大学,要求学生披露AI使用细节,比如使用的模型版本和使用方式等,涉及事实和观点引证的辅助生成内容需在论文相应位置进行标注,确保真实性和尊重他人知识产权。

在谈及AI辅助学术创作的话题时,多位教授都表示,自己支持学生借助AI来辅助学习和论文润色,但不能泯灭自己的原创精神。

卢志武教授表示:“其实学生用没用AI,我基本都能看出来,有些英文单词我都写不出来……但是用来润色语言我其实是可以接受的,论文最重要的还是想法是不是足够创新。现在借助大模型,国内作者投英文论文也不吃亏了,补足语言的缺陷后反而更能让学生把注意力放在学术想法本身。”

浙江工商大学经济学院教授李井奎也向搜狐科技同样表示:“博士论文可以借助AI来做,重点是让AI参与而不是抄袭AI。而且实际上来说,有创新性的东西,AI做得并不好。”

每一次的技术进步与革新都不免催生新的挑战,如何划定AI参与学术的范围是当下高校与教育工作者们需要解决的重要课题。毕业论文AI率的要求,反应了社会与高校对于学术诚信的高度关注,也揭示了AI生成内容检测技术目前仍然缺陷。随着AI的不断迭代,需要在探索中不断调整,构建更为科学、全面的学术评价体系。

本文来自网络,不代表冰河马新闻网立场,转载请注明出处:http://lbrv.cn/31337.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部