4月下旬,东北电力大学本科生任鸣羽将论文放进PaperPass做初次检测。PaperPass可以限次免费检测论文重复率、AIGC(人工智能生成)率,在高校学生中很受欢迎。

  重复率5%,通过学校毕业论文查重要求;AIGC率59.39%,超过学校30%的要求。AIGC检测报告里,大片文字被标为红色,旁边写着“高风险”,这让她非常焦虑。

  查重曾是毕业论文提交时唯一的检测要求,随着人工智能工具普及,2023年起,格子达、知网、维普陆续推出AIGC检测功能。2024年,国内高校陆续开启毕业论文“双查”——重复率和AIGC率都要达标。

  论文查重,是将论文与数据库中已有文献进行相似度比对,以此判断论文的原创性。AIGC检测,则是判断文本是否具有AI模型生成的典型特征。当两项检测并行,不少学生面临反复改写、检测,甚至花钱“降AIGC率”的循环。

  不同平台的检测结果互相打架

  面对将近60%的AIGC率,任鸣羽尝试了PaperPass平台的付费自动降重服务,每千字5元,花了85元。结果让她哭笑不得,原文“××占比50%”被改成“××占比半壁江山”。这名工科生的论文里有大量国家工程标准、专业公式和专有名词,她认为,那些看似“降AI”的改写,反而损害了学术表达的准确性。

  任鸣羽又自费到维普平台检测时,却发现AIGC率只有25%左右。

  不仅不同平台之间的检测结果会“打架”,同一家平台的检测结果也有差异。

  4月底,华中师范大学本科生杨风在某平台第一次检测论文时,AIGC率仅为10%左右。该平台更新升级后,这份相同内容的论文AIGC率飙升到了44%。但学校要求毕业论文AIGC率不能高于25%。

  社交平台上,不少网友反映同样问题:“AIGC率从15%到40%”“前两天13%,今天同一篇变成98%”。

  在杨风看来,确实有些毕业生用AI写论文,AIGC检测机制能够维护学术诚信,但这样的检测结果令她困惑。

  杨风坦言,她写论文时借助了AI整理思路和数据,但内容大部分是她逐字敲出来的。她猜测,自己的论文追求语言对仗、形式工整,常使用“其一、其二、其三”等表述,可能因此被误判为AI撰写。

  为了达到学校要求,一些高校师生开始尝试不同的应对方式。

  贵州民族大学讲师陈红敏曾发现学生论文中几处论证逻辑不够严密、文笔稚嫩,便逐字逐句改写了3段。学生在某系统检测后告诉她,这3段文字AIGC疑似占比达68%。这名从教十多年的高校教师认为,当前的AIGC检测标准不透明,检测工具存在明显的算法黑箱。

  她观察到,有些平台似乎更容易将句式严密、长难句多、专业名词集中的段落判为AIGC风险,文笔较好的学生,反而更容易“踩雷”。

  陈红敏不得不调整自己的教学指导方式。她说,原本教师指导论文,是帮助学生提高论证的严密性和学术表达能力。但面对AIGC检测压力,她只能提醒学生:定稿时不要写得太“高级”、太严密,多加主语和连词,表达口语化一些。

  她觉得这种做法很讽刺,“高等教育本来要训练学生的学术语言和严谨逻辑,现在学生却被机器指标逼着集体‘表达退化’。”

  重复率、AIGC率,两个数字互相牵绊

  卢德振是贵州民族大学研二学生。学校规定课程论文重复率不超过20%,AIGC率不超过15%。让他头疼的是,两项指标常相互牵制:降低AIGC率可能导致重复率上升,改动一句话,两个数字都可能变动。为了让两项指标都达标,他不得不反复修改、检测。

  在写一篇关于“素质教育”的论文时,他前后8次“双查”,一共做了16次检测。首次检测,某免费平台显示重复率7%、AIGC率48%。他花了两晚手工修改被标红的段落,再次检测时,原AIGC标红部分虽有减少,但新的段落又被标红,重复率升至13%。换用另一平台后,AIGC率竟跃升至64%,重复率也达到16%。

  手工修改的效果不稳定,他开始尝试平台的付费“降AIGC率”功能。处理后,报告显示AIGC率降至27%、重复率为0%;可另一个平台的检测结果显示,AIGC率高达36%,重复率为9%。

  经朋友介绍,卢德振在社交平台找了人工“降AIGC率”服务,70元,仅需10到20分钟就可以完成。他把修改后的论文放到不同平台检测,重复率为0%-17%,但AIGC率仍在合格线徘徊。

  最后,他总结出经验:由于AIGC率太不稳定,只能优先保证重复率达标。

  记者在社交平台上看到,“先查AIGC率还是先查重”“先降重还是先降AIGC率”引发网友讨论。

  杨一凝是辽宁大学研三学生,今年的毕业论文让他觉得“脱了一层皮”。

  他告诉记者,学校对“双查”要求较严,大家往往先在其他平台购买查重和AIGC检测服务。硕士研究生论文通常数万字,各大检测平台多按字符计费,“双查”一次就要一两百元。

  为了保险起见,杨一凝的毕业论文从初稿到定稿共检测十几次,还买过“人工降AIGC率服务”,总共花费800多元。这笔钱对他来说并不轻松,那两个月,他尽量减少不必要的开销,吃饭也比平时更节省。他自嘲,省下来的饭钱都拿去“喂”查重软件了。

  杨一凝的论文在多家平台做过检测,他发现,免费平台的检测结果往往偏高。

  记者发现,“降重”“降AIGC率”“AI润色”等服务开始出现,有的“降AIGC率”工具标价为每千字3元,也有商家按整篇论文报价,数万字论文收费从几十元到数百元不等。

  浙江大学光华法学院博士研究生洪涛曾在研究中指出,越来越多高校和期刊将AIGC率纳入决策,但该技术可靠性不足,用户不得不重复购买检测服务,平台由此获得巨额利润。

  AIGC检测是“算法黑箱”?

  记者联系了多家AIGC检测平台,尝试了解AIGC检测的逻辑。知网个人查重服务的人工客服向记者解释,AIGC检测系统依靠特定算法,是一个动态变化的过程,报告单具有时效性。

  格子达在线客服的自动回复列出了系统将原创内容判为“疑似AI”的原因,包括表达逻辑单一、结构过于模式化、内容太多空话套话、标点符号使用不规范等。PaperPass论文检测网曾发布文章解释检测原理,例如AIGC查重算法通过学习大量人类与AI文本,从用词、句式、逻辑连贯性等细微差异中识别AI特征。

  记者注意到,不少学术期刊编辑开始关注论文AIGC检测问题。

  今年年初,中华医学会杂志社新媒体部主任沈锡宾带团队测试了几种AIGC检测工具对医学综述摘要的识别能力。他们发现,3种中文检测工具对文本的检测一致性仅为40%-80%——这意味着不同检测工具的结果会“打架”。沈锡宾解释说,因为各检测工具的训练模式和语料不同,对同一文本会捕捉到不同的“异常”信号,进而得出不一致甚至相互矛盾的判定结果。

  此外,这3种检测工具对AI写作文本的检出率较高,但对AI润色文本的误判与漏判较为突出。沈锡宾认为,当前AIGC检测尚未建立公认的“金标准”,单一检测结果不宜直接作为学术不端判定依据。

  沈锡宾从事期刊编辑工作20多年,他发现,重复率检测有底层的数据库比照,检测结果能够溯源,但AIGC检测是一个“黑箱”。在他看来,随着AI生成能力不断提升,AI文本已经越来越接近人工写作,很难通过单纯的文字组合来判断是否存在AI代写的可能性,这也是他面对的难题。

  学术界开始接纳AI

  沈锡宾认为,AIGC检测的目的在于遏制AI代写、维护学术诚信,应定位为“辅助筛查与风险预警”,核心价值是高效筛选高疑点稿件,节省人工审稿精力。由于AI技术不断迭代,难以制定统一规则,因此更重要的是避免“一刀切”,并建立起相应的规范和审查机制。

  他告诉记者,中华医学会杂志社在AIGC检测中有一套审查逻辑,部分编辑会根据不同的论文类型设置判定阈值,当检测结果到达一定数值,编辑和编委会再进行人工判断,无法明确评判的论文还会送至外审专家处审核,并保留投稿作者的申诉权利。

  记者注意到,学术界正在尝试规范AIGC的使用边界。

  国内出台的《人工智能生成合成内容标识办法》等多项文件明确指出,科研人员不得使用AI直接生成核心研究成果。当AI被用于辅助构思、语言润色或资料整理时,人类作者必须对生成内容进行严格的真实性核验,并在论文中如实声明AI工具的信息及其使用过程。

  国际出版伦理委员会(COPE)及多家主流学术出版机构提出,作者必须公开披露AI的使用情况,并对论文内容的真实性、准确性和原创性承担责任。

  南京大学的文件提到,在征得任课老师、指导教师书面签字同意的前提下,可在辅助收集整理资料,优化语言、音视频和图表,协助处理复杂数据范围内使用生成式人工智能工具。

  让杨风感到欣喜的是,往届毕业生告诉她,如果毕业论文AIGC率高于学校的要求、但能拿出足够的证据,可以向学院和学校的相关部门申请复议,补充人工的复审评判,“这样会让我们应届毕业生更加安心”。

  (应受访者要求,任鸣羽、陈红敏、卢德振、杨一凝、杨风为化名)

实习生 李杰 朱淑雨 中青报·中青网记者 李雅娟来源:中国青年报

2026年06月10日  05版