瑕疵「天临七年」,今年毕业论文除了查重之外又多了一道关卡—— AIGC 检测。
今年以来,国内多所高校相继发布通知,要求本科毕业论文须进行 AIGC 检测,并对论文的 AIGC 率给出明确规定,把检测结果作为论文能否通过的指标。
四川大学要求文科类毕业论文AI生成内容占比不超过20%,理工医科类不超过15%;
南京工业大学要求全校毕业论文均须进行检测,标准由各学院自行制定;
广西师范大学、河北工程大学、南京航空航天大学则规定AIGC比例不得高于40%。

图片由 AI 生成
作为刚经历答辩的毕业生,那段时间可是和 AIGC 检测周旋了许久。经历了「检测—修改—再检测—再改」的痛苦循环后,终于从 61.7% 降到 0%。
这个过程之所以这么让人崩溃,是因为 AIGC 检测真的不讲武德:
有些明明是自己一个字一个字敲下的,也会被整段标红,判定为 AI 生成;在这一个平台上测出的 10%,换个平台又可能测出 100%;而哪怕是在同一个平台,同一个段落这次测是 0%,下次可能就变成 100%。
这还不是最离谱的,有网友把朱自清的散文《荷塘月色》扔给多款高校论文 AI检测工具,居然被判定为「62.88%由 AI 生成」。

这不禁让我深深怀疑,当前的 AIGC 检测和它最初的目的是否已经偏离?从更大的层面来讲,它会对我们的写作和思考方式造成怎么样的影响?
在「降 AI」的过程中,为了降低那个数字,内容好坏变成了次要的事。论文被改得七零八落、面目全非只为了证明「我不是 AI」。与此同时,我还额外支付了不少 AIGC 检测费用。
证明自己没用 AI,成为学生新的噩梦
上网一搜,发现一样被 AIGC 检测折磨的毕业生不在少数,大家都叫苦不迭。

有大学生纯手搓的论文,上传检测后 AI 率竟高达80%。而同一篇文章,不同平台查重结果竟能相差 30%。
为通过审核,学生被迫故意制造瑕疵,比如删减逻辑连接词、刻意制造语病错别字、口语化表达,为了降重不惜降低论文质量,讽刺拉满。
国外也不遑多让,23 岁的美国大学生 Burrel,在一门写作必修课的期末测试中得了 0 分,教授给出的理由,是怀疑她这篇作文是由 AI 代笔的。
「我的心跳都快停了。」 Burrel 认为,这个指控既荒谬又可怕。
Burrel 称这份模拟求职信的作业完全没依赖 AI ,她给《纽约时报》展示了 Google 文档的编辑历史记录,她表示花了整整两天时间来起草和修改这份作业。

不过全球知名查重公司 Turnitin 所提供的 AI 检测结果显示,这篇文章有 AI 写作的痕迹。
为了证明自己的清白,Burrel 向英语系主任提交了一份长达 15 页的 PDF 文件,里面包含了她写作过程中所有带时间戳的屏幕截图和笔记。最终,她的成绩被恢复了。
最终,她的成绩被恢复了。但这次经历给 Burrel 留下了不小的阴影。
在那次被指控后,当 Burrel 再次提交作业时,她上传了一段长达 93 分钟的 YouTube 视频,完整记录了她的写作全过程。

「我很害怕会因为一件自己没做过的事而影响成绩。」
Turnitin 尚未回应这一报道,但其首席产品官 Annie Chechitelli 曾在 2023 年的一篇博客文章中指出,AI 检测分数不应被用作判断学生是否滥用 AI 的唯一决定性因素。
去年开始,美国已经有一些高校学生在网上发起请愿,要求他们所在的大学停止使用类似的 AI 检测工具,随着 AI 工具的渗透,可以预见这样的矛盾将在学生和老师之间愈发频繁出现。
但实际上,现在大学生在论文和作业中使用 AI 的比例已经非常高,但这未必是一种「作弊」。

图片来自:小红书@Darer
在就业市场都要求这些应届生要掌握 AI 技能的当下,合理地使用 AI 反而应该是大学教育里要给出引导,而非与 AI 彻底切割。
搞懂 AIGC 检测的基本逻辑
AIGC 检测结果为什么总像是随机生成的?它的检测逻辑究竟是什么?毕竟只有理解它的原理,才能在「降 AI」时对症下药。
传统的论文查重主要是与已有文献数据库进行比对,查重报告会明确告诉你是哪些段落和哪篇文献重复了。
所以对于传统「降重」,前人已经摸索出一套有效的「打法」,比如改写句子结构、同义词替换、翻译成小语种再翻译回中文……总之,只要能避开与已存在文献的重复,就能过关。
但到了 「降 AI 」这里,这些已有的经验似乎都失灵了:
AIGC 检测更像一个黑箱,标准不明。目前任何一种检测手段都无法保证 100% 判定哪个是 AI 写的,哪个是人类写的。因此,检测系统通常都会给出一个 AIGC 疑似值。

虽然说这只是「疑似度范围」,系统也声明「检测结果与论文质量无关」,但一旦超过某个数值,论文就会实打实地不通过啊,让人有种无处申诉的无力感。
去年人大新闻学院副教授董晨宇也要在 AIGC 检测中被迫「自证清白」:他的研究团队的一篇耗时三年、基于真实案例撰写的关于直播产业的研究论文,却被某论文检测平台标注为「高度疑似AI生成」。

2345浏览器
火狐浏览器
谷歌浏览器