文章摘要
【关 键 词】 AI检测、学术造假、顶会论文、虚假引用、科研诚信
数百项虚假引用和至少53篇顶会论文被检测出包含AI生成的幻觉引用,这一发现由AI初创公司GPTZero在扫描NeurIPS 2025年接收的4841篇论文后曝光。这些引用中,部分甚至包含虚构的作者名(如“John Smith”)或拼凑的标题,有些链接直接指向404页面。值得注意的是,这些错误引用竟然通过了至少三名专家的同行评审,暴露出当前学术评审体系的漏洞。GPTZero将这种现象称为“氛围引用”(vibe citing),即大模型通过拼凑或推导真实信息生成看似合理但实际虚假的引用内容。
这一事件对学术研究的严谨性提出了严峻挑战。学术引用是科研的基石,而虚假引用的泛滥可能导致研究者在不可靠的基础上构建理论,甚至形成“近亲繁殖”效应——AI生成的虚假内容被后续研究引用,进一步污染学术数据库。GPTZero的CEO Edward Tian强调,这是首次有记录显示幻觉引用进入顶级机器学习会议的官方文献,标志着问题的严重性升级。NeurIPS理事会的回应试图淡化影响,称1.1%的论文存在错误引用并不一定意味着论文内容无效,但这一说法难以平息对学术诚信的质疑。
问题的根源部分源于学术会议的“投稿海啸”和审稿过载。2020年至2025年间,NeurIPS的投稿量激增超过220%,达到21575篇,而审稿资源并未同步增长。审稿人难以对每篇论文及其参考文献进行深入核查,为AI幻觉的渗透提供了可乘之机。这一现象不仅限于NeurIPS,其他顶会如ICLR也面临类似挑战。ICLR已迅速采取行动,与GPTZero合作筛查虚假引用,并计划对未披露AI使用或存在虚假内容的论文直接拒稿,同时对滥用AI的审稿人实施连带惩罚。
GPTZero的检测方法基于事实对照。其工具会扫描论文全文,通过开放网络和学术数据库逐条核实引用的作者、标题、发表渠道和链接。若引用无法匹配或仅部分匹配真实来源,系统会标记为可疑。这一技术揭示了AI幻觉的“进化”:从最初级的占位符错误到更隐蔽的“半真半假”拼接,后者甚至能欺骗专家的快速浏览。GPTZero的联合创始人Alex Cui指出,这种检测需要结合工具筛选和人工复核,以平衡效率与准确性。
事件也引发了关于AI时代学术规范的讨论。ICLR提出的“不封杀AI,但必须透明”原则或将成为行业新标准。顶会可能需要通过“人机共治”重建防线,例如要求作者声明AI使用情况,或引入更先进的检测工具。Edward Tian和Alex Cui的背景——前者兼具计算机科学与新闻训练,后者专注技术研发——为GPTZero提供了独特的跨领域视角。他们的合作象征着应对AI挑战的一种路径:用技术工具捍卫真实性,同时推动制度层面的革新。
原文和模型
【原文链接】 阅读原文 [ 2937字 | 12分钟 ]
【原文作者】 新智元
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★



