斯坦福抄袭清华、面壁智能大模型，当事人已道歉、删项目

AI-Agent2年前 (2024)发布 AIGCOPEN

3,750 0 0

文章摘要

斯坦福大学的两名学生Aksh Garg和Siddharth Sharma因抄袭清华大学与面壁智能联合开发的MiniCPM-Llama3-V2.5多模态大模型而引起广泛关注。该事件在社交媒体上引发了广泛讨论，并得到了斯坦福大学AI实验室主任Christopher Manning的确认。他赞扬了中国大学和企业对开源项目的贡献，并对该事件表示不知情。

抄袭的证据包括：两款模型的特色功能相似，特别在于都能识别“清华简”这种罕见的古文字；Llama3-V的模型架构、代码、配置文件和分词器与V2.5基本相同；模型之间的重叠度高达87%，且在测试WebAgent时的错误也一致。这些证据表明，Llama3-V在很大程度上复制了V2.5。

在强大的舆论压力下，两名学生公开道歉，并删除了相关开源项目。他们声称自己只是负责模型的社区宣传，实际的代码作者是Mustafa Aljadery。这一说法受到了批评，因为他们在作者栏中署了自己的名字。

该事件反映出中国在AI领域面对的技术挑战，尤其是在高性能计算资源受限的背景下，依然致力于从算法和数据处理等方面提升模型性能。此外，中国的开源项目逐渐获得国际认可，表明其在大模型开发方面的实力和开源生态的潜力。