斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

AI-Agent6个月前发布 AIGCOPEN
864 0 0
斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

 

文章摘要


【关 键 词】 学术抄袭开源项目AI领域技术挑战国际认可

斯坦福大学的两名学生Aksh Garg和Siddharth Sharma因抄袭清华大学与面壁智能联合开发的MiniCPM-Llama3-V2.5多模态大模型而引起广泛关注。该事件在社交媒体上引发了广泛讨论,并得到了斯坦福大学AI实验室主任Christopher Manning的确认。他赞扬了中国大学和企业对开源项目的贡献,并对该事件表示不知情。

抄袭的证据包括:两款模型的特色功能相似,特别在于都能识别“清华简”这种罕见的古文字;Llama3-V的模型架构、代码、配置文件和分词器与V2.5基本相同;模型之间的重叠度高达87%,且在测试WebAgent时的错误也一致。这些证据表明,Llama3-V在很大程度上复制了V2.5。

在强大的舆论压力下,两名学生公开道歉,并删除了相关开源项目。他们声称自己只是负责模型的社区宣传,实际的代码作者是Mustafa Aljadery。这一说法受到了批评,因为他们在作者栏中署了自己的名字。

该事件反映出中国在AI领域面对的技术挑战,尤其是在高性能计算资源受限的背景下,依然致力于从算法和数据处理等方面提升模型性能。此外,中国的开源项目逐渐获得国际认可,表明其在大模型开发方面的实力和开源生态的潜力。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1666字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 glm-4
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...