斯坦福抄袭清华系大模型实锤!主创团队二人道歉一人“失联
斯坦福一AI团队的Llama3-V“套壳”抄袭清华开元模型MiniCPM的行为在持续四天的发酵和讨论后终于落下了帷幕,斯坦福抄袭团队的三位主创中的两位发布了各自的道歉声明,其中还有一名主创关闭了社交账号,对事件并未有任何回应。
这场关乎两个世界名校的骂战从5月29日开始,斯坦福一AI研究团队在X上宣布,他们开发了一款AI模型,只需要花费500美元就可以训练一个SOTA多模态大型模型,甚至比GPT-4V、GeminiUltra和ClaudeOpus更强。
但是在Github上有网友发现,这个AI模型与清华系明星AI公司面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V2.5几乎相差无几。
在爆料帖中,网友指出模型结构、代码和配置文件完全相同,只有变量名称发生了变化。同时网友还列举了许多具体细节的代码“相似处”,并且说明之前给Llama3-V的作者留言之后,作者居然将所有数据库清空后跑路了。这些证据其实足以证明斯坦福的AI程序是源于MiniCPM-Llama3-V2.5。
但是随着网友们研究的深入,越来越多实锤证据浮出水面,其中非常关键的一点是,二者居然都具有“清华竹简“的识别能力。
这也是MiniCPM-Llama3-V2.5的独特功能之一,“清华竹简”是战国时期用竹子书写的一种非常罕见的古代中国文字。其训练图像是是从最近出土的文物中扫描得到的,并由MiniCPM-Llama3-V2.5团队进行了注释,但尚未公开发布。
但是Llama3-V的识别性能MiniCPM-Llama3-V2.5却惊人“相似”,甚至是,对也对得一样,错也错得一样。
最终,也就是今天凌晨,该团队中的两名主要角色SiddharthSharma悉达多和AkshGarg阿克什在X上发布了他们的道歉声明,并且撤下了所有有关Llama3-V的已发布内容。
团队之中还有一人是来自南加州大学的MustafaAljadery穆斯塔法,他被指出是整个项目的发起者,并且在前期主要在GitHub上反驳网友的言论,但是此时却已经将X账号设置为隐藏,仿佛人间蒸发。
除此之外,斯坦福大学的AI实验室副主任ChristopherManning克里斯托弗直言不讳地表达了对该团队的批判,指责该团队“为什么不承认自己的错误”,并且指出,清华大语言模型开发团队是很优秀的开源代码工作者,为世界科学技术进步提供了莫大的帮助。
至此,这件由东西方两个顶尖科技类院校的抄袭疑云案件也是画上了一个句点。面壁智能MiniCPM-Llama3-V2.5创始公司CEO李大海也在朋友圈发文回应,“技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展做出的真诚奉献。我们希望团队的好工作可以被更多人关注,但不是以这种方式。“