技术博客
斯坦福AI团队涉嫌抄袭中国大模型,引发全球关注

斯坦福AI团队涉嫌抄袭中国大模型,引发全球关注

作者: 万维易源
2024-06-04
微博
AIchatGPT中国大模型MiniCPM-Llama3-V 2.5Llama3-V

近日,关于斯坦福大学某AI团队涉嫌抄袭中国大模型的的事件,引发了全球科技界的广泛关注。这一事件不仅让人们对AI领域的原创性和道德伦理产生了质疑,也再次将中国AI技术的实力推上了风口浪尖。

5月29日,斯坦福大学的一个AI团队推出了名为Llama3-V的多模态模型,声称其性能超越了GPT-4V、Gemini Ultra和Claude Opus,并以其500美元的训练价格在网络上引起关注。该团队的两名成员是斯坦福本科生,且有AWS、SpaceX等实习经历。凭借团队成员的斯坦福和特斯拉背景,Llama3-V迅速登上HuggingFace首页,并受到开发者关注。但随后有用户质疑Llama3-V是否抄袭了面壁智能的开源模型MiniCPM-Llama3-V 2.5。团队回应使用了MiniCPM-Llama3-V 2.5的tokenizer,但未解释如何在其发布前获取。

指控Llama3-V模型结构和配置文件与MiniCPM-Llama3-V 2.5几乎相同,只是变量名有所更改。HuggingFace页面显示,Llama3-V最初上传时直接导入了MiniCPM-V代码。然而,作者Mustafa Aljadery辩称这不构成抄袭,称Llama3-V的架构基于综合研究,并遵循Idéfics论文。他还指出MiniCPM-Llama3-V 2.5的视觉部分似乎也源自Idéfics。

李大海指出,Llama3-V模型同样采用了面壁智能团队开发的清华简识别技术,这是基于清华大学2008年收藏的战国竹简。他强调,Llama3-V展示的错误案例与MiniCPM模型完全相同,尽管这一训练数据尚未完全公开。据他所述,这项技术是团队成员经过数月努力,通过扫描和标注大量竹简文本后集成到模型中的成果。

此外,李大海还提到,在进行高斯扰动验证——一种检测模型相似性的方法——之后,两个模型在正确和错误的表现上显示出高度的一致性。这种微妙的相似性进一步强化了他对于Llama3-V与MiniCPM之间关联的看法。

事件爆发后,斯坦福大学方面表示将展开调查,并表示对学术不端行为零容忍。然而,这一事件已经在国际社会上引发了热烈讨论。有人质疑斯坦福AI团队的诚意和专业素养,认为他们涉嫌抄袭行为严重损害了学术界的声誉。同时,也有人认为这可能并非偶然,而是反映了当前AI领域竞争激烈,部分研究者为了追求成果和声誉,不惜走捷径。

值得关注的是,近年来,中国AI技术的发展速度有目共睹。从自动驾驶、语音识别到图像识别等领域,中国科研团队不断取得突破性成果,为全球AI产业发展做出了巨大贡献。在此背景下,斯坦福AI团队涉嫌抄袭中国大模型的事件,无疑给我国AI技术发展带来了一定的压力。

然而,压力就是动力。此次事件也提醒了我国科研团队,要在追求成果的同时,严守学术道德底线,保持严谨的学术态度。此外,我国政府和企业也应继续加大投入,为AI领域的研究者提供更好的创新环境和条件,激励他们勇攀科研高峰,为我国AI产业的持续发展贡献力量。

斯坦福AI团队涉嫌抄袭中国大模型的事件,不仅是一个学术争议,更是对全球AI领域学术诚信的一次考验。希望所有科研工作者和机构能够以此为鉴,加强知识产权保护意识,共同维护一个公平、诚信的科研环境。同时,也希望通过此类事件的公开讨论和处理,能够促进国际社会对知识产权保护的重视,推动AI技术的健康发展。