圆海博客-探寻心灵的宁静

您现在的位置是:首页 > 博客 > 正文

博客

一模一样!斯坦福AI团队被曝抄袭中国国产大模型:直接删库跑路

2024-06-03 16:10:04博客
近日,斯坦福AI团队被曝出了抄袭事件抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。斯坦福的Llama3-V项目在5月29日发布,宣称仅需500美元就能训练出一个……

近日,斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。

斯坦福的Llama3-V项目在5月29日发布,宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Claude Opus等的多模态大模型。

然而,一位网友发现,Llama3-V的模型结构和代码与出自清华系明星创业公司面壁智能的MiniCPM-Llama3-V 2.5几乎一模一样,只是变量名有所变化。

面对抄袭的指控,斯坦福团队选择了删库跑路,目前在GitHub和HuggingFace上的相关项目均显示404,无法访问。

面壁智能的MiniCPM-Llama3-V 2.5项目具有独特的功能,如识别清华简一种罕见的中国古代文字。

Llama3-V在未公开的实验性特征上与MiniCPM-Llama3-V 2.5表现出高度相似的行为,这些特征是根据MiniCPM-Llama3-V 2.5团队内部数据训练的。

面对抄袭的质疑,斯坦福团队最初辩称,他们的工作早于面壁智能的MiniCPM,只是使用了他们的tokenizer。

然而,随后他们在Medium上的声明被删除,且最新的回应也被撤回。

面壁智能CEO李大海对此事件做出了正式回应,要求Llama3-V作者对这个问题给出一个正式的解释,目前,此事仍在持续发酵中。