6月4日消息,近日,一起涉及斯坦福大學AI研究團隊與清華系創(chuàng)業(yè)公司面壁智能的開源模型抄襲事件在網(wǎng)絡上引起了廣泛關注。據(jù)悉,斯坦福團隊發(fā)布的Llama3-V開源模型被指控抄襲了面壁智能的“小鋼炮”MiniCPM-Llama3-V 2.5模型。

事件的起因是,5月29日,斯坦福AI團隊在網(wǎng)上宣稱只需 500 美元就可訓練出一個超越 GPT-4V 的 SOTA 多模態(tài)大模型,然而,這一聲明并未持續(xù)太久,便有細心的網(wǎng)友發(fā)現(xiàn),該團隊所發(fā)布的Llama3-V模型與面壁智能的MiniCPM模型在結構和代碼上存在著驚人的相似性,只是部分變量名有所不同。

據(jù)半導體新聞網(wǎng)了解,面壁智能團隊在6月2日深夜進一步證實了這一抄襲行為。他們發(fā)現(xiàn),斯坦福的Llama3-V模型不僅能夠識別出“清華簡”中的戰(zhàn)國古文字,而且其錯誤的識別結果竟然與自家的MiniCPM模型如出一轍。這些用于驗證的古文字數(shù)據(jù)是面壁智能團隊歷經(jīng)數(shù)月,從清華簡上逐字掃描并人工標注的珍貴資料,且從未對外公開。

面對這一嚴重的學術不端行為,斯坦福 Llama3-V 團隊的兩位作者 Siddharth Sharma 和 Aksh Garg 在社交平臺 X 上對面壁 MiniCPM 團隊就這一學術不端行為進行了正式道歉,并承諾將撤下所有 Llama3-V 模型。這并非他們首次為此事道歉,此前他們曾發(fā)布過一封類似內(nèi)容的道歉信,但很快被刪除。