斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視
愛範兒
2024-06-04 18:09釋出于廣東愛範兒官方賬号
前段時間,斯坦福大學人工智能研究院(Stanford HAI)釋出了一份報告,表示美國在大模型領域遙遙領先。報告指出,2023 年 61 個著名的人工智能模型來自美國的機構,遠遠超過歐盟的 21 個和中國的 15 個。
OpenAI 早期投資人 Vinod Khosla 去年還曾在 X 發文稱,美國的開源模型都會被中國抄襲。
然而,一直被認為在「追趕美國」的國産大模型現在卻成了被抄襲的對象,而這個抄襲的 AI 團隊,正是來自釋出上述報告的斯坦福大學。
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLiEDN28CXBFENSFEaJNkao1mTtATNLdWMJVlVh1SMYNlZRNDNI1mNn1CVuhlbvRzXG5EW480LcRnYf12bvwVbvNmLn1Wa0dmLzdXZul2Lc9CX6MHc0RHaiojIsJye.jpg)
斯坦福 AI 團隊主導的 Llama3-V 開源模型,被揪出涉嫌抄襲國内清華&面壁智能的開源模型「小鋼炮」MiniCPM-Llama3-V 2.5,瞬間在 AI 圈裡炸開了鍋。
在實錘之下,斯坦福團隊也不得不緊急道歉。
正如面壁智能 CEO 李大海調侃式的回應,這是一種「受到國際團隊認可的方式」。無論我們距離最頂尖的大模型還有多少差距,但國産大模型已經到了不能再被忽視的階段
簡單梳理一下時間線:
斯坦福 AI 團隊釋出 Llama3-V,号稱 SOTA 多模态大模型網友質疑該模型抄襲國内面壁智能 MiniCPM-Llama3-V2.5質疑證據湧現,Llama3-V 作者上演「删庫跑路」面壁智能官方實錘抄襲,深夜給出聲明Llama3-V 作者正式道歉,網友各持己見
抄襲面壁智能「小鋼炮」,斯坦福 AI 團隊上演「删庫跑路」
近日,一個斯坦福 AI 團隊宣布,隻需 500 美元就可訓練出一個超越 GPT-4V 的 SOTA 多模态大模型。
但很快,一位 X 使用者 @yangzhizheng1 指出,該項目使用的模型結構和代碼與面壁智能不久前釋出的 MiniCPM-Llama3-V2.5 驚人的相似。
為此,X 使用者 @yangzhizheng1 也放出了相應的質疑證據。
證據一:
Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型結構、代碼,簡直是複制粘貼級别的相似,差別大概就是換了個馬甲——變量名改了改。
就像是同一件衣服,隻是換了不同顔色的紐扣,你說巧不巧?
證據二:
Llama3-V 的作者被問到為啥能提前用上還沒釋出的 MinicPM-Llama3-V2.5 分詞器時,他們解釋稱,用的是面壁智能上一代 MinicPM-V-2 項目。
但有媒體向面壁智能官方求證,在 HuggingFace 中,MiniCPM-V2 與 MiniCPM-Llama3-V 2.5 分詞器分别是兩個檔案,檔案大小也完全不同。
更何況,MiniCPM-Llama3-V 2.5 的分詞器是用 Llama3 分詞器加上 MiniCPM-V 系列模型的特殊 token 組成。
考慮到 MiniCPM-V2 的釋出時間早于 Llama3,理論上它不可能包含尚未公開的 Llama3 分詞器技術。
證據三:
更離譜的是,llama3-V 項目的作者面對使用者的質疑,一看事情不妙,幹脆上演了一出「删庫跑路」的好戲。
連 GitHub 上的項目頁面都撤了,堪稱掩耳盜鈴 2.0 版本。
Hugging Face 位址如下,目前打開該頁面,我們隻能看到「404」。
https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6
這還沒完,更多證據正在不斷湧現:
X 使用者 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪聲(由單個标量參數化),出來的模型跟 Llama3-V 就像是一個模子刻出來的。
不僅如此,這模型還能識别「清華簡」這種深奧的戰國古文字,而且錯得都一模一樣,用面壁智能官方的話來說:
不僅對得一模一樣、連錯得都一模一樣。
要知道這一古文字資料,是面壁智能和清華大學自然語言處理實驗室團隊花費數月時間,從清華大學收藏的清華簡上逐字掃描并人工标注得來,從未對外公開過。
那斯坦福 AI 團隊是如何憑空獲得呢?
可以說,面壁智能 6 月 2 日的深夜聲明算得上是徹底實錘斯坦福 AI 研究團隊的抄襲。
直到今天淩晨,斯坦福 Llama3-V 團隊的兩位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就這一學術不端行為向面壁 MiniCPM 團隊正式道歉, 表示 Llama3-V 模型将悉數撤下。
名校學霸也抄襲?中國開源大模型正迎頭趕上
此事之是以在網絡上激起千層浪,一個重要的原因在于抄襲作者的背景實在光鮮。
公開資訊顯示,Siddharth Sharma 與 Aksh Garg 均是斯坦福大學計算機系的大學生,曾發表過多篇機器學習領域的論文。其中,Siddharth Sharma 曾在亞馬遜實習過一段時間,目前主要從事于 AI 和資料相關工作。
而 Aksh Garg 的實習履曆,那叫一個豐富,涵蓋 SpaceX、斯坦福大學和加州理工學校等知名組織機構。
至于被這上述兩位作者稱為「代碼搬運工」的 Mustafa Aljadery,是南加州大學出身,在輿論發酵之後,目前 X 賬号已經被設為隐私狀态。
對于這的斯坦福 Llama3-V 團隊的道歉聲明,眼尖的網友卻不吃這套。
例如,X 使用者 @xunie 指出,這哥倆将責任歸咎給一個人的甩鍋行為,莫不是「有福同享,有難你當」?
斯坦福 AI 實驗室主任 Christopher David Manning 也站出來譴責這一抄襲行為,并且對 MiniCPM 這一優異的中國開源模型表示贊揚。
不過,也有網友抱着「得饒人處且饒人」的态度,悠悠然地鼓勵道:
開放和誠實是科技界非常重要的價值觀,期待你的新作品。
Google DeepMind 研究員 Lucas Beyer 表示,中國開源大模型擁有像 MiniCPM 這樣好的模型,但國際上卻沒給夠應有的關注……
面壁智能團隊也于昨天對此事進行回應。
面壁智能 CEO 李大海表示:「技術創新不易,每一項工作都是團隊夜以繼日的奮鬥結果,也是以有限算力對全世界技術進步與創新發展作出的真誠奉獻。
我們希望團隊的好工作被更多人關注與認可,但不是以這種方式。」
面壁智能首席科學家劉知遠也在知乎上發文表示,表示這次事件從另一個角度證明了中國創新成果的國際影響力,強調了開源共享的重要性,以及對原創精神的尊重。
不得不說,這出 AI 圈的抄襲大戲,教科書般地诠釋了叫「創新不易,且行且珍惜,學術誠信,人人有責」。
要知道,模仿了代碼的形,卻抄不來那份原創的風姿卓絕。
事實上,自去年以來,中國大模型如同雨後春筍般陸續開源,從以往的受益者轉變為貢獻者,不吝于向世界提供更多開源的優異成果。
上至阿裡巴巴、騰訊等巨頭,下至面壁智能,智譜 AI 、昆侖天工等 AI 初創,也都是開源社群的積極分子,為中國大模型的發展添磚加瓦。
我們也盼着,這股子開放共享的春風,能吹得更猛烈些。
正如面壁智能 CEO 李大海所呼籲的那樣,大家一起共建開放、合作、有信任的社群環境。加油合作,才能讓世界因 AGI 的到來變得更好!
檢視原圖 38K
-
斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視 -
斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視 -
斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視 -
斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視 -
斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視 -
斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視 -
斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視