天天看點

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

愛範兒

2024-06-04 18:09釋出于廣東愛範兒官方賬号

前段時間,斯坦福大學人工智能研究院(Stanford HAI)釋出了一份報告,表示美國在大模型領域遙遙領先。報告指出,2023 年 61 個著名的人工智能模型來自美國的機構,遠遠超過歐盟的 21 個和中國的 15 個。

OpenAI 早期投資人 Vinod Khosla 去年還曾在 X 發文稱,美國的開源模型都會被中國抄襲。

然而,一直被認為在「追趕美國」的國産大模型現在卻成了被抄襲的對象,而這個抄襲的 AI 團隊,正是來自釋出上述報告的斯坦福大學。

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

斯坦福 AI 團隊主導的 Llama3-V 開源模型,被揪出涉嫌抄襲國内清華&面壁智能的開源模型「小鋼炮」MiniCPM-Llama3-V 2.5,瞬間在 AI 圈裡炸開了鍋。

在實錘之下,斯坦福團隊也不得不緊急道歉。

正如面壁智能 CEO 李大海調侃式的回應,這是一種「受到國際團隊認可的方式」。無論我們距離最頂尖的大模型還有多少差距,但國産大模型已經到了不能再被忽視的階段

簡單梳理一下時間線:

斯坦福 AI 團隊釋出 Llama3-V,号稱 SOTA 多模态大模型網友質疑該模型抄襲國内面壁智能 MiniCPM-Llama3-V2.5質疑證據湧現,Llama3-V 作者上演「删庫跑路」面壁智能官方實錘抄襲,深夜給出聲明Llama3-V 作者正式道歉,網友各持己見

抄襲面壁智能「小鋼炮」,斯坦福 AI 團隊上演「删庫跑路」

近日,一個斯坦福 AI 團隊宣布,隻需 500 美元就可訓練出一個超越 GPT-4V 的 SOTA 多模态大模型。

但很快,一位 X 使用者 @yangzhizheng1 指出,該項目使用的模型結構和代碼與面壁智能不久前釋出的 MiniCPM-Llama3-V2.5 驚人的相似。

為此,X 使用者 @yangzhizheng1 也放出了相應的質疑證據。

證據一:

Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型結構、代碼,簡直是複制粘貼級别的相似,差別大概就是換了個馬甲——變量名改了改。

就像是同一件衣服,隻是換了不同顔色的紐扣,你說巧不巧?

證據二:

Llama3-V 的作者被問到為啥能提前用上還沒釋出的 MinicPM-Llama3-V2.5 分詞器時,他們解釋稱,用的是面壁智能上一代 MinicPM-V-2 項目。

但有媒體向面壁智能官方求證,在 HuggingFace 中,MiniCPM-V2 與 MiniCPM-Llama3-V 2.5 分詞器分别是兩個檔案,檔案大小也完全不同。

更何況,MiniCPM-Llama3-V 2.5 的分詞器是用 Llama3 分詞器加上 MiniCPM-V 系列模型的特殊 token 組成。

考慮到 MiniCPM-V2 的釋出時間早于 Llama3,理論上它不可能包含尚未公開的 Llama3 分詞器技術。

證據三:

更離譜的是,llama3-V 項目的作者面對使用者的質疑,一看事情不妙,幹脆上演了一出「删庫跑路」的好戲。

連 GitHub 上的項目頁面都撤了,堪稱掩耳盜鈴 2.0 版本。

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

Hugging Face 位址如下,目前打開該頁面,我們隻能看到「404」。

https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6

這還沒完,更多證據正在不斷湧現:

X 使用者 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪聲(由單個标量參數化),出來的模型跟 Llama3-V 就像是一個模子刻出來的。

不僅如此,這模型還能識别「清華簡」這種深奧的戰國古文字,而且錯得都一模一樣,用面壁智能官方的話來說:

不僅對得一模一樣、連錯得都一模一樣。

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

要知道這一古文字資料,是面壁智能和清華大學自然語言處理實驗室團隊花費數月時間,從清華大學收藏的清華簡上逐字掃描并人工标注得來,從未對外公開過。

那斯坦福 AI 團隊是如何憑空獲得呢?

可以說,面壁智能 6 月 2 日的深夜聲明算得上是徹底實錘斯坦福 AI 研究團隊的抄襲。

直到今天淩晨,斯坦福 Llama3-V 團隊的兩位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就這一學術不端行為向面壁 MiniCPM 團隊正式道歉, 表示 Llama3-V 模型将悉數撤下。

名校學霸也抄襲?中國開源大模型正迎頭趕上

此事之是以在網絡上激起千層浪,一個重要的原因在于抄襲作者的背景實在光鮮。

公開資訊顯示,Siddharth Sharma 與 Aksh Garg 均是斯坦福大學計算機系的大學生,曾發表過多篇機器學習領域的論文。其中,Siddharth Sharma 曾在亞馬遜實習過一段時間,目前主要從事于 AI 和資料相關工作。

而 Aksh Garg 的實習履曆,那叫一個豐富,涵蓋 SpaceX、斯坦福大學和加州理工學校等知名組織機構。

至于被這上述兩位作者稱為「代碼搬運工」的 Mustafa Aljadery,是南加州大學出身,在輿論發酵之後,目前 X 賬号已經被設為隐私狀态。

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

對于這的斯坦福 Llama3-V 團隊的道歉聲明,眼尖的網友卻不吃這套。

例如,X 使用者 @xunie 指出,這哥倆将責任歸咎給一個人的甩鍋行為,莫不是「有福同享,有難你當」?

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

斯坦福 AI 實驗室主任 Christopher David Manning 也站出來譴責這一抄襲行為,并且對 MiniCPM 這一優異的中國開源模型表示贊揚。

不過,也有網友抱着「得饒人處且饒人」的态度,悠悠然地鼓勵道:

開放和誠實是科技界非常重要的價值觀,期待你的新作品。

Google DeepMind 研究員 Lucas Beyer 表示,中國開源大模型擁有像 MiniCPM 這樣好的模型,但國際上卻沒給夠應有的關注……

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

面壁智能團隊也于昨天對此事進行回應。

面壁智能 CEO 李大海表示:「技術創新不易,每一項工作都是團隊夜以繼日的奮鬥結果,也是以有限算力對全世界技術進步與創新發展作出的真誠奉獻。

我們希望團隊的好工作被更多人關注與認可,但不是以這種方式。」

斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

面壁智能首席科學家劉知遠也在知乎上發文表示,表示這次事件從另一個角度證明了中國創新成果的國際影響力,強調了開源共享的重要性,以及對原創精神的尊重。

不得不說,這出 AI 圈的抄襲大戲,教科書般地诠釋了叫「創新不易,且行且珍惜,學術誠信,人人有責」。

要知道,模仿了代碼的形,卻抄不來那份原創的風姿卓絕。

事實上,自去年以來,中國大模型如同雨後春筍般陸續開源,從以往的受益者轉變為貢獻者,不吝于向世界提供更多開源的優異成果。

上至阿裡巴巴、騰訊等巨頭,下至面壁智能,智譜 AI 、昆侖天工等 AI 初創,也都是開源社群的積極分子,為中國大模型的發展添磚加瓦。

我們也盼着,這股子開放共享的春風,能吹得更猛烈些。

正如面壁智能 CEO 李大海所呼籲的那樣,大家一起共建開放、合作、有信任的社群環境。加油合作,才能讓世界因 AGI 的到來變得更好!

檢視原圖 38K

  • 斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視
  • 斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視
  • 斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視
  • 斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視
  • 斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視
  • 斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視
  • 斯坦福團隊抄襲清華系大模型實錘,作者深夜道歉,中國大模型已經無法被忽視

繼續閱讀