斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視

愛範兒

2024-06-04 18:09釋出于廣東愛範兒官方賬号

前段時間，斯坦福大學人工智能研究院（Stanford HAI）釋出了一份報告，表示美國在大模型領域遙遙領先。報告指出，2023 年 61 個著名的人工智能模型來自美國的機構，遠遠超過歐盟的 21 個和中國的 15 個。

OpenAI 早期投資人 Vinod Khosla 去年還曾在 X 發文稱，美國的開源模型都會被中國抄襲。

然而，一直被認為在「追趕美國」的國産大模型現在卻成了被抄襲的對象，而這個抄襲的 AI 團隊，正是來自釋出上述報告的斯坦福大學。

斯坦福 AI 團隊主導的 Llama3-V 開源模型，被揪出涉嫌抄襲國内清華&面壁智能的開源模型「小鋼炮」MiniCPM-Llama3-V 2.5，瞬間在 AI 圈裡炸開了鍋。

在實錘之下，斯坦福團隊也不得不緊急道歉。

正如面壁智能 CEO 李大海調侃式的回應，這是一種「受到國際團隊認可的方式」。無論我們距離最頂尖的大模型還有多少差距，但國産大模型已經到了不能再被忽視的階段

簡單梳理一下時間線：

斯坦福 AI 團隊釋出 Llama3-V，号稱 SOTA 多模态大模型網友質疑該模型抄襲國内面壁智能 MiniCPM-Llama3-V2.5質疑證據湧現，Llama3-V 作者上演「删庫跑路」面壁智能官方實錘抄襲，深夜給出聲明Llama3-V 作者正式道歉，網友各持己見

抄襲面壁智能「小鋼炮」，斯坦福 AI 團隊上演「删庫跑路」

近日，一個斯坦福 AI 團隊宣布，隻需 500 美元就可訓練出一個超越 GPT-4V 的 SOTA 多模态大模型。

但很快，一位 X 使用者 @yangzhizheng1 指出，該項目使用的模型結構和代碼與面壁智能不久前釋出的 MiniCPM-Llama3-V2.5 驚人的相似。

為此，X 使用者 @yangzhizheng1 也放出了相應的質疑證據。

證據一：

Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型結構、代碼，簡直是複制粘貼級别的相似，差別大概就是換了個馬甲——變量名改了改。

就像是同一件衣服，隻是換了不同顔色的紐扣，你說巧不巧？

證據二：

Llama3-V 的作者被問到為啥能提前用上還沒釋出的 MinicPM-Llama3-V2.5 分詞器時，他們解釋稱，用的是面壁智能上一代 MinicPM-V-2 項目。

但有媒體向面壁智能官方求證，在 HuggingFace 中，MiniCPM-V2 與 MiniCPM-Llama3-V 2.5 分詞器分别是兩個檔案，檔案大小也完全不同。

更何況，MiniCPM-Llama3-V 2.5 的分詞器是用 Llama3 分詞器加上 MiniCPM-V 系列模型的特殊 token 組成。

考慮到 MiniCPM-V2 的釋出時間早于 Llama3，理論上它不可能包含尚未公開的 Llama3 分詞器技術。

證據三：

更離譜的是，llama3-V 項目的作者面對使用者的質疑，一看事情不妙，幹脆上演了一出「删庫跑路」的好戲。

連 GitHub 上的項目頁面都撤了，堪稱掩耳盜鈴 2.0 版本。

Hugging Face 位址如下，目前打開該頁面，我們隻能看到「404」。

https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6

這還沒完，更多證據正在不斷湧現：

X 使用者 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪聲（由單個标量參數化），出來的模型跟 Llama3-V 就像是一個模子刻出來的。

不僅如此，這模型還能識别「清華簡」這種深奧的戰國古文字，而且錯得都一模一樣，用面壁智能官方的話來說：

不僅對得一模一樣、連錯得都一模一樣。

要知道這一古文字資料，是面壁智能和清華大學自然語言處理實驗室團隊花費數月時間，從清華大學收藏的清華簡上逐字掃描并人工标注得來，從未對外公開過。

那斯坦福 AI 團隊是如何憑空獲得呢？

可以說，面壁智能 6 月 2 日的深夜聲明算得上是徹底實錘斯坦福 AI 研究團隊的抄襲。

直到今天淩晨，斯坦福 Llama3-V 團隊的兩位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就這一學術不端行為向面壁 MiniCPM 團隊正式道歉，表示 Llama3-V 模型将悉數撤下。

名校學霸也抄襲？中國開源大模型正迎頭趕上

此事之是以在網絡上激起千層浪，一個重要的原因在于抄襲作者的背景實在光鮮。

公開資訊顯示，Siddharth Sharma 與 Aksh Garg 均是斯坦福大學計算機系的大學生，曾發表過多篇機器學習領域的論文。其中，Siddharth Sharma 曾在亞馬遜實習過一段時間，目前主要從事于 AI 和資料相關工作。

而 Aksh Garg 的實習履曆，那叫一個豐富，涵蓋 SpaceX、斯坦福大學和加州理工學校等知名組織機構。

至于被這上述兩位作者稱為「代碼搬運工」的 Mustafa Aljadery，是南加州大學出身，在輿論發酵之後，目前 X 賬号已經被設為隐私狀态。

對于這的斯坦福 Llama3-V 團隊的道歉聲明，眼尖的網友卻不吃這套。

例如，X 使用者 @xunie 指出，這哥倆将責任歸咎給一個人的甩鍋行為，莫不是「有福同享，有難你當」？

斯坦福 AI 實驗室主任 Christopher David Manning 也站出來譴責這一抄襲行為，并且對 MiniCPM 這一優異的中國開源模型表示贊揚。

不過，也有網友抱着「得饒人處且饒人」的态度，悠悠然地鼓勵道：

開放和誠實是科技界非常重要的價值觀，期待你的新作品。

Google DeepMind 研究員 Lucas Beyer 表示，中國開源大模型擁有像 MiniCPM 這樣好的模型，但國際上卻沒給夠應有的關注……

面壁智能團隊也于昨天對此事進行回應。

面壁智能 CEO 李大海表示：「技術創新不易，每一項工作都是團隊夜以繼日的奮鬥結果，也是以有限算力對全世界技術進步與創新發展作出的真誠奉獻。

我們希望團隊的好工作被更多人關注與認可，但不是以這種方式。」

面壁智能首席科學家劉知遠也在知乎上發文表示，表示這次事件從另一個角度證明了中國創新成果的國際影響力，強調了開源共享的重要性，以及對原創精神的尊重。

不得不說，這出 AI 圈的抄襲大戲，教科書般地诠釋了叫「創新不易，且行且珍惜，學術誠信，人人有責」。

要知道，模仿了代碼的形，卻抄不來那份原創的風姿卓絕。

事實上，自去年以來，中國大模型如同雨後春筍般陸續開源，從以往的受益者轉變為貢獻者，不吝于向世界提供更多開源的優異成果。

上至阿裡巴巴、騰訊等巨頭，下至面壁智能，智譜 AI 、昆侖天工等 AI 初創，也都是開源社群的積極分子，為中國大模型的發展添磚加瓦。

我們也盼着，這股子開放共享的春風，能吹得更猛烈些。

正如面壁智能 CEO 李大海所呼籲的那樣，大家一起共建開放、合作、有信任的社群環境。加油合作，才能讓世界因 AGI 的到來變得更好！

檢視原圖 38K

斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視
斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視
斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視
斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視
斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視
斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視
斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視

斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視

斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視

繼續閱讀

南海投擲探測器，東海偵察船秘密行動，美軍在中國家門口意欲何為

驚！中國七大名醫揭秘‘作死’真相，你中招了嗎？

美國體系崩落！中國經貿體系升起

OPPO A3正式釋出：1599起售超抗造/超耐用

勇士神操作！李凱爾強勢加盟，陣容短闆補齊，場均23+8内線也要來

楊紫出席活動，一身中國紅連衣裙加編發，好像大家閨秀

地産大佬跨界醫療，中國房企TOP10悉數風光入局，在幹嘛？能行嗎

中國新能源再突破！換電速度驚人，汽車加油時代或将終結？

40年代老照片：舊社會的中國城市，沒有想象中落後

80年代的中國，是什麼生活水準？外國遊客拍到18張照片

國羽小将張志傑心髒驟停離世，姐姐回應世界羽聯：追究到底

32國發難，指責中國挑戰北約價值觀，中方反制來了，俄也有行動

慘敗84分！男籃曆史最大輸球分差！面對美國，差距就是這麼明顯！

RNG開啟KPL曆史A組首秀，eStar接受S組質檢，青丘九尾身價暴漲

中國男籃與澳洲熱身賽！杜潤旺貢獻名場面，姚明主席樂開花！

中國男籃87-107惜敗澳洲結論：4新星驚豔，3人不達标狀态低迷