天天看點

從追趕美國,到被美國抄襲

作者:環時财經

美國斯坦福大學三名學生組成的一個AI(人工智能)團隊,抄襲中國大模型公司“面壁智能”的開源成果“小鋼炮”MiniCPM-Llama3-V 2.5的鬧劇,引發中美AI技術研發速度的對比。

“斯坦福抄襲事件”發生後,《環球時報》記者在第六屆北京智源大會見到了面壁團隊,無論是創始人劉知遠、還是CEO李大海,都盡力淡化此事。而面壁CTO(首席技術官)曾國洋的亮相,引起很多關注。

這位被稱為“AI天才”的26歲男孩,上台時還被主持人笑問“畢業了麼”。被稱為“AI界春晚”的北京智源大會是一個純技術的會場,現場雲集衆多國内外AI領域人才,讓《環球時報》記者十分好奇,中國AI界的生态什麼樣?“抄襲事件”是否對中國AI界産生震動?中國和美國在AI研發上,處于一種什麼狀态?《環球時報》記者就此專訪了曾國洋。

從追趕美國,到被美國抄襲

曾國洋接受《環球時報》專訪。 王 冬攝

抄襲事件漣漪

抄襲事件過去三周後,曾國洋從他自己的視角對《環球時報》記者還原此事。“最開始知道此事,還是來自開源網站GitHub的一些使用者回報,我們找到一些相關線索和證據,最終證明(斯坦福大學)确實發生了一個不太好的套殼現象。”曾國洋表示,事件最終以斯坦福大學生團隊通過郵件形式道歉、删除相關的代碼和産品收尾。

對此,斯坦福AI實驗室主任曼甯發文譴責抄襲學生,并稱MiniCPM“是很好的開源作品”。曾國洋表示,事件發生後,感受到挺多人的支援,也讓更多人了解到,在開源領域很多中國大模型是值得關注的。

面壁智能首席科學家、清華大學長聘副教授劉知遠接受《環球時報》記者采訪時也表達了同樣的感受,他認為,包括面壁在内的中國大模型,并不是因為抄襲事件才受到關注,之前中國在AI領域研發進展已經被關注。

一直被認為在“追趕美國”的國産大模型現在成了被抄襲的對象,是否意味着中國已經領先?曾國洋認為,不能說中美研發水準誰在前誰在後,而是一個“你追我趕”的狀态。在開源領域,中國一直是大模型領域非常重要的一個玩家,中美都會不斷有前沿的突破性成果出現。盡管很多國家相關研究機構也參與到大模型研發當中,“但在聲量上,目前還是以美國和中國比較重要的重量級玩家為主”。

劉知遠表示,在學術研究方面,10年前中國已能在國際上發表很多不錯的學術論文。但他向記者一針見血地指出,相比國外,目前國内重複開發基礎大模型是一種跟風、浪費,國内需把高品質制造大模型的平台系統搭建出來。他稱之為建造“大模型光刻機”。

“光刻機的科學原理我們也掌握,但中國高端光刻機被‘卡脖子’,根本原因是我們在系統化、平台化方面做得沒那麼好。”劉知遠以美國人工智能初創企業OpenAI為例說,ChatGPT推出來時,列出的貢獻者有數百人,但到今年2月,文生視訊大模型Sora問世,核心成員隻有13人。這中間發生了什麼?劉知遠認為,OpenAI将此前大量程式員、科學家等完成的基礎工作自動化、平台化,形成了自己的“大模型的光刻機”。Sora在這個基礎上研發,自然不需要那麼多人參與。

劉知遠表示,需要更加清醒地認識到中國和先進技術水準的真實差距,“如果我們隻是滿足于複現ChatGPT,那就意味着我們以後不可能做出Sora、ChatGPT4o來。我們要把自己的‘大模型光刻機’給造出來,這是我們要努力的方向。”

“《三體》影響了我的職業方向”

曾國洋是劉知遠在清華的學生,8歲自學程式設計、奧賽冠軍保送清華。2015年年底,當奧爾特曼、馬斯克等人創立OpenAI時,那時17歲的曾國洋,第一次接觸AI概念。

曾國洋最早接觸大模型,是OpenAI于2020年5月釋出的GPT-3,當時他第一時間就去新增賬號嘗試,他感覺到“人工智能将有重大突破性機會,在未來一定有很大想象空間”,這也促成劉知遠、曾國洋等人在2020年年底決定做國内第一個大模型。

“2019年那段時間,我們覺得,在NLP(Natural Language Processing, 自然語言處理,是計算機科學領域與AI領域中的一個重要方向——編者注)領域,我們已和國外基本上沒有太大差距。但是GPT-3出現後,對NLP領域帶來很大沖擊。”他說。

2021年,劉知遠牽頭成立了面壁智能,清華計算機大學畢業的曾國洋是三個創業核心人物之一。為什麼叫面壁?曾國洋回憶,他們先是創立一個人工智能開源社群叫OpenBMB,BMB讀起來很像“面壁”,同時團隊裡有很多人是中國科幻作家劉慈欣科幻小說《三體》的粉絲,“面壁者”又在《三體》中扮演非常重要的角色,最後團隊選擇用“面壁智能”這個富有科技感的名字。

曾國洋說,自己非常喜歡《三體》,“可以說,劉慈欣老師的《三體》影響了包括我在内中國一批人的職業方向”。

從10人到100人

在美國,也有一批年輕人在AI領域創業。Sora的核心團隊最小成員出生于2003年。美國AI初創公司Pika labs的創始團隊成員僅有4人,其中一個據稱是95後的“杭州哈佛女孩”郭文景。

曾國洋表示,大模型是一個新的技術變革,給了很多具有挑戰精神、願意嘗試新技術的年輕人改變自己的機會。

在中國AI這個新興領域,既有白發蒼蒼的學者,也有像曾國洋這樣的年輕人。在第六屆北京智源大會上,《環球時報》記者看到,一位中年工程師現場提問時,恭恭敬敬喊曾國洋“老師”。曾國洋表示,中國AI圈内并不是論資排輩,大家都互相稱呼“老師”,大家都樂于去學習、接受新思想,主動去學習一些自己不懂的技術。

工作之餘,曾國洋喜歡看新聞、去開源社群交流,甚至有時候還特别懷念寫代碼的日子。去年年初,面壁團隊隻有10個人不到,目前已經擴充到100多人,曾國洋需要整體負責大模型的研發工作。26歲,當很多年輕人大學剛畢業走上工作崗位,曾國洋已經是面壁智能公司的CTO。

對于外界稱呼他是“AI天才”“中國版謝爾頓”,曾國洋坦言自己一直以來學習“還行”,也沒看過美劇《少年謝爾頓》。“加入到計算機領域,去做人工智能,一直以來都是我的興趣愛好在驅動着我,AI是一種非常非常有創造力的工作,我的工作就像在創造一個新的智能生命體一樣。”曾國洋說,更願意稱呼自己是“AI藝術家”,“我在創造一個藝術性的生物”。

未來,AI能否取代人類?曾國洋認為,AI未來将作為一個助手去提升人類工作效率,并不能完全取代人類。對于AI完全取代了人類工作,這位26歲的年輕人有點向往,“也許人類可能就不需要工作了,會做一些更有創造性的事情,或者做自己特别想要做的事情”。

繼續閱讀