天天看點

OpenAI斷供,中國企業:謝邀,已登頂

OpenAI斷供,中國企業:謝邀,已登頂

酷玩實驗室

2024-07-01 10:33科技領域創作者

全文2752字,閱讀約需8分鐘,幫我劃重點

劃重點

01OpenAI自7月9日起停止向中國大陸、中國香港等地區提供API,這些地區曾是制裁對象。

02由于OpenAI的斷供,國内企業紛紛推出優惠價格以吸引客戶,如阿裡的通義千問主力模型調用API的價格僅為GPT-4的1/50。

03然而,國内大模型在各項排行榜上表現出色,如C-Eval榜單前20名全是大陸的大模型,GPT-4位于21位。

04阿裡雲作為國内首個做開源的大型科技企業,已開源8款模型和5個模型,參數從5000萬到720億,表現逼近閉源模型之首GPT-4。

由騰訊混元大模型提供技術支援

OpenAI斷供了。

自7月9日起,包括中國大陸、中國香港、俄羅斯、北韓、伊朗等國家和地區都不能再接入他們的API。

OpenAI斷供,中國企業:謝邀,已登頂

一看名單,全是美利堅的制裁對象,這當然是一個政治問題。

不過大家要是對OpenAI這家公司持續關注的話,這個決定一點也不奇怪。

不久前,OpenAI的CEO奧特曼就解散了安全團隊——超級對齊,這個由OpenAI曾經的首席科學家Ilya Sutskever帶的團隊。

OpenAI斷供,中國企業:謝邀,已登頂

Ilya随即出走。很快,奧特曼就組建了一個新的安全團隊,而這個團隊的上司人是美國國安局前局長保羅·中曾根(Paul M. Nakasone)。

OpenAI斷供,中國企業:謝邀,已登頂

當OpenAI變成CloseAI,會對整個行業帶來什麼影響呢?

我們先看看這一波“斷供”可能會帶來什麼吧。

01

所謂的斷供“API”,這裡的API指的是“應用程式程式設計接口”。

你可以把API通俗地了解為餐廳的菜單。你可以用它來點菜,但你并不知道菜是怎麼做出來的。

還記得ChatGPT剛出來那陣兒,湧現出來無數AI公司麼。它們就是顧客,炒菜的是OpenAI,然後它們再把炒好的菜包裝一下,賣給餐廳外的我們。

是以本質上它們就是套殼公司,真正生産的是OpenAI。

可想而知,斷供對這些公司來說無異于釜底抽薪,把吃飯的家夥給收走了。

但換個角度想,OpenAI這個AI行業内巨無霸居然主動讓出市場,有錢不賺是傻蛋。

這不,國内各路高手立馬就像餓虎撲食一樣沖上來搶這潑天富貴,各種“搬家計劃”紛紛出爐,服務不要太周到。

比如阿裡的通義千問,除了提供專屬的遷移服務外,主力模型調用API的價格更是隻有GPT-4的1/50。這還是在通義千問跟GPT-4實力相當的情況下的價格。

OpenAI斷供,中國企業:謝邀,已登頂

其他包括智譜、訊飛、百度、百川等都提供了相當優惠的價格。

是以,現在擺在他們面前的已經不是to be or not to be的生死問題,而是如何從一衆“備胎”中挑最好的那個。

02

什麼樣的模型才是好模型呢?

正如歐洲曆史上最強的男人拿破侖所說,不想拿第一的模型不是好模型。

OpenAI斷供,中國企業:謝邀,已登頂

就像學生通過各個科目的考試比成績,大模型的能力也是看做題的成績。

學生有語數外理綜文綜的項目,大模型有推理能力、數學能力、程式設計能力、語言能力、多模态能力等多種項目。

比如最常用的MMLU資料集,内容涵蓋了STEM、人文、社科等57個學科,就是常用來測試模型知識和推理能力的資料集。

此外還有專考中文的C-Eval、考奧數的MATH(好會取名字)等等。

自然,每家模型都會争取考個好成績。但就像學生考試一樣,有的人實力強大,有的人有自己的辦法。

截至2024年6月28日,C-Eval榜單上,前20名全是大陸的大模型,GPT-4位于21位。

OpenAI斷供,中國企業:謝邀,已登頂

這并不符合我的實際體驗,雖然GPT-4的能力并沒有像以前一樣碾壓了,但也不至于排到21名啊。可以說,這份榜單在某種程度上失真了。

造成這種現象的原因有很多。

首先是随着大模型的不斷更新,一些題目變得相對簡單了。就像以前大家都是國小生,考國中的題目,大家分都不高。但經過一年多的學習,大家的水準上升到了高中生,再去做這些題,都能得個90分以上,那麼這個試題就不能很好地區分大家的水準了。

其次,閉卷變開卷。雖然這些考題都不是公開資料集,但我每天就擱那考試,一連考幾十天。那考試就跟刷題庫一樣了,考試的題目也逐漸公開。後來的大模型們直接用這些公開的題目去訓練,那再去考的時候,就相當于開卷考試了。就算是難如數學競賽,出成績也不是不可能的。

當然了,考題本身的品質也很重要。

這是著名的開源社群Huggingface釋出的榜單Open LLM Leaderboard的最高成績。可以看到,從2023年9月到2024年5月,大模型在各個科目取得的成績都不斷地提高,都接近虛線,也就是人類水準。

OpenAI斷供,中國企業:謝邀,已登頂

當然這個成績并不意味着大模型已經跟人一樣了,而是說明了這份卷子已經被做爛了。

是以,Huggingface在6月推出了一套新試題,更新版的Open LLM Leaderboard v2。

OpenAI斷供,中國企業:謝邀,已登頂

這套試題比此前版本難度高了不少,比如GPQA資料裡面全是研究所學生級别的知識,且專門找了生物、實體、化學等領域的博士生來出題。

客觀講,這一波很有誠意,沒給那些刷榜的大模型留下什麼空子鑽。

各考生做這套卷子的成績很快出來,榜單很出乎意料:

OpenAI斷供,中國企業:謝邀,已登頂

裡面有不少老熟人,當紅炸子雞,“法國的OpenAI”Mistral、“史上最強開源大模型”Llama3以及打敗了Llama3的通義千問Qwen2-72B(720億參數)。

在這家法國榜單上看到咱國産的通義千問,屬實是有點驚訝。

OpenAI斷供,中國企業:謝邀,已登頂

我又去看了詳細的成績單,Qwen2的數學(MATH)、專業知識(GPQA)和長上下文推理(MuSR)是優勢學科,尤其是數學,比第二高了6分。哦不好意思,第二名是沒有經過微調的Qwen2。

這份成績得到了Huggingface CEO的稱贊:

OpenAI斷供,中國企業:謝邀,已登頂

我去看了另一個榜單LiveBench AI,這是在圖靈獎得主、AI三巨頭之一的楊立昆(Yann LeCun)主導的一個大模型測評基準。

Qwen2-72B排名第8。

OpenAI斷供,中國企業:謝邀,已登頂

但這是包括了所有閉源模型的總榜單,Qwen2-72B是前十中唯一一個開源模型。

還有其他的榜單,Qwen2基本都是開源中的霸主,在這裡就不多列了。

這說明了Qwen2的做題能力很強。但它到底是做題家還是真的實力強大呢?這需要一線開發者的測試。

紅迪(reddit)裡的開發者測試後,給出了肯定的評價:

OpenAI斷供,中國企業:謝邀,已登頂

初次測試很不錯,有一個題目其他模型都錯了,隻有Qwen7B對了

另一個意大利的開發者甚至說“太強了以至于不像真的”:

我又去看了看推特,開發者們測試後也都非常認可Qwen2的能力,比如這位斯坦福的計算機副教授Percy Liang:

OpenAI斷供,中國企業:謝邀,已登頂

至此,我覺得Qwen2的實力已經沒什麼可質疑的了。

03

開源這條賽道上,競争從來都不比閉源小。

前有法國獨角獸Mistral直接免費甩出自家大模型 Mistral 7B 的磁力下載下傳連結。

開發者們下下來一跑,發現竟然性能并不比 130 億參數的 Llama 2 弱多少,而且微調一下,用一張顯示卡上就能跑。

後來他們又推出了更大參數量的 Mixtral 8x7B,性能追平了Llama2和ChatGPT3.5。

OpenAI斷供,中國企業:謝邀,已登頂

這讓Mistral先後融資超11億刀,數錢數到手軟。

而兩個月前,深耕開源的Meta正式釋出了Llama3 8B和70B,這個據估計花費了1500萬美元來訓練的開源模型,重新奪回鐵王座。

OpenAI斷供,中國企業:謝邀,已登頂

Meta官方認證為“迄今為止最強的開源大模型”。

當時外界有一種聲音說:“隻有GPT-5能壓住Llama3了。”

但GPT-5沒來,Qwen2先來了,驚不驚喜,意不意外?

OpenAI斷供,中國企業:謝邀,已登頂

其實,阿裡雲是國内首個做開源的大型科技企業。2023年8月,他們就開源了Qwen7B。

到現在,他們一共開源了Qwen-VL、Qwen-14B、Qwen-72B、Qwen-1.8B、Qwen-Audio、Qwen1.5的8款模型和Qwen2系列的5個模型,參數從5000萬到720億,可謂是全家桶了。

看到這裡,可能有人會問,阿裡雲還有自己的閉源模型,是在開源上遲疑了嗎?

但Qwen2這次全球第一的“出人頭地”,證明了阿裡雲做開源是認真的!

随着GPT-5釋出時間一而再再而三地延後,現在的消息已經推遲到明年年底了,大機率OpenAI還沒找到辦法讓GPT-5在GPT-4的基礎上大幅進步。

而與此同時,以Qwen2為代表的開源模型,表現正不斷地逼近閉源模型之首GPT-4。

将OpenAI變為CloseAI,從非盈利變為盈利的Sam Altman,在看到Qwen2的表現時,是否心中會生出一絲後悔呢?

檢視原圖 239K

  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂
  • OpenAI斷供,中國企業:謝邀,已登頂

繼續閱讀