OpenAI斷供，中國企業：謝邀，已登頂

酷玩實驗室

2024-07-01 10:33科技領域創作者

全文2752字，閱讀約需8分鐘，幫我劃重點

劃重點

01OpenAI自7月9日起停止向中國大陸、中國香港等地區提供API，這些地區曾是制裁對象。

02由于OpenAI的斷供，國内企業紛紛推出優惠價格以吸引客戶，如阿裡的通義千問主力模型調用API的價格僅為GPT-4的1/50。

03然而，國内大模型在各項排行榜上表現出色，如C-Eval榜單前20名全是大陸的大模型，GPT-4位于21位。

04阿裡雲作為國内首個做開源的大型科技企業，已開源8款模型和5個模型，參數從5000萬到720億，表現逼近閉源模型之首GPT-4。

由騰訊混元大模型提供技術支援

OpenAI斷供了。

自7月9日起，包括中國大陸、中國香港、俄羅斯、北韓、伊朗等國家和地區都不能再接入他們的API。

一看名單，全是美利堅的制裁對象，這當然是一個政治問題。

不過大家要是對OpenAI這家公司持續關注的話，這個決定一點也不奇怪。

不久前，OpenAI的CEO奧特曼就解散了安全團隊——超級對齊，這個由OpenAI曾經的首席科學家Ilya Sutskever帶的團隊。

Ilya随即出走。很快，奧特曼就組建了一個新的安全團隊，而這個團隊的上司人是美國國安局前局長保羅·中曾根（Paul M. Nakasone）。

當OpenAI變成CloseAI，會對整個行業帶來什麼影響呢？

我們先看看這一波“斷供”可能會帶來什麼吧。

所謂的斷供“API”，這裡的API指的是“應用程式程式設計接口”。

你可以把API通俗地了解為餐廳的菜單。你可以用它來點菜，但你并不知道菜是怎麼做出來的。

還記得ChatGPT剛出來那陣兒，湧現出來無數AI公司麼。它們就是顧客，炒菜的是OpenAI，然後它們再把炒好的菜包裝一下，賣給餐廳外的我們。

是以本質上它們就是套殼公司，真正生産的是OpenAI。

可想而知，斷供對這些公司來說無異于釜底抽薪，把吃飯的家夥給收走了。

但換個角度想，OpenAI這個AI行業内巨無霸居然主動讓出市場，有錢不賺是傻蛋。

這不，國内各路高手立馬就像餓虎撲食一樣沖上來搶這潑天富貴，各種“搬家計劃”紛紛出爐，服務不要太周到。

比如阿裡的通義千問，除了提供專屬的遷移服務外，主力模型調用API的價格更是隻有GPT-4的1/50。這還是在通義千問跟GPT-4實力相當的情況下的價格。

其他包括智譜、訊飛、百度、百川等都提供了相當優惠的價格。

是以，現在擺在他們面前的已經不是to be or not to be的生死問題，而是如何從一衆“備胎”中挑最好的那個。

什麼樣的模型才是好模型呢？

正如歐洲曆史上最強的男人拿破侖所說，不想拿第一的模型不是好模型。

就像學生通過各個科目的考試比成績，大模型的能力也是看做題的成績。

學生有語數外理綜文綜的項目，大模型有推理能力、數學能力、程式設計能力、語言能力、多模态能力等多種項目。

比如最常用的MMLU資料集，内容涵蓋了STEM、人文、社科等57個學科，就是常用來測試模型知識和推理能力的資料集。

此外還有專考中文的C-Eval、考奧數的MATH（好會取名字）等等。

自然，每家模型都會争取考個好成績。但就像學生考試一樣，有的人實力強大，有的人有自己的辦法。

截至2024年6月28日，C-Eval榜單上，前20名全是大陸的大模型，GPT-4位于21位。

這并不符合我的實際體驗，雖然GPT-4的能力并沒有像以前一樣碾壓了，但也不至于排到21名啊。可以說，這份榜單在某種程度上失真了。

造成這種現象的原因有很多。

首先是随着大模型的不斷更新，一些題目變得相對簡單了。就像以前大家都是國小生，考國中的題目，大家分都不高。但經過一年多的學習，大家的水準上升到了高中生，再去做這些題，都能得個90分以上，那麼這個試題就不能很好地區分大家的水準了。

其次，閉卷變開卷。雖然這些考題都不是公開資料集，但我每天就擱那考試，一連考幾十天。那考試就跟刷題庫一樣了，考試的題目也逐漸公開。後來的大模型們直接用這些公開的題目去訓練，那再去考的時候，就相當于開卷考試了。就算是難如數學競賽，出成績也不是不可能的。

當然了，考題本身的品質也很重要。

這是著名的開源社群Huggingface釋出的榜單Open LLM Leaderboard的最高成績。可以看到，從2023年9月到2024年5月，大模型在各個科目取得的成績都不斷地提高，都接近虛線，也就是人類水準。

當然這個成績并不意味着大模型已經跟人一樣了，而是說明了這份卷子已經被做爛了。

是以，Huggingface在6月推出了一套新試題，更新版的Open LLM Leaderboard v2。

這套試題比此前版本難度高了不少，比如GPQA資料裡面全是研究所學生級别的知識，且專門找了生物、實體、化學等領域的博士生來出題。

客觀講，這一波很有誠意，沒給那些刷榜的大模型留下什麼空子鑽。

各考生做這套卷子的成績很快出來，榜單很出乎意料：

裡面有不少老熟人，當紅炸子雞，“法國的OpenAI”Mistral、“史上最強開源大模型”Llama3以及打敗了Llama3的通義千問Qwen2-72B（720億參數）。

在這家法國榜單上看到咱國産的通義千問，屬實是有點驚訝。

我又去看了詳細的成績單，Qwen2的數學（MATH）、專業知識（GPQA）和長上下文推理（MuSR）是優勢學科，尤其是數學，比第二高了6分。哦不好意思，第二名是沒有經過微調的Qwen2。

這份成績得到了Huggingface CEO的稱贊：

我去看了另一個榜單LiveBench AI，這是在圖靈獎得主、AI三巨頭之一的楊立昆（Yann LeCun）主導的一個大模型測評基準。

Qwen2-72B排名第8。

但這是包括了所有閉源模型的總榜單，Qwen2-72B是前十中唯一一個開源模型。

還有其他的榜單，Qwen2基本都是開源中的霸主，在這裡就不多列了。

這說明了Qwen2的做題能力很強。但它到底是做題家還是真的實力強大呢？這需要一線開發者的測試。

紅迪（reddit）裡的開發者測試後，給出了肯定的評價：

初次測試很不錯，有一個題目其他模型都錯了，隻有Qwen7B對了

另一個意大利的開發者甚至說“太強了以至于不像真的”：

我又去看了看推特，開發者們測試後也都非常認可Qwen2的能力，比如這位斯坦福的計算機副教授Percy Liang：

至此，我覺得Qwen2的實力已經沒什麼可質疑的了。

開源這條賽道上，競争從來都不比閉源小。

前有法國獨角獸Mistral直接免費甩出自家大模型 Mistral 7B 的磁力下載下傳連結。

開發者們下下來一跑，發現竟然性能并不比 130 億參數的 Llama 2 弱多少，而且微調一下，用一張顯示卡上就能跑。

後來他們又推出了更大參數量的 Mixtral 8x7B，性能追平了Llama2和ChatGPT3.5。

這讓Mistral先後融資超11億刀，數錢數到手軟。

而兩個月前，深耕開源的Meta正式釋出了Llama3 8B和70B，這個據估計花費了1500萬美元來訓練的開源模型，重新奪回鐵王座。

Meta官方認證為“迄今為止最強的開源大模型”。

當時外界有一種聲音說：“隻有GPT-5能壓住Llama3了。”

但GPT-5沒來，Qwen2先來了，驚不驚喜，意不意外？

其實，阿裡雲是國内首個做開源的大型科技企業。2023年8月，他們就開源了Qwen7B。

到現在，他們一共開源了Qwen-VL、Qwen-14B、Qwen-72B、Qwen-1.8B、Qwen-Audio、Qwen1.5的8款模型和Qwen2系列的5個模型，參數從5000萬到720億，可謂是全家桶了。

看到這裡，可能有人會問，阿裡雲還有自己的閉源模型，是在開源上遲疑了嗎？

但Qwen2這次全球第一的“出人頭地”，證明了阿裡雲做開源是認真的！

随着GPT-5釋出時間一而再再而三地延後，現在的消息已經推遲到明年年底了，大機率OpenAI還沒找到辦法讓GPT-5在GPT-4的基礎上大幅進步。

而與此同時，以Qwen2為代表的開源模型，表現正不斷地逼近閉源模型之首GPT-4。

将OpenAI變為CloseAI，從非盈利變為盈利的Sam Altman，在看到Qwen2的表現時，是否心中會生出一絲後悔呢？

檢視原圖 239K

OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂
OpenAI斷供，中國企業：謝邀，已登頂

OpenAI斷供，中國企業：謝邀，已登頂

OpenAI斷供，中國企業：謝邀，已登頂

繼續閱讀

中國冷藏展示櫃行業市場研究報告

中國療養床市場報告、及市場預測

中國聚氨酯樹脂複合材料行業市場研究報告

中國健康與美容零售市場報告、及市場預測

中國練習杯行業市場研究報告

漣水法院舉辦系列活動慶祝中國共産黨成立一百零三周年！

降維打擊？中國茶飲“占領”印尼

陪太子讀書！詹皇為布朗尼湖人見面會站台，老詹給兒子介紹湖人隊友

全區共有中國共産黨黨員1783467名

鴻蒙智行6月傳遞超4.6萬輛，登頂中國新勢力品牌銷量第一

盤點中國女排四大"悲情"隊員:王一梅生不逢時,曾春蕾意外懷孕壞事

32進8最新戰報：斯佳輝小組墊底出局，中國六将僅一人進八強！

輸掉84分！中國男籃慘敗美國隊，赢了法國不代表成為強隊！

瘋狂一夜！中國籃球慘敗104分，一人丢臉丢到海外姚明臉上挂不住

中國男籃慘敗澳洲：兩人驚喜兩人拉胯，一人應立即踢出國家隊

U20女排亞錦賽：中國隊首秀3-0橫掃哈薩克斯坦，球員表現點評