天天看點

華為能否頂上英偉達?

華為能否頂上英偉達?

華為能否頂上英偉達?

此時,能頂上來的似乎隻有華為。

文/何伊然

編輯/楊羽

美國政府的最新“晶片禁令”提前生效。

10月25日,英偉達向美國證券交易委員會遞交的一份檔案中披露,美國政府通知該公司,針對适用于總處理性能大于等于4800TTP并為資料中心設計或銷售的産品的相關出口管制,立即生效。該管制影響到的英偉達産品有A100、A800、H100、H800和L40S等。

事情緣起當地時間10月17日,美國商務部工業和安全局更新了針對中國的“先進計算晶片和半導體制造裝置出口管制規則”(下稱“新規”),新規設定了“性能密度門檻值”作為參數,隻要晶片總算力大于或等于4800TTP,不論互聯帶寬多少都受管制。在新規的補充說明裡,美國商務部毫不掩飾地表示設定這一參數的目的就是限制晶片被用于訓練大型兩用AI基礎模型。

該新規将英偉達、AMD、英特爾等廠商現有的高性能算力晶片全部涵蓋。此外,美國商務部還擴大了晶片制造工具出口限制清單,中國兩家國産GPU制造商摩爾線程、壁仞科技被列入“實體清單”。媒體還爆料,美國政府在考慮限制向中國AI公司出租雲服務,確定美國企業不能“靈活運用”規則。

原本新規有30天公示期,被行業人士視為“最後30天視窗期”。在視窗期内,中國企業可以集中采購、運輸急需的高端AI晶片。出于對中國市場的依賴和商業契約,理論上美國晶片企業會配合盡快完成中國企業的訂單。

結果8天後,新規提前執行。受此消息影響,英偉達股價在當天下跌4.31%,第二天又下跌3.48%。而對于中國科技、大模型創業企業來說,同樣是影響巨大的,這意味着無法再獲得訓練大模型所需的高性能算力晶片。

《最話》了解到雖然提前儲備了不少H800晶片,但面對新規提前執行,各家中國科技企業并沒有解決辦法。

如果說有,那就是“推動算力國産化”。

從目前來看,除了租用雲服務算力,能大量采購到的部分替代英偉達的高性能算力晶片,隻有華為昇騰系列(HUAWEI Ascend)AI算力晶片。

《最話》從接近華為的人士了解到,目前無論是華為AI叢集的算力,還是涉及到的硬體裝置,“供應都是非常充足的。”

01 “卡脖子”

自從生成式AI浪潮席卷全球,各大科技巨頭紛紛加碼大模型開發。訓練大模型需要大量高性能AI算力晶片。據市場調查機構TrendForce資料顯示,如果以英偉達A100晶片的處理能力計算,GPT-3.5大模型需要上萬塊GPU來處理訓練資料。

中國科技企業開發的大模型所需的高性能算力晶片也在萬塊以上,并且随着大模型疊代,所需的晶片量還會增加。

按照一份流傳出的交流紀要,阿裡雲AI專家提到,阿裡雲在雲上就有上萬片的A100,整體能夠達到10萬片,集團體量應該是阿裡雲的5倍。騰訊雲利用H800加速卡打造的大模型算力叢集,叢集規模達到了數千台伺服器。

2022年10月,美國釋出了針對A100、H100和GH200等AI晶片的限制措施,停止向中國出口。

一時間A100晶片價格暴漲,《最話》了解到今年原價1萬美元/張的A100,年中在市場上報價15萬元/張,更有“黃牛”報價155萬元/張,是原價的21倍。

英偉達通過減配等方式繞過了美國“晶片禁令”,可以繼續對華銷售H800和A800型号晶片,綜合使用效率雖然隻有A100/H100的60%,但已經是中國企業在從英偉達手裡買到的最好的晶片。

根據英偉達2022年财報,中國區銷售收入占到總收入的20%。媒體推測,僅中國四大網際網路巨頭百度、位元組跳動、騰訊和阿裡巴巴就向英偉達下單購買了價值50億美元的A800顯示卡。

英偉達當然不想失去中國市場,今年初,英偉達CEO黃仁勳就在媒體面前反複強調着中國市場不可替代的重要性,“沒有另一個中國,隻有一個中國。”他甚至還表示,限制向中國出口人工智能晶片将導緻美國行業永久失去機會,也不可能限制住中國的發展。

雖然英偉達舍不得數十億美元的訂單,但作為一家美國企業,英偉達必須要遵守美國監管機構的新規。

在新規公布後,英偉達緊急表示:“鑒于全球對我們産品的需求,我們預計新的規定短期内不會對我們的财務業績産生實質性的影響。”不過,官方也承認:“新規定可能會影響公司的開發和傳遞能力,包括按時完成某些産品開發,為現有客戶提供支援,或者向受影響地區以外的客戶供應這些産品。”

坊間流傳的消息顯示,英偉達建議國内客戶在10月17日晚12點前增補訂單,并間接承認後續新增訂單将很難獲得供貨保證。

而現在未傳遞的訂單和增補的訂單都打了水漂。對于此前下了訂單,等着晶片建構算力叢集的中國科技公司來說,新規提前執行,晶片沒了,也不知何時才能拿到。

一位雲計算企業人士說,“合同都提前寫好了不可抗力會免責,這沒辦法。”對于租用他們算力的大模型客戶,雲計算企業也要求客戶給予免責。至于自建算力的大模型企業,同樣面臨着“停芯”“後續無芯可用”的窘境。一連串連鎖反應正在發生。

國際市場調研機構Counterpoint估算,目前中國科技企業落後OpenAI的GPT-4等頂尖大模型大約2.5年到3年。晶片供應不穩定的狀态下,該機構認為,中國科技企業與全球同行的差距,在未來幾年将繼續拉大。

02 “B計劃”

是以,無論是從自主可控還是從經營角度,中國科技企業必須盡快另覓高性能算力晶片的供應商。

算力晶片粗略可分為訓練、推理兩種用途,前者需要更大的算力規模。從目前來看,國内投入大規模量産并在業務上使用的算力晶片有華為昇騰910、阿裡倚天710、百度昆侖芯2代、騰訊紫霄、海光DCU Z100等。

據《電子工程專輯》釋出的《45家國産AI晶片廠商調研分析報告》,阿裡倚天710是CPU,用于邏輯計算,而非AI推理訓練;百度昆侖芯2代被應用于文心一言大模型的推理端,訓練端主要還是使用英偉達V100和A100;海光DCU Z100訓練算力較小,不到100TFLOPS,隻适合一些推理場景,不足以支援訓練大模型;騰訊紫霄雖然大規模投入實際業務中,但定位于偏中低端,用于AI推理。

2019年8月23日正式推出的華為昇騰910是國内算力最強的AI處理器,晶片基于自研華為達芬奇架構3D Cube技術。昇騰910A隻支援FP16半精度計算,而昇騰910B已更新到支援FP32單精度計算,昇騰910B的FP32單精度計算算力可達75T,支援HBM記憶體技術,可以用于大模型訓練,已适配盤古、Llama、清華大學自研大模型等。

科大訊飛在第三季度業績說明會上曾透露,公司已于今年初與華為昇騰啟動專項攻關,如今華為釋出的昇騰910B能力已經基本做到可對标英偉達A100晶片,未來算力緊張狀态将得到緩解。

昇騰910系列晶片采用7nm工藝制程,此前由台積電代工。一位數位部落客在微網誌上稱,“華為晶片制造問題解決了,往後幾年将是海思各類晶片的井噴,華為昇騰也全面開花了”。

這與《最話》了解到的情況大緻相同,麒麟9000S晶片的良品率已經基本達到台積電水準,這意味着7納米的良品率和産能已經不是大問題,目前華為内部各條業務線都在搶産能,其中就包括昇騰910系列晶片。

《最話》從接近華為的人士了解到,目前昇騰主要有兩種類型的客戶,一類是制造業客戶,買兩三台做AI質檢,對并行計算沒什麼要求;還有一類是央企國企背景的企業,會與華為有深度溝通和合作。但一些中型或者大型科技企業,“目前合作是比較少的,它們過去肯定是優先購買英偉達的産品,現在有可能轉向購買國産AI算力晶片了。”

“目前來看,華為無論是平台的算力,還是涉及到的硬體裝置的供應,都是非常充足的。”該人士表示。

昇騰910B支援的FP32單精度計算,對于一般圖形處理計算、深度學習、大模型等領域,已經夠用。但對于需要處理的數字範圍大且需要精确計算的科學計算,如計算化學、分子模組化、流體動力學等,就需要支援FP64雙精度計算。

原定于2021年推出的昇騰920,因受2019年美國對華為的制裁影響,進度大幅延宕。今年5月,在華為昇騰開發者峰會上,一張PPT引發了關注,很多人在猜測雲腦Ⅲ 原型機采用的會不會就是昇騰920。這就隻有時間來證明了。

華為能否頂上英偉達?

同時,華為也在開發技術工具,幫助客戶在不同計算卡間解決算力排程問題,友善客戶混合部署。

03 背水一戰

新規出台後,黃仁勳強調,中國本土也有包括華為在内很多優秀的科技廠商,英偉達必須努力與這些企業競争。

但誰都知道,英偉達在GPU、高性能算力晶片領域的地位是短時間内難以撼動的。花旗研究分析師Christopher Danely(克裡斯托弗·丹尼利)表示,英偉達将占據AI高性能計算晶片市場至少90%的份額。

新規如果不能解除,那就意味着絕大部分想自研通用大模型的中國AI創業企業将面臨巨大挑戰,當然,資金實力雄厚的科技大企業,還可以通過與華為等協同攻關或直接采購以熬過難關。

這是在與時間賽跑。

英偉達首席科學家表示:“随着訓練需求每6到12個月翻一番,這一差距将随着時間的推移而迅速擴大。”生成式AI實在發展的太快了,新規毫無疑問是想拉大國内企業和美國企業在人工智能上的時間差和代差。面對英偉達在硬體上、Open AI在算法上不斷疊代,中國科技企業并沒有太多猶豫時間,也沒有太多試錯機會,必須保證每一步做出正确的決定。

美國政府一紙規定,就讓英偉達被迫退出中國高性能算力晶片市場,這一局面不是黃仁勳希望看到的。10月21日,黃仁勳曾表示,英偉達會遵循美國政府的相關規定,但也“希望盡可能擁有較大的市場,會盡量支援各個市場需求,也支援中國大陸市場客戶。”

隻是處在夾縫中的英偉達并沒有選擇的餘地。同樣沒有選擇餘地的還有AMD、英特爾,AMD的MI250X、MI300,英特爾的Gaudi 2、Gaudi 3也上了管制名單。據報道,黃仁勳、英特爾高層和美國進階官員交涉過,但無功而返。

AI算力晶片折舊一般2-3年,最長不超過5年。管制新規生效後,即使國内科技大廠、大模型創業公司囤積了不少H800,很會在未來兩三年後面臨折舊、換代的需求,如果得不到補充,将面臨巨大困境。

與此同時,哪怕其他國産AI晶片企業能解決授權、設計問題,在制造領域還得靠台積電等晶片企業代工,在供應管道上也有一定不确定性。

現在就需要看國内企業能否通力合作解決半導體制造全産業鍊問題了。

此時此刻,所有科技公司都在夾縫中尋找生機,英偉達、AMD、英特爾掌握着先發優勢和巨大市場,新規并不會造成緻命影響,但對于國内科技、算力晶片企業來說,在管制新規的高壓之下,想要活下去,唯有背水一戰。

繼續閱讀