天天看點

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

大模型火了,參數規模一路狂飙,在新的超級AI算力系統背後,多層次的交換機網絡也讓網工朋友很是頭疼。

網工朋友可能還沒注意到,最近市面上有一款吊炸天的“大模型專用交換機”來了。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

畢竟,交換機這種通用網絡産品發展了幾十年,時至今日,任何網絡技術,很難撩起人們的興奮點。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

但,仔細了解一下,這款交換機,着實讓人興奮。

甚至可以說,這是國内目前AIGC領域最牛交換機。

這款叫做X400的交換機,端口規格是128×400G,看起來似乎“平平無奇”。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

因為業内同行們,也差不多是這個規格(單晶片51.2T方案,64×800G或128×400G)。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

可是,類似的規格,這款交換機卻表現出“吊打”同行的能力。

跟同行們的51.2T方案相比,用這款交換機組網訓練大模型,訓練性能可以提升至1.6倍。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

下面這個實測就很能說明問題:

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

這是什麼概念呢?

這意味着,基于X400交換機建構的以太網,大模型訓練性能可以完全對标同速率的IB網絡。

你花着以太網RoCE的錢,買到的卻是與IB網絡相當的性能!

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

接下來,我們就講講,這個看似平平無奇的X400,憑啥這麼猛?

首先,這是國内目前唯一量産的基于Spectrum-4交換晶片的交換機。

目前市面上51.2T交換晶片方案四分天下:Spectrum-4、Tomahawk 5、Silicon One G200以及Teralynx 10,每一家都各有特色。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

國内數通大廠和網際網路巨頭們,紛紛釋出了51.2T交換機,大多搭載的是Tomahawk5方案,而這款X400交換機,是首款采用Spectrum-4的。

懂的都懂,Spectrum-4在AI場景能力超強。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

相比其他方案,Spectrum-4具備一些獨特的優勢,專門應對AI業務場景:

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

❶自适應路由實作完美負載均衡 ❷多租戶流量隔離,互不打擾 ❸交換鍊路帶寬使用率高 ❹訓推任務實作低延時,低抖動和低尾延時。

更為重要的是,AI大模型大多基于GPU建構,訓練的網絡優化離不開集合通信庫支援。

X400和IB一樣,與NCCL天然無縫銜接,而其他交換方案需要對NCCL進行額外修改和優化。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

是以,在硬體底子上,X400交換機天生就「骨骼精奇」,赢在了起跑線上。

不過,硬體能力隻決定了交換機的下限,軟體能力才能拉高交換機的上限。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

X400在軟體上,針對AIGC場景進行了特别優化。

這麼說吧,同樣是RoCE,X400能吊打傳統RoCE交換機,軟體層的優化,功不可沒。

01X400 軟體揭秘AUTO ECN技術

搞過資料中心網絡的都知道,在對網絡延遲和丢包比較敏感的場景,通常都會啟用ECN技術,現在市面上用的比較多的叫做“”。

ECN是一種網絡擁塞通知和管理機制,它在監測到網絡中即将發生擁塞的時候,不會将封包丢棄,而是添加擁塞标記,讓發送方動态調整擁塞控制視窗(CWND),進而避免擁塞。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

說白了,快要擁塞的時候,就通知發送方步子邁小點兒,沒有擁塞的時候,步子就邁大點兒。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

但是呢,這個“步子”的大小(擁塞視窗大小)是非常有學問的,步子太大容易扯着蛋,步子太小就會影響吞吐量。

能夠動态地找出那個最優的“視窗”,既保證不擁塞,又有最高的吞吐量,深深困擾了廣大資料中心網工們。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

手動ECN調優太麻煩了,X400交換機是怎麼幹的呢?

這家夥鬼的很,它要用AI的辦法來解決AI問題,搞出了一個AutoECN的算法,相當于每台交換機都内置了一個流量調參大模型。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

在實際流量環境中,X400交換機會實時采集流量特征,并通過帶外管理口進行上下遊流量特征同步(這種同步不會占用帶内帶寬資源)。

被采集到的流量狀态會作為輸入,給到交換機内置的AutoECN模型,然後模型會根據輸入,完成實時推理,得到此時最優的ECN參數,實時設定。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

跟傳統的ECN/DCQCN相比,AutoECN的擁塞控制門檻值是一個完全動态調整的最優值,也不怕由于CNP封包發送不及時導緻的控速失效。

來看一下實戰效果↓

同樣一組流量,在啟用了DCQCN和AutoECN的交換機上傳輸,後者對傳輸效率的改進非常明顯。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

如上圖,AutoECN提供了三種模型:時延優先、吞吐優先、均衡模型。然後分别用兩種特征的流量來打,每種模型的表現,都大幅超過傳統ECN(傳輸每一組流量時,所用時間越短越好)。

當你的業務更挑時延,就用時延優先模型,如果更偏向吞吐,就用吞吐優先模型,如果兩種都想兼顧,那就用均衡模型。

總之不管流量多變态,AutoECN總能基于AI技術,動态調參,給出一個最優方案。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

02X400 軟體揭秘RTT-CC擁塞控制

如果你的業務對網絡延遲格外敏感,希望更低的延遲和抖動,基于X400交換機建構的AI Fabirc方案還額外準備了一項秘技:RTT-CC。

RTT-CC不需要像ECN那樣對擁塞資料包進行标記,而是通過持續監控和評估資料包的往返時間,預測網絡擁塞。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

X400 AI Fabirc方案的RTT-CC功能,采用了基于硬體的回報環路,動态監測擁塞并實時調整發送視窗大小和速率,性能更好,時延表現更優。

如此,同時具備RTT-CC和AutoECN的擁塞控制技術,可以更好地滿足低延遲、高吞吐、零丢包的嚴苛場景需求。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

03X400 軟體揭秘逐包負載均衡

在資料中心網絡中,涉及到多路徑傳輸的時候,傳統RoCE方案通常會用ECMP等技術,來實作多鍊路負載分擔。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

但是吧,ECMP的負載分擔,是基于流的(Flow Based,根據每條流哈希值的不同,排程到不同的鍊路上),粒度太粗犷。

極端的情況,會因為哈希不均勻或者流的大小懸殊,導緻流量都被排程到一條鍊路上,而其他鍊路沒活可幹,整網傳輸效率打折。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

怎麼破?

X400交換機支援自适應路由(AR)和包噴灑(Packet spraying)技術。

簡單講就是逐包負載均衡:基于每個資料包來排程,粒度更細,算法更優。

這樣,讓每條路都均勻負載分擔,提升整網吞吐量,打滿每條鍊路,喂飽每塊GPU。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

當然,這種逐包負載均衡,因為每個包走的路況不一樣,到達伺服器端的時候,資料包先後順序可能會錯亂,如果伺服器沒點特殊本事,就會吃不消。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

于是,跟X400交換機配套的伺服器,也配備了支援功能的智能網卡,可以對亂序的資料包,進行重組。

這樣就完美了,既不擔心亂序,又保證了鍊路的高效利用。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

憑借這三項超能力(AutoECN、RTT-CC、自适應路由),X400交換機成功扛下了智算中心AI算力系統高效互聯的嚴苛訴求。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

不止如此,X400交換機在軟體層面,還采用了大量技術來提升可靠性和可維護性。

比如故障自愈能力,IGE智能防護技術、可視化監控、ZTP部署…

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

同時,X400交換機遵循S3IP-UNP規範設計,支援開源SONiC和第三方網絡OS,對希望建構超級AI算力系統的客戶,都具備極大的靈活性。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

說了這麼多,這個X400交換機到底誰家的産品呢?

嘿嘿,浪潮資訊。

浪潮資訊X400超級AI以太網交換機,專門面向生成式AI場景打造,國内首款支援NVIDIA Spectrum-X平台技術,并基于X400和BlueField-3 SuperNICs打造端網協同的X400超級AI以太網(X400 AI Fabric)方案。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

浪潮資訊提供了端網協同的X400 AI Fabric方案,即插即用,最大支援512K張GPU的AI算力系統。

與業内傳統RoCE組網方案相比,帶寬使用率超過95%,時延降低30%,大幅提升大模型訓練速度。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

浪潮資訊憑什麼能造出性能如此拉滿的AI交換機?實戰效果甚至還超越了一衆數通大廠的RoCE産品?

浪潮資訊是國内最大的AI伺服器提供商,連續7年位居第一。

同時,浪潮資訊作為頭部網際網路客戶的核心網絡供應商,具備豐富的資料中心與智算中心的組網經驗。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

基于對AI基礎設施和應用的了解以及持續深入的網絡研發實踐,浪潮資訊釋出了這款全新的超級AI以太網交換機X400,成為業界矚目的頂流産品。

性能拉滿!“大模型專用”超級AI以太網交換機X400的殺手锏技術

大模型時代,一切都在重塑,浪潮資訊X400,築起通往大模型的超級高速路!

(注:本文轉載自科技自媒體“特大号”官微)

繼續閱讀