天天看點

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

作者:哦皮蘋果核
國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

國産GPU性能現狀

近年來,國内GPU晶片廠商在技術研發上狠下功夫,産品性能已經不落後于英偉達的中低端産品。以芯動科技的"風華1号"為例,其采用了7納米工藝制程,擁有128bit位寬記憶體接口,具備4.0TFLOPS的半精度浮點計算能力。在一些通用GPU計算測試中,其性能已經可以與英偉達的GTX 1650 Super相媲美。

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

另一家國産GPU廠商摩爾線程的MTT S80系列産品,則采用了12納米工藝制程,擁有256bit位寬記憶體接口,理論計算能力高達6TFLOPS。在AI推理任務上,其性能甚至可以超過英偉達的GTX 1660 Ti。

從上述情況可以看出,國産GPU晶片在性能方面的确已經不落後于英偉達的中低端産品。但要想真正替代英偉達,還需要攻克一個更大的難關 - CUDA生态壁壘。

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

CUDA生态壁壘

CUDA生态系統概述

CUDA(Compute Unified Device Architecture是英偉達推出的一套并行計算架構,包括GPU加速計算的指令集和并行計算元素,以及配套的程式設計模型和軟體環境。

CUDA生态系統非常龐大,不僅包括英偉達自家的CUDA工具鍊,還包括了大量方軟體和架構。比如深度學習架構PyTorch和TensorFlow,都對CUDA生态有着深度整合和優化。很多AI模型訓練和推理都依賴于CUDA生态。

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

國産GPU無法使用CUDA

由于CUDA生态是英偉達自家的專有技術,國産GPU無法直接使用這一生态系統。如果要在國産GPU上運作基于CUDA的模型和應用,就需要重新适配和優化,工作量非常大。

這給國産GPU替代英偉達帶來了很大阻力。很多AI企業由于依賴CUDA生态,即使國産GPU性能不差,也不願意輕易切換到國産GPU。

打破壁壘的關鍵

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

要想國産GPU真正替代英偉達,打破CUDA生态壁壘是關鍵所在。這需要國内GPU廠商在軟體生态建設上做出更大投入,建構與CUDA生态相容或者更強大的軟體生态系統。

國内AI企業和開發者也需要加大對國産GPU生态的支援力度,将更多的AI模型和架構移植到國産GPU平台上。隻有軟硬體協同發力,國産GPU才能真正替代英偉達。

存算一體AI晶片

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

發展趨勢

随着生成式AI模型越來越複雜,對算力的需求也在不斷增長。未來的發展趨勢可能是存算一體AI晶片,将算力和存儲內建在一起,大幅提高單晶片算力和能效比。

存算一體AI晶片可以避免資料在存儲和計算單元之間的傳輸,減少了帶寬壓力,提高了能效。同時由于算力和存儲的緊密內建,也能夠支援更大規模的模型。

業内人士預計,未來存算一體AI晶片的算力将達到每秒萬億次運算量級,能效比也将比現有GPU提高數個數量級。這将為AI的發展注入新的動力。

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

國内企業布局

國内已經有不少企業瞄準了存算一體AI晶片這一方向。例如,地平線已經推出了"征程"系列存算一體AI訓練晶片,單晶片算力高達1000TFLOPS。

另一家企業燧原科技則專注于存算一體推理晶片,其"燧舟"系列産品單晶片算力可達500TFLOPS,功耗僅為100W。

除了專業AI晶片企業,一些傳統IT巨頭也在布局這一領域。例如華為的昇騰AI處理器就采用了類似的存算一體架構設計。

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

突破CUDA壁壘的希望

如果國内企業能夠在存算一體AI晶片上取得突破,就有望突破英偉達的CUDA生态壁壘。由于存算一體晶片與傳統GPU架構差異很大,CUDA生态的優勢将大大減弱。

存算一體AI晶片由于算力和能效的巨大優勢,必将推動AI模型和架構的重新設計和優化,以充分發揮其性能潛力。這将給國産晶片帶來機會,有望在新一代AI生态中占據重要地位。

國産GPU替代英偉達:晶片不是問題,CUDA生态,才是關鍵

雖然國産GPU晶片在性能上已經不落後于英偉達的中低端産品,但要想真正替代英偉達,打破其CUDA生态壁壘才是關鍵。未來存算一體AI晶片可能是突破的方向,國内企業如果能在這方面取得突破,就有望替代英偉達,實作國産GPU的崛起。

繼續閱讀