天天看點

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

作者:智東西
Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

作者 | 雲鵬

編輯 | 李水青

智東西5月31日報道,今天,智能終端産業正與以大模型為代表的生成式AI技術進行一場前所未有的深度融合,以AI手機和AI PC為代表的移動領域,作為與我們每個人生活關系最為密切的賽道,已經湧現出諸多新的AI需求和場景。

生成式AI帶來了新的算力挑戰和存儲挑戰,并加速着背後一系列硬體、軟體、算法、生态等方面的技術疊代,從晶片廠商到終端廠商,再到大模型廠商,每一個領域的玩家都被深度卷入。

作為移動領域底層計算解決方案提供者的科技巨頭Arm,近期也亮出了一系列與生成式AI産業發展密切相關的新産品、新技術,可以說,作為移動生态巨頭的Arm,正在向AI加碼布局。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

就在昨天,Arm在中國北京舉辦了一場線下釋出會,公布了自家最新的終端計算子系統(CSS),這一系統結合了Armv9架構的特性,基于3nm工藝節點打造,包括Arm最新的CPU和GPU。同時Arm還釋出了為開發人員量身定制的開發工具Kleidi庫。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

新CPU Cortex-X925實作了41%的AI性能提升,并顯著提高了LLM等裝置端生成式AI的響應能力,而Arm Immortalis-G925則在多個AI和ML網絡上提升了34%的性能。

可以說,Arm的一系列重磅技術和新品都劍指AI。

值得一提的是,這是Arm首次為Arm CPU和GPU傳遞實體實作,這可以讓建構和部署基于Arm架構的解決方案變得更加簡單。

此次智東西也有幸與Arm終端事業部産品管理副總裁James McNiven進行了面對面的深入交流,對Arm在生成式AI時代的機遇、挑戰進行了深入探讨,并挖掘了Arm在架構、硬體、軟體、生态等方面的核心優勢和深入思考。

在生成式AI時代,計算的“能效”成為行業首要關注焦點,而能效正是Arm的“DNA”。Arm毫無疑問已經成為攪動移動智能終端産業的重要變量。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

一、生成式AI掀起存儲、計算需求暴漲,安卓端CPU挑大梁

毫無疑問,當下正是移動智能終端行業的關鍵時刻。生成式AI的端側落地,重新定義了智能手機的“智能性”,而在這一關鍵時刻中,Arm是計算的“基石”。從手機、筆記本電腦到可穿戴裝置和數字電視等裝置,Arm正在為最大的計算生态系統提供普适應用。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

生成式AI的到來必将會催生更多的計算需求,帶來更多新的用例,這對Arm、晶片廠商、終端廠商來說都是一件好事,但同樣這對于Arm來說也是一種挑戰,他們需要不斷疊代架構、硬體、軟體等方面的技術,讓生成式AI可以在Arm平台上更好地運作。

McNiven談到,針對生成式AI的到來,Arm針對AI推理和訓練優化了Arm CPU和GPU,并持續在架構中對一些新的指令和資料類型新增支援,此外,為了應對記憶體流量需求的激增,Arm也花費了大量時間優化資料流。

在生成式AI落地的過程中,異構計算成為了行業的主流,CPU、GPU、NPU需要互相協同,但實際上,有70%的第三方安卓ML工作負載都是在CPU上運作的,是以CPU仍然是AI時代計算的核心。

二、CPU、GPU性能能效提升,死磕AI能力,新軟體工具劍指AI落地

正如Arm進階副總裁兼終端事業部總經理Chris Bergey稱,Arm平台秉承了Arm DNA的能效理念,随着AI時代的加速發展,它正為下一波計算需求奠定根基,這也是Arm的核心競争力所在。

Arm全面計算解決方案(TCS)我們已經不陌生了,而此次推出的Arm終端CSS帶來了新的CPU與GPU,提升了性能、能效、對開發者軟體的支援以及AI方面的諸多能力,并首次為Arm CPU和GPU傳遞實體實作。

據了解,此次釋出的Arm終端CSS是迄今速度最快的Arm計算平台,提升了30%以上的計算和圖形性能,以應對要求苛刻的實際用例中的安卓工作負載,同時其AI推理速度提高了59%,可以更好地處理AI、ML和計算視覺工作負載。

McNiven在釋出會上特别強調稱,Armv9重點提升了在矢量加速、ML等領域的計算能力,并增加了面向AI的功能。

據稱,新Arm Cortex-X925實作了Cortex-X系列推出以來最高的同比性能提升,該CPU采用3nm工藝,主頻最高達到3.8GHz,配合微架構的改進,與2023年旗艦智能手機采用的4nm SoC相比,其單線程性能提高了36%。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

McNiven談道,Arm想通過命名的更改更清楚地呈現其與前代産品的不同——Cortex-X925是Cortex-X推出以來取得最高IPC同比增幅的CPU。

在AI性能方面,Cortex-X925的token首次響應時間提高了41%,這意味着如大語言模型等裝置端生成式AI的響應能力有明顯提升。

具體來看,Arm對微架構進行了重點改進,采用了迄今為止最寬的解碼和矢量設計,實作了50% TOPS數的增長。同時,Arm通過更強的可配置性和更大的私有L2緩存大小,保留進出過CPU的指令和資料。

GPU方面,新Arm Immortalis-G925 GPU在各款頭部手遊應用中實作了37%的性能提升,在多個AI和ML網絡上實作了34%的性能提升,此外,Arm Mali-G725和Mali-G625 GPU可以覆寫更多移動智能終端産品,比如智能手表和XR可穿戴裝置。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

在可擴充性方面,Arm的合作夥伴可以利用一系列不同的CPU和GPU選項,針對大螢幕計算、智能手機、數字電視和可穿戴裝置設計自己的解決方案。

在工具和軟體庫方面,Arm首次釋出了Arm Kleidi,其中包括面向AI工作負載的KleidiAI和面向計算機視覺應用的KleidiCV。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

據了解,KleidiAI是一套面向AI架構開發者的計算核心,讓開發者們能夠在各種裝置上輕松獲得Arm CPU上的最佳性能,支援Neon、SVE2和SME2等關鍵Arm架構功能。

KleidiAI與PyTorch、Tensorflow、MediaPipe等熱門AI架構內建,可以加速Meta Llama 3、Phi-3等關鍵模型的性能,并且還可前後相容,以確定Arm在引入更多技術時依然能适用未來市場的需求。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

在Arm看來,CPU是唯一可以確定運作未來網絡的計算引擎,是以Kleidi的解決方案都是為CPU建構的。Arm一直在将KleidiAI內建到各種架構中,從可以在任何裝置上運作任何網絡的通用架構到特定任務的點對點解決方案。

值得一提的是,Kleidi一詞來源于希臘語,意為“鑰匙”,即為開發者釋放更多性能的鑰匙。

三、AI PC浪潮湧起,WoA生态加速生長

值得一提的是,此次Arm重點提及了他們在Windows on Arm(WoA)生态系統中所取得的進展,這部分也歸功于AI PC的快速發展。

McNiven特别談到,對于WoA生态系統來說,今年是成果豐碩的一年。除了Microsoft Office、Dropbox、Zoom、Adobe套件,越來越多的應用正在成為Arm原生應用,尤其是百度、哔哩哔哩、Chrome浏覽器、愛奇藝、搜狗、騰訊QQ音樂等頭部應用。

Arm終端産品副總裁:當生成式AI與Arm的DNA相契合,會有怎樣的火花

此外還有許多針對創作者的開源工具,例如最近新增的Audacity、Blender和OBS Studio,這些應用整合了大量的開源庫和開發者工具。

Arm與微軟合作,通過資助開源和釋出面向Windows的Arm性能庫來發展生态系統。據了解,對于大多數使用者來說,他們絕大部分時間都在基于Arm CPU的AI PC上運作Arm原生應用。

在McNiven看來,新用例的湧現會為市場帶來新的活力,無論是在PC筆記本電腦、物聯網、基礎設施還是手機中,Arm希望任何有計算發生的地方都有Arm的技術。

AI用例的興起帶來無處不在的計算,這對Arm和合作夥伴而言都是一個很好的機會,生态系統對Arm而言至關重要。

結語:構築面向未來AI的計算平台,Arm先行一步

可以看到,Arm正将前沿的CPU和GPU技術、生産就緒的實體實作和持續的軟體優化相結合,Arm終端CSS結合Kleidi軟體,成為未來AI計算的優秀平台。

面向生成式AI的未來,移動智能終端産業必然将湧現出更多創新,Arm将如何通過技術創新保持自身的核心競争力并不斷壯大自身的生态,我們拭目以待。

繼續閱讀