天天看點

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

作者:雲科技時代雜志
如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

自從2021年2月履新英特爾公司的第八任CEO,帕特·基爾格(Pat Gelsinger)就從混合雲與計算軟體CEO轉而成為世界上最大的“芯公司”CEO。作為全球第一大晶片設計與制造商,英特爾自從1993年推出奔騰處理器以來,就一直占據了全球PC與伺服器晶片市場的第一大市場佔有率,近年來還向通信、物聯網、網絡、人工智能、5G、自動駕駛等領域進行持續的創新。然而,與微軟一樣錯過了移動時代的英特爾,能否在雲計算時代乘“雲”破浪?

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

在由阿裡雲主辦的2021杭州雲栖大會上,英特爾公司全面展示了自基爾格成為英特爾CEO以來的重大創新,以及與阿裡雲等超大規模雲服務商的深度合作成果。可以說,令人眼前一亮的“芯”成果,讓業界對“智”在混合雲與計算時代的英特爾又充滿了期待和信心!從混合計算到未來資料中心再到邊緣計算等硬體創新,以及AI、視覺、混合雲等軟體創新,可以看到基辛格給英特爾帶來的顯著變化,英特爾再次展示了從“芯”出發的“智”向與決心。

<h1 class="pgc-h-arrow-right" data-track="8">面向數字化的硬核創新</h1>

在2021杭州雲栖大會·“智在此芯 全棧賦能”英特爾論壇上,英特爾市場營銷集團副總裁中國區資料中心銷售總經理陳葆立,全面展示了全棧賦能混合雲與計算的英特爾創新架構與産品。所謂“全棧賦能”,就是從晶片架構基礎層面,對于混合雲與計算的各種場景進行全面的性能提升,甚至是新場景賦能。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

晶片架構決定了軟硬體體系,英特爾的晶片架構每年都會有更新,但今年的力度非常之大,堪稱一代晶片架構的大遷移。衆所周知,英特爾公司創始人戈登·摩爾在1965年提出了摩爾定律,在50多年後的混合雲與計算時代,業界普遍認為摩爾定律走到了天花闆,但英特爾公司不這麼認為。陳葆立強調,摩爾定律并不是一個實體定律,而是戈登·摩爾在最開始對英特爾和整個晶片制造業提出的一個目标,即相信以先進的制造技術可以達每18個月将內建電路上半導體的數量翻一倍,相應提升處理器的性能每兩年翻一倍。現在,英特爾公司的架構師在不停的思考和探索,通過不同的次元看晶片設計、提升晶片效率。

當今面向混合雲與計算時代層出不窮的新應用,18 個月算力翻兩倍的速度,已經無法跟上新應用的步伐。是以,英特爾從制程、連接配接、記憶體、軟體、架構等五個次元思考和探索,推動每個次元在未來三到四年之内将算力翻四倍,那麼五個次元就是4的5次方也就是1000倍性能的提升。這就是英特爾給自己設定新目标,即通過多元度推進,制造出更多算力,支撐未來各種新應用。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

如何實作未來三到四年算力提升千倍?這就是混合計算架構。英特爾從傳統CPU的Scalar張量計算引擎,到今天AI所需要的Matrix矩陣計算引擎以及更多計算類型所需要的Vector向量計算引擎和Spatial空間架構計算引擎等,形成了異構計算引擎架構,再搭配不同的制程、封裝技術,以及針對不同的計算工作負載搭配合适的緩存、記憶體以及連接配接,就可以在混合架構下形成許多種不同類型的計算産品,滿足各種需求。而當把單個計算核拼接在一起形成多核CPU時,每個計算核又可以承擔不同的功能,這就是全新的混合計算設計理念。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

在全新的混合計算架構設計理念下,英特爾對大家所熟知的X86晶片,英特爾又稱之為Performance Core,進行了大幅改進和性能提升,特别是新增了針對通用AI計算的New Matrix Engine,可勝任常見的人工智能推理計算,例如在幾萬張圖中找到想要查找的圖檔就可以用全新的Performance Core在秒級實作。而Efficient Core是針對多線程和多核心計算而優化的高效高性能核,可以針對雲計算環境中的輕量級并行多任務計算例如雲備份中的多文檔上傳,提供更高的效率與效能。Alder Lake就是結合了Performance Core和Efficient Core、面向下一代PC的産品,将在今年下半年上市。

在面向下一代資料中心方面,IPU(基礎設施處理器)是英特爾最新提出的處理器,用于幫助雲服務商降低成本、提高CPU性能。簡單了解,IPU就是将雲服務商的基礎設施功能都轉移到IPU上,進而釋放CPU的最大算力。IPU還能促進基礎資源的池化,讓CPU、GPU、記憶體等都在IPU的排程下池化,進而最大程度提高雲服務商的服務能力與降低成本,Mount Evants就是英特爾首款ASIC IPU産品,也是與一家頂級雲服務商合作的結果。

Ponte Vecchio是英特爾面向高性能和人工智能工作負載的新款GPU,該款GPU包含1000萬億個半導體,現有的工程晶片可達到每秒45萬億次的浮點計算,這已經是業界的天花闆了。英特爾也推出了适用于資料中心的下一代英特爾至強可擴充處理器——Sapphire Rapids,首次采用多拼接連接配接方式,帶來更多的核心,增加了很多加速引擎,包括人工智能加速引擎指令集AMX以及資料流Streaming指令集DSA等,DSA可以幫助雲服務商更高效的管理所有CPU核心、提高使用率。Sapphire Rapids還內建了很多創新的技術,為資料中心帶來更多的創新、更強的算力和更大的突破。

<h1 class="pgc-h-arrow-right" data-track="41">與超大規模雲的硬核合作</h1>

在重新思考摩爾定律的時候,英特爾也在回歸晶片的本質——用硬體工程化的方式解決算力和普惠計算問題。是以,與最終客戶在一起,共同思考最具普遍需求的計算問題,是進行創新的重要方式。英特爾就與阿裡雲這樣的超大規模公有雲合作,通過研究超大規模的計算問題,回歸創新本質、再造“芯”方向。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

英特爾傲騰持久記憶體就是為了解決資料中心的計算速度與持久存儲而誕生的新物種。英特爾傲騰持久記憶體具備大容量、經濟性和持久性等特色,能為多種資料中心計算場景帶來全新的改進,包括分析、資料庫和記憶體資料庫、人工智能、容器等。英特爾中國傲騰卓越創新中心工程部經理吳國安與阿裡雲彈性計算産品專家唐湘華在2021杭州雲栖大會英特爾論壇上介紹了雙方合作用英特爾傲騰持久記憶體推動雲基礎設施和雲應用創新的共同努力。

英特爾傲騰持久記憶體可以作為雲上基礎設施,服務于所有雲上客戶的應用創新,例如利用持久記憶體在虛機或容器中擴充記憶體容量或加速存儲。吳國安從兩個方向介紹了傲騰持久記憶體用于雲上創新。首先是針對計算或者額外開銷特别大的場景,例如網絡開銷等,可以使用傲騰持久記憶體取代記憶體,這樣在性能上面并沒有明顯損失,但TCO卻下降很多。第二個方向是IO占比非常大、也就是存儲占比大的場景,因為傲騰持久記憶體的基礎性能是SSD性能的幾十倍,是以可以用傲騰持久記憶體進行IO加速,進而大幅提升整體性能。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

對于第一個方向,利用傲騰持久記憶體加速Redis資料庫是一個典型的場景。Redis被評為2021年Top 1的Non-SQL記憶體資料庫,該資料庫在很多客戶中有大量應用。用傲騰持久記憶體取代記憶體,可以在Redis性能幾乎沒有損失的前提下,大幅降低TCO。當然,也可以不用傲騰持久記憶體完全取代DRAM記憶體,而是根據不同的業務場景進行一定的配比,對資料進行分層處理,例如對MemKeyDB進行分層處理。另外,阿裡巴巴自研的分布式緩存系統Tair,也采用了傲騰持久記憶體,進而有效降低成本、擴充記憶體。

對于第二個方向,用傲騰持久記憶體加速KV存儲是一個典型的場景。KV存儲是雲上很多應用的基礎,例如阿裡DeepRec推薦系統的參數就采用了基于傲騰持久記憶體的KV存儲,實作存儲加速。其它還有由英特爾支援的開源PMEMKV存儲、KVDK開發工具,以及由Facebook開源的RocksDB等。

唐湘華從産品落地層面,介紹了阿裡雲基于持久記憶體的雲上創新實踐。阿裡雲在很早之前就已經開始投入探索研究持久記憶體,阿裡雲是全球第一家基于持久記憶體推出雲伺服器的廠商,早在去年10月份就釋出了第一款的持久記憶體執行個體。經過去年一年的沉澱和打磨以及底層硬體架構的疊代,阿裡雲在今年對持久記憶體執行個體進行了全面的更新疊代——最新持久記憶體執行個體基于阿裡雲第三代神龍架構以及英特爾最新第二代持久記憶體BPS,相比上代産品的IO能力實作了翻倍、算力提升40%以上。

在産品層面,阿裡雲在今年進行了大膽創新,基于持久記憶體推出了高端本地盤執行個體産品i4p,相對于傳統的NVME本地盤執行個體,實作了根本性的性能提升,特别是高端本地盤的讀寫延時可以低至170納秒級别,而傳統NVME在10-30微秒左右,是以性能提升将近100倍以上。此外,高端本地盤的單盤IOPS高達140萬以上、單盤吞吐高達9GB/s,相對NVMe也有數倍的提升。由于高端本地盤在性能上的絕對領先,對于重IO的客戶應用場景來說,是極大的福音——傳統因為NVMe SSD性能不足帶來的性能瓶頸問題,在高端本地盤上得到了有效的解決,例如RocksDB資料庫性能提升2.5倍、Click House資料庫性能提升2倍、NSQ消息中間件業務恢複時間提升2-3倍、重IO應用延時和抖動得到有效抑制等。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

此外,阿裡雲還持續挖掘持久記憶體在記憶體方面的特性,與i4p同步推出了基于持久記憶體的記憶體型執行個體r7p和re7p。對于需要消耗大量記憶體的客戶來說,用持續記憶體取代記憶體就可以馬上獲得成本的收益。因為大容量内容非常貴,而且目前業界沒有其它雲服務商可以提供小規格大容量配比的執行個體,是以無法無限擴充記憶體,而隻能在性能與成本之間進行折中。阿裡雲看到持久記憶體可以解決這個問題,特别是一些應用經過了特定的改造,可以在性能幾乎無損的前提下,讓客戶獲得純成本收益,例如redis、Parameter Server等應用都可以達50%以上成本效益提升而且應用部署非常簡單,目前已經有很多阿裡雲客戶的應用跑在了持久記憶體上。

面對雲上層出不窮的應用,英特爾持久記憶體也不斷創新:第三代産品正在開發過程中,将有性能方面的極大提升;第四代産品采用了CXL接口,可以直接插在PCI-E總線上,與記憶體一起進行擴充。對于處理器核心數目的不斷增長,大記憶體需求将得到充分釋放;而網絡性能的增長則要求更高性能、更高壽命的存儲——這些都是持久記憶體發揮重要作用的創新場景。英特爾為了推廣持久記憶體,還推出了相應的應用開發程式設計書籍,幫助更多開發者利用持久記憶體進行創新。

<h1 class="pgc-h-arrow-right" data-track="42">智在此芯、軟硬兼施</h1>

DeepRec大規模稀疏模型訓練引擎是英特爾與阿裡巴巴合作的領先AI工程化系統,這是一個基于TensorFlow的推薦引擎。衆所周知,在阿裡巴巴的業務場景中有大量的推薦系統,而推薦系統的特征值十分稀疏,特别适合英特爾技術。DeepRec作為阿裡巴巴集團稀疏場景的統一訓練引擎,由集團多個團隊合作共建,從2016年深耕至今已經支援了淘寶搜尋、推薦、廣告等核心業務,同時也為阿裡雲客戶的推薦業務提供服務。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

由于阿裡巴巴推薦系統的特征值往往十分巨大,動辄達到百億、千億、萬億甚至十萬億的超大規模,那麼如何基于阿裡機器學習平台PAI和英特爾技術,實作業務的高效落地,就成為雙方要共同解決的挑戰。英特爾中國區超大雲計算軟體架構總監魏彬與阿裡雲智能進階産品專家黃博遠在2021杭州雲栖大會英特爾論壇上,介紹了雙方圍繞DeepRec引擎所做的努力。

黃博遠介紹,推薦系統具有極大的商業價值,但推薦系統的深度學習模型面臨着幾大挑戰:首先是模型特征值的處理,由于推薦模型特征值的變化非常快,需要動态處理而無法像傳統深度學習訓練那樣等一周或一個月才能訓練出一個模型;此外,由于超大規模的模型,在訓練過程中會遇到建構分布式架構、Runtime和編譯的優化、圖優化、算子優化等一系列的問題,而這一切優化都需要上層軟體與底層硬體以及硬體廠商提供的算子庫進行深度合作,是以PAI平台選擇與英特爾合作對DeepRec進行優化。

如何赢在混合雲與計算時代?解讀英特爾再度回歸芯“智”向面向數字化的硬核創新與超大規模雲的硬核合作智在此芯、軟硬兼施

魏彬介紹,英特爾與阿裡巴巴PAI機器學習平台團隊合作,為DeepRec完成了大量的優化,包括沉澱了大量算子優化、圖優化、Runtime優化、編譯優化,并基于硬體實作了深度定制優化,支援高性能分布式訓練,在稀疏模型的訓練方面有着優異的性能。例如:在算子優化方面,針對稀疏模型的典型算子優化,充分利用AVX512、BF16指令加速,還将大矩陣進行分塊,提升cache命中率,減少訪存開銷,實作算子加速2-6倍;在架構及庫優化方面,整合了最新的英特爾oneDNN加速庫,實作線程池排程優化,擷取最佳性能,還基于PEME持久記憶體進行優化等等。

目前,英特爾正與阿裡巴巴合作,推動DeepRec的開源,進而造福整個生态,讓更多的客戶可以獲得與阿裡巴巴同樣性能的推薦系統,進而在發展數字化業務中占得先機。

【全文總結】從2021杭州雲栖大會英特爾論壇,可以看出英特爾面向未來數字化場景進行底層硬體和晶片級創新的決心和能力。英特爾通過與阿裡雲這樣的世界頂級雲服務商合作,打開了從“芯”創新的思路與方向,同時在實際的超大規模業務打磨中,錘煉了從底層晶片到上層應用軟體的一體化創新與優化能力,找到了制勝混合雲與計算時代的路徑。是以,混合雲與計算時代,英特爾可期!(文/甯川)

繼續閱讀