第三輪人工智能浪潮經過幾年的發展,今年在業界聽到最多的詞就是“場景”。在科技界,AI技術逐漸成熟;在應用界,對AI的價值逐漸認可。人工智能産業進入了技術兌現、技術紅利的關鍵階段。
AI快速增長的背後,是算力指數級的增長。在今年2021人工智能計算大會(AICC2021)上,IDC聯合業界上司廠商浪潮資訊一起釋出《2021-2022中國人工智能計算力發展評估報告》(以下簡稱:報告),IDC已經連續第四年對AI算力進行分析,透過資料看到了明顯的變化。
“第一是政策上越來越重視,而且國家開始投資做智算中心了。第二是應用方面的落地比以前越來越成熟。第三是算力本身相比幾年前有了很大的提高。”IDC企業研究助理副總裁周震剛表示。
中國工程院院士、浪潮首席科學家王恩東
從技術成熟度曲線來看,人工智能處于一個穩步爬升期。算力作為AI發展的支撐,“計算産業面臨着多元化、巨量化、生态離散化交織的趨勢與挑戰。” 中國工程院院士、浪潮首席科學家王恩東認為,一方面多樣化的智能場景需要多元化的算力,巨量化的模型、資料和應用規模需要巨量的算力,算力已經成為人工智能繼續發展的重中之重;另一方面從晶片到算力的轉化依然存在巨大鴻溝,多元算力價值并未得到充分釋放。如何快速完成多元晶片到計算系統的創新,已經成為推動人工智能産業發展的關鍵環節。
吃AI紅利,透過算力看潛力
AI的價值不僅在于其技術本身,而是AI賦能傳統産業帶來的社會經濟全面更新。全球各國都在加速AI布局,已有60多個國家和地區出台人工智能政策,釋出國家級AI 戰略。其中,美國和中國在AI的發展上領跑全球。
對于AI的發展,算力就像是之前的電力一樣,是智能時代的支撐,賦能數字經濟的方方面面。可以說,算力在一定程度上決定AI的進度。IDC 預測,2021 年全球企業在人工智能軟體、硬體和服務的總投資将超 850 億美元;預計将在2025年增至2,045億美元,五年複合增長率(CAGR)達24.5%。全球科技巨頭未來會持續加大算力的投資,以亞馬遜、Facebook、谷歌、阿裡、騰訊、百度為代表的頭部企業在基礎設施的投資規模将超過全球的一半。IDC 預測,到 2025 年,全球排名前八位的CSP将消耗50%以上伺服器和存儲基礎架構。
中國科技産業起步較晚,過去幾十年在很多領域都處于跟跑階段。AI是一個全新的機遇,也是中國科技産業反超的機會,中國起點不低。同時通過AI賦能傳統産業也是中國經濟轉型的機會點,無論是科技産業還是傳統産業,對AI的發展都充滿期待。
算力已經成為數字時代的核心生産力,是拉動數字經濟向前發展的新動能。對于AI算力的投入,也将加快人工智能這一重要的數字化技術與實體經濟的融合,賦能傳統産業轉型更新,催生新産業新業務新模式,為我國數字經濟做強做優做大做出應有的貢獻。IDC認為,擁有較高算力基礎建設能力的企業/組織或國家,将更有可能在人工智能帶來的紅利中更多地獲利。
從算力的角度來評估,中國伺服器廠商成為全球伺服器市場的中堅力量,特别是浪潮資訊在全球AI伺服器的市占率位居第一。受疫情影響,中國伺服器市場仍保持高增長勢頭,IDC 最新釋出的《全球人工智能市場半年度追蹤報告》顯示,中國人工智能伺服器頭部廠商市場規模同比增長率可超 50%。顯然,在AI算力方面中國是有一定優勢的。接下來就是把算力轉化為潛力,吃到AI紅利。是以報告中通過對算力的評估分析了一些城市、行業的AI程度,透視其潛力。
從城市來看,各個城市間人工智能角逐加劇,算力基礎設施是重要競争力。2021年中國人工智能城市排行榜,排名前五城市依次為北京、杭州、深圳、南京,上海。與2020年相比,南京進入前五,濟南進入前十名。在這個排名中我們看到南京處于很靠前的位置,這正是由于當地政府的重視,一方面針對AI的發展出台了一系列的産業規劃,另一方面是在南京落地了長三角地區規模最大、算力最強的智能計算中心,提供公共性的AI算力服務,幫助當地企業實作AI應用加速落地,為城市人工智能産業化發展提供高速通道。
從行業角度來看,算力的行業滲透與行業的智能化程度緊密相關。在中國市場,網際網路行業滲透度第一,這與阿裡、位元組、騰訊這樣的網際網路企業對于AI的應用密切相關。接下來是金融行業人工智能應用速度加快并超過政府行業,位列第二。制造、交通和能源行業在人工智能的應用也更加深入,分列第五、第七和第九位。相比去年,人工智能在各個行業的滲透度都在增加。
最有啟發的資料是,采用人工智能三年以上的企業,已經獲得顯著收益,被訪企業平均收入增加9.8%、流程時間縮短20.4%、生産效率提升21.6%。顯然,早期部署AI的企業已經吃到紅利,取得超出行業整體的增長速度。
系統創新彌補多元晶片與算力之間的鴻溝
王恩東院士從AI發展的洞察中看到三大趨勢和挑戰:多元化、巨量化、生态離散化。計算産業的這三大趨勢造成兩大鴻溝:一是多元化晶片與巨量算力之間,二是算力與智能場景落地之間。跨越這兩道鴻溝,是行業穩定爬坡進入快速增長通道的必然選擇。
AI的爆發不僅是算力的線性增加,人工智能應用需求日漸豐富,催生晶片多元化發展。2020年以GPU為代表的AI加速晶片所傳遞的計算力總和已經超過了通用CPU,預計到2025年,加速晶片所提供的計算力可能超過80%。
此外,GPU依然是資料中心加速的首選,占有90%以上的市場佔有率,與此同時ASIC、FPGA和NPU等其他晶片也在各個領域被越來越多地采用。而ASIC,FPGA,NPU等其他非 GPU 晶片也在各個行業和領域被越來越多地采用,整體市場佔有率接近 10%,預計到 2025 年其占比将超過 20%。
“晶片多元化為産業AI化的加速提供了重要的産業基礎和更加豐富的選擇。但是,晶片從造出來到大規模用起來,還存在巨大的産業鴻溝。”王恩東表示,多元算力價值并未得到充分釋放,将百花齊放的AI晶片轉變成一個通用性強、綠色高效、安全可靠的計算系統,已經成為推動人工智能産業發展關鍵破局環節。
當然這也是非常難的一道門檻。我們知道,AI晶片在單一計算系統中往往高密度內建,帶來系統功耗、總線速率、電流密度的不斷提升,AI計算系統的設計面臨巨大挑戰。例如一台浪潮AI伺服器,需要整合超過10000個零部件,包含50多類專用晶片、30多個技術方向以及100多種傳輸協定,涉及到材料、熱力學、電池技術、流體力學、化學等一系列學科;需要經曆30多個流程、150多種加工和制造的工藝、280多個關鍵過程的控制點,如何確定整個系統的可靠性是一個非常精細且複雜的工程。
王恩東院士用一個生動形象的比喻,來類比計算系統創新的難度:“從火箭發動機到運載火箭,要在循環、控制、結構等很多領域做大量的工作。晶片到計算系統同樣如此,需要完成體系結構、信号完整性、散熱、可靠性等大量系統性設計工作。”
也就是說,上遊有很多晶片企業,研發出各類很牛的晶片,但是把這些晶片有機地組合實作強算力進而對下遊應用實作支撐,這中間的挑戰非常之大,這也是浪潮這類企業最大的價值所在。
浪潮資訊副總裁、浪潮資訊 AI&HPC産品線總經理劉軍對此做了更詳盡的解釋:智算時代,每一個特定應用場景的計算特點不同,資料量都非常大,按照傳統通用的計算晶片模式,計算效能相對比較低,是以需要針對特定領域的應用去做智算架構的創新,多元AI晶片繁榮從産業本質上成為發展的驅動力。
浪潮作為一個平台廠商通過兩個方面的努力來抹平這道鴻溝。
一是算力平台本身,要支援不同的晶片,能夠有一個非常高性能、強壯的平台來統一容納各種晶片,提供晶片之間的高速交換、節點之間的高速資訊連通,“浪潮現在是唯一一個能夠設計、研發、支援八顆國産最高端的AI晶片在一個系統裡面進行高速互聯的AI伺服器的廠商。”劉軍表示。在AI算力平台方面浪潮一路領跑,以先進的技術換來全球市場佔有率第一的地位。
二是軟體層面,每一顆晶片都需要與客戶的應用對接,這就意味着使用者要為不同的AI晶片構築新的煙囪系統。浪潮的AI開發服務平台AIStation建構了一個支援多元異構AI晶片的規範接口的标準,目前已經接入了國内外六家公司的12款AI晶片,可以在一個資源平台上面實作高效管理多元的AI晶片,這就給客戶最終使用帶來極大的友善,他們隻需要聚焦于自己業務的創新,不需要為底層多元算力分散精力,進而大大提升了創新的效率。
“浪潮将發揮算力平台上司廠商的作用,建立起多元AI晶片和産業AI化之間的橋梁。”劉軍表示。
“源1.0”填補算力與應用之間的鴻溝
人工智能那麼好,但是怎麼跟客戶的業務、應用場景結合?一面是轟轟烈烈在發展的AI技術,一面是迫不及待想通過AI創新的企業。“我們發現很多科學家在用不同領域的模型去解決問題,但當場景或者資料發生了變化,就要推倒重來,大大影響了産業落地速度。”劉軍認為在AI技術與應用場景之間的鴻溝主要是來自通用性的挑戰,大多數AI模型都隻能用于某一特定領域,通用性不強,限制産業AI化程序。
人工智能如何發展出像人類具備邏輯、意識和推理的認知能力,是人工智能研究一直在探索的方向。“目前來看,通過大規模資料訓練超大參數量的巨量模型,被認為是非常有希望實作通用人工智能的一個重要方向。”王恩東院士認為,随着巨量模型的興起,巨量化已成為未來人工智能發展非常重要的一個趨勢。
近年來人工智能的發展,已經從“大煉模型”逐漸邁向了“煉大模型”的階段,全球知名的AI領先公司在巨量模型上都予以重兵投入。這兩年大模型這個概念特别熱,谷歌、微軟、英偉達、浪潮、智源研究院、百度、阿裡等公司相繼推出了各自的巨量模型。顯然,“巨量資料、巨量算法和巨量算力”正在成為邁向通用人工智能的重要路徑。
其中浪潮人工智能研究院釋出的“源1.0”緻力于打造最“博學”的中文AI模型, “源1.0”的單體模型參數量達2457億,超越美國OpenAI組織研發的GPT-3,是目前全球最大中文巨量模型,占據權威中文語言了解測評基準CLUE的零樣本學習(zero-shot)和小樣本學習(few-shot)2項榜單榜首。
“原來的(AI)方式,我們培養了很多隻會擰螺絲的人或者是隻會敲錘的人。今天我們練出來是一個八級的鉗工,你隻要稍微示範一下他就都會幹,并且幹得比别人還出色。”劉軍這樣形象的比喻“源1.0”的價值。“源1.0”聚合了AI最強算力平台、最優質的算法模型開發能力,将支撐和加速行業智能的建構,最終幫助使用者完成業務智能轉型更新,以具備通用性的智能大模型成就行業AI大腦。
在懂懂看來,以“源1.0”為代表的大模型的價值點就在于可感覺、自學習、可進化的能力,這将大大加速AI的場景化落地程序。以前AI是低效、繁瑣的,而有了大模型,AI将進入高效工業化階段,快速普及。IDC報告也認為,算法模型發展愈加複雜,巨量模型将是規模化創新的基礎,“源1.0”等巨量模型的出現,讓建構大模型、提升AI處理性能成為發展趨勢。
大模型提供了AI工業化程序的工具,解決了巨量化的挑戰,但在真正落地時還有一個挑戰就是與場景的深度結合。每個行業、每個企業的場景千差萬别,大模型是AI領域的科學家開發,而與實際業務對接則需要大量的真正懂行業、懂應用的各領域專業人才來落地。來自埃森哲的一份調研報告顯示,70%以上有技術的研究機構、科技公司缺需求場景、缺領域知識和資料,70%以上的行業使用者缺技術人才、缺AI平台和實踐能力。
為了徹底填平AI算力與AI應用之間的鴻溝,浪潮采用開放開源的理念,“源1.0”将以開放API、開放資料集、開源代碼等多種形式為業界提供開放合作,相關高校和科研機構、産業夥伴及智能計算中心使用者可基于“源1.0”模型探索算法創新以及開發各類智能化應用。
浪潮在大家的印象中是一家做伺服器的企業,為什麼會涉足大模型?事實上,浪潮本質上是希望通過算力去推動産業、經濟的發展,而作為硬體的伺服器隻是其産業形态之一。産業在進化,AI産業化、産業AI化,對大模型提出迫切的需求,而作為浪潮這樣一家平台型企業,向下有多元晶片合作夥伴,向上有千行百業的客戶,做大模型可以順利地将AI算力與應用場景之間打通。“第一,産業需要。第二,我們不幹,誰來幹呢?”在劉軍看來,浪潮做大模型是一件水到渠成的事。
其實上,AI就是處于這樣一個演進的過程中,需要更多浪潮這樣的企業,承擔起更多的責任,填補一個一個鴻溝,AI産業化、産業AI化才會真正加速到來。