天天看點

剛剛,寒武紀釋出了首款雲端AI晶片MLU100:進軍伺服器市場

在人工智能技術的發展過程中,神經網絡正不斷邁向更深、更複雜的方向,而硬體則正朝着機器學習任務處理專用的道路前進。目前,國内已出現十餘家人工智能晶片公司,而寒武紀是其中的佼佼者。作為全球唯一一家 AI 晶片獨角獸,寒武紀于 2016 年誕生于中國科學院計算技術研究所,并率先推出了商用化的深度學習專用處理器 NPU(神經網絡處理器)。

其實,寒武紀科技的産品早已進入普通使用者的手中。去年 10 月,華為釋出了搭載全球首款「人工智能處理器」麒麟 970 的手機 Mate 10 系列(以及其後釋出的華為 P20、榮耀 V10 系列等),其晶片架構中就包含了寒武紀的 Cambricon-1A 神經網絡處理器。1A 也由此成為了全球首個成功商用的深度學習處理器 IP 産品。

寒武紀的智能處理器主要針對于人工智能領域計算機視覺、語音識别等方面的任務,面向智能手機、安防監控、可穿戴裝置、無人機和智能駕駛等各類應用。據稱,其專為神經網絡任務優化的架構可以使其達到傳統四核 CPU25 倍以上的性能。

與此前僅面向終端裝置的晶片 IP 不同,本次釋出會上,寒武紀推出的晶片不僅性能更強大,而且還出現了面向雲端伺服器等專業應用場景的産品。

第三代終端晶片:寒武紀 1M

首先是終端處理器部分。今天釋出的寒武紀 1M 是這家公司的第三代機器學習專用晶片,其性能超越此前廣泛使用的寒武紀 1A 十倍。去年 11 月 6 日,寒武紀在北京舉行了公司成立以來的首場釋出會,陳天石在會上披露了 1M 處理器的發展計劃。

在本次釋出會上,寒武紀 1M 處理器的具體參數終于展示在人們的眼前。1M 使用 TSMC 7nm 工藝生産,其 8 位運算效能比達 5Tops/watt(每瓦 5 萬億次運算)。寒武紀提供了三種尺寸的處理器核心(2Tops/4Tops/8Tops)以滿足不同場景下不同量級智能處理的需求,寒武紀稱,使用者還可以通過多核互聯進一步提高處理效能。

寒武紀 1M 處理器延續了前兩代 IP 産品(1H/1A)的完備性,可支援 CNN、RNN、SOM 等多種深度學習模型,此次又進一步支援了 SVM、k-NN、k-Means、決策樹等經典機器學習算法的加速。這款晶片支援幫助終端裝置進行本地訓練,可為視覺、語音、自然語言處理等任務提供高效計算平台。「這意味着使用 1M 的裝置可以根據使用者行為對應用進行個性化定制,」陳天石表示。「本地訓練同時也解決了使用者資料隐私的問題。它是全球第一款支援本地機器學習訓練的智能處理器産品。」據悉,該産品可應用于智能手機、智能音箱、攝像頭、自動駕駛等不同領域。

首款雲端智能晶片:MLU 100

在去年 11 月份的釋出會上,陳天石展示了伺服器級 AI 處理器 MLU 系列的發展計劃,寒武紀希望将自己的産品從神經網絡加速拓展到機器學習,以及更多任務中。本次釋出的又一大重點就是首次亮相的 Cambricon MLU 100 雲端 AI 晶片,以及以此為基礎的雲端智能處理計算卡。「在三年前,我們就開始了兩顆測試晶片的研發了。我們時刻準備着将自己的産品放入雲端。」陳天石表示。今天推出的産品正是寒武紀穩步推進的成果。

剛剛,寒武紀釋出了首款雲端AI晶片MLU100:進軍伺服器市場

MLU100 采用寒武紀最新的 MLUv01 架構和 TSMC 16nm 工藝,可工作在平衡模式(主頻 1Ghz)和高性能模式(1.3GHz)主頻下,等效理論峰值速度則分别可以達到 128 萬億次定點運算/166.4 萬億次定點運算,而其功耗為 80w/110w。與寒武紀系列的終端處理器相同,MLU100 雲端晶片具有很高的通用性,可支援各類深度學習和常用機器學習算法。可滿足計算機視覺、語音、自然語言處理和資料挖掘等多種雲處理任務。搭載這款晶片的闆卡使用了 PCIe 接口。

在釋出會上,寒武紀的合作夥伴們展示了基于寒武紀晶片的部分應用方案。其中聯想推出了基于 Cambricon MLU100 的伺服器 ThinkSystem SR650。該産品為 2U2 路機架式規格,支援兩個 MLU100 智能處理器計算卡。這款伺服器打破了 37 項伺服器基準測試的世界紀錄。

中科曙光也在釋出會上推出了基于 Cambricon MLU100 的伺服器産品系列「PHANERON」。這款伺服器可支援 2-10 塊寒武紀 MLU 處理卡,面向多種智能應用任務。其中 PHANERON-10 內建了 10 塊寒武紀人工智能處理單元,可以為人工智能訓練應用提供 832T 半精度浮點運算能力,在推理時提供 1.66P 整數運算能力。中科曙光表示,新一代伺服器可以在典型場景下将能效提升 30 倍以上。

科大訊飛也在釋出會上披露了與寒武紀的深度合作研發項目。

正如 MLU 的系列命名所示,寒武紀希望把旗下晶片的應用範圍由神經網絡(Neural network)擴充到機器學習(Machine Learning)的加速任務上。由于 IP 授權的方式利潤空間有限,進軍雲端市場或許是寒武紀作為新一代晶片公司發展的必然道路。

寒武紀表示,旗下的終端和雲端産品均原生支援寒武紀 NeuWare 軟體工具鍊,可以友善使用者進行智能應用的開發、遷移和調優。陳天石表示,寒武紀科技創立的初衷就是要讓全世界都能用上智能處理器。寒武紀本次提出了「端雲協作」的理念,這次釋出的 MLU100 晶片可以和此前寒武紀 1A/1H/1M 系列終端處理器進行适配,協同完成複雜的智能處理任務。

至此,寒武紀已經形成了覆寫智能終端裝置、自動駕駛以及雲端伺服器的 AI 智能晶片 IP 産品線。「寒武紀未來計劃釋出自己的程式設計語言,」陳天石說道,「我們希望自己的合作夥伴能夠基于這套軟體系統釋出自己的産品。」

機器之心專訪了寒武紀科技的創始人和 CEO 陳天石,他就一些我們感興趣的話題進行了解答。

機器之心:相對市場上已有的同類晶片,新的産品(MLU100)在設計上具備哪些優勢?

陳天石:MLU100 是寒武紀公司長期積累的成果,基于 Cambricon 指令集,在機器學習領域适用面廣。而且得益于寒武紀在微結構方面的創新,達到了最高每秒 166.4 萬億次定點運算的峰值。

機器之心:針對新一代晶片,寒武紀是否會推出相關軟體 API,和完整的解決方案?

陳天石:寒武紀公司從 2016 年起,逐漸推出了寒武紀 NeuWare 軟體工具鍊,實作對 tensorflow、caffe 和 mxnet 的 API 相容,并同時提供了寒武紀專門的高性庫,可以友善地進行智能應用的開發,遷移和調優。目前,由于寒武紀在終端的廣泛應用,已經有不少客戶在寒武紀 NeuWare 之上建構了他們的應用。

機器之心:有關産品定位的問題,您認為新的晶片會對目前已有的市場産生沖擊,還是會開拓出新的市場?直接對标的同類産品是什麼?

陳天石:寒武紀相信智能是一個快速增長的市場,我們願意和全世界的同行實作合作共赢。

機器之心:寒武紀在 2018 年選擇了「由端入雲」的發展方向,是出于什麼樣的思考?以及如何看待雲端計算的發展趨勢?

陳天石:端側的智能處理是非常重要的,因為端可以最快速的響應使用者的需求,能以非常低的功耗、非常低的成本、非常小的延遲,幫助使用者了解圖像、視訊、語音和文本。但是,雲側的智能處理可以把很多端的資訊彙聚在一起。比如,在一個城市中有大量的攝像頭,如果想要知道一個特定的物體在多個攝像頭間的運動軌迹,就需要在雲側進行智能處理。

另外,終端的資料量有限,隻能根據單個使用者的資料對機器學習模型進行微調。而雲可以看到大量使用者的資料。是以,雲端的智能處理在資料方面有其不可替代的巨大優勢,可以利用海量資料,訓練出非常強大的模型。

機器之心:寒武紀的産品線更新戰略是什麼樣的,多久推出一代新的晶片?

陳天石:寒武紀公司有着一支高效、執行力強的研發隊伍,以及一個穩定的技術路線圖,會以較快的速度不斷推出新的産品滿足市場的需求。寒武紀 2017 年 11 月釋出終端 IP 産品 1A 和 1H 的時候,就預告了今年 5 月份的新 IP 産品 1M,和雲端 MLU100 晶片。

機器之心:我們能否期待下一代消費級 NPU 的消息?

陳天石:我們通常不稱自己是 NPU,因為 Neural Processing Unit 把應用面限定在神經網絡上。事實上,寒武紀做的是 MLU(Machine Learning Unit),各種機器學習算法(包括神經網絡深度學習,也包括多種傳統機器學習算法)都能很好地支援。在終端,寒武紀這次釋出了 IP 産品 1M,前所未有的具備本地的訓練能力,這給終端使用者個性化、定制化、适配化的智能服務提供了應借鑒支撐。1M 的 PPA 也有很大的進步,可以達到 5Tops/W。

機器之心:寒武紀的新一代晶片(MLU 100)在推出之後将與哪些公司展開合作?

陳天石:這次釋出會上,曙光和聯想都推出了基于寒武紀的雲伺服器新産品。我們也在深入同各大雲計算企業深入合作

繼續閱讀