zd至頂網伺服器頻道 06月21日 新聞消息: 擁有23年曆史的全球五百強超算榜第一次被徹底颠覆,美國已經不再是榜單上入選機型最多的國家——而中國在經曆了數十年的投資與技術研發之後,成功在上榜超算數量方面占據首位。
超級計算項目絕不僅僅是學術或者政府方面的努力成果,其中的每一個組成部分都是龐大裝置不可或缺的元素所在,包括為其編寫軟體、保持運作直至新的技術浪潮催動下一輪更新。而考慮到超算裝置對于軍方及本土産業的巨大促進作用,超級計算機也往往同政治有所關聯。是以,高性能計算之争成為美國、中國、歐洲以及日本之間的角力也在意料之中——這不僅是一種技術抗衡,更是地球上各大經濟體間的較量。
中國此前已經憑借全世界最強大的超級計算裝置登頂這份榜單,即由國防科技大學于2013年6月在廣東省國家超級計算機中心建構的至強與至強phi混合型裝置天河二号,其linpack高性能計算系統性能基準測試結果高達每秒33.86千萬億次。
天河二号在過去三年中一直位列超算榜榜首,但今天這一曆史地位開始面臨新的挑戰者——這台名為神威太湖之光的裝置坐落于無錫市國家超級計算中心,由國家并行計算機工程與技術研究中心打造,其理論性能峰值高達每秒125.4千萬億次,且已經在linpack測試中帶來了每秒93千萬億次的持續運作性能。
我們對神威太湖之光系統進行了深層剖析,并發現其與公布于2013年6月的天河二者有所不同——事實上,一直有人質疑後者隻是大量計算元件的規模化堆疊,中國政府投入巨額資金隻是為了在超算榜上掙得面子。
但根據目前我們掌握的情況,神威太湖之光系統是一台擁有自主架構的裝置,其中包括以神威公司risc處理器為基礎的創新型處理器設計,這也是中國十年來技術積累的重要成果。另外,神威處理器基于alpha 21164,這款risc晶片可能由digital equipment公司為其alphaserver系統于二十年前打造,但這一消息從未得到證明或者官方認可。
截至目前,我們了解的是神威處理器已經進行了三次換代,而且未來還可能在無錫繼續自己的更新之路。其中神威sw-1單核心處理器出現于2006年,主頻為900 mhz;sw-2為雙核心1.4 ghz;sw-3,亦被稱為sw1600,則為十六核心1.1 ghz。
此次于2016年6月公布的神威太湖之光超級計算機已經成為全球超算五百強榜單的新王者,其采用sw26010處理器——每塊處理器包含256個計算核心,外加4個管理核心,全部封裝在單一晶片之上,主頻則為1.45 ghz。這套系統共容納有40960個節點,總計算核心數量超過1060萬個,各核心總計共享1.31 pb記憶體。
就目前來看,神威太湖之光裝置将在一段時間内雄踞在超算五百強榜單之上,直到ibm、英偉達與mellanox technologies共同為美國能源部橡樹嶺國家實驗室打造的、預計于2017年上線的“summit”系統徹底竣工。這套裝置的峰值性能水準據稱可達到每秒150千萬億次,總節點數量為3500個。summit裝置将采用24核心power 9處理器,外加數量未知的“volta” gv100 tesla協處理器,同時配備每秒200 gb hdr infiniband互連機制。
另外,基于英特爾“knights hill”至強phi處理器的美國阿貢國家實驗室“aurora”系統也有望插進一腳,這套預計于2018年上線的裝置将再度超越summit,在超過50000個節點上提供約每秒180千萬億次計算能力。
可以看到,美國還需要相當一段時間才能重奪這場性能競賽的主動權,除非部分超大規模設施廠商與雲服務建構商也開始在自己的大型叢集上運作linpack基準測試。不過在這方面,中國企業也并非無所作為,是以從系統數量角度看美國恐怕也很難占到便宜。而諷刺的是,目前的落後局面很可能刺激美國乃至歐洲與日本在超級計算機領域投入更多研發資源。
在最近的榜單中,中國在超算五百強中占據167席,遠高于六個月前的109席。随着越來越多中國企業開始利用linpack測試自己的裝置性能,其不斷将衆多原有榜單成員擠出五百強。而目前美國在2016年6月的榜單中占165個席位,遠低于去年的233席與前年的256席。
長久以來,美國一直統治着全球超算五百強榜單,甚至在相當長的曆史時期内占據半數以上席位。2016年6月的排名中,歐洲裝置占得105個席位(與上年基本持平),其中德國上榜系統數量為26套,法國為18套,英國為12套。中國的強勁表現則大幅拉高了亞洲各國在榜單上的占比,不過日本由6個月前的37個席位削減至本次的29個。
而美國目前榜單上最為強大的系統仍然是橡樹嶺國家實驗室的“titan”超級計算機,由克雷公司打造,采用16核心amd皓龍6274處理器與英偉達tesla k20x gpu加速器,配合“gemini”互連技術,能夠在linpack基準測試中實作每秒17.6千萬億次持續性能表現。
titan曾于2012年11月在當時的全球五百強超算榜單中占據頭位,但七個月後即被中國的天河二号擊敗,又于此次伴随神威太湖之光的崛起落至第三位。
美國能源部勞倫斯·利弗摩爾國家實驗室的“sequoia” bluegene/q系統,其采用由ibm公司設計的bluegene架構,包含157萬個1.6 ghz計算核心與定制化3d環狀互連體系,能夠在linpack基準測試中提供每秒17.2千萬億次計算能力。而坐落于美國阿貢國家實驗室内的bluegene姐妹裝置mira系統在計算核心數量方面為前者的一半,性能自然也打了折扣,為每秒8.59千萬億次。
sequoia于2011年11月的榜單中曾一度名列首位,但很快在2012年被titan所超越,接下來又目送天河二号與神威太湖之光分别登上冠軍寶座。
位于sequoia與titan之間的則是k超級計算機,由富士通公司負責制造,目前坐落于日本日本理研進階計算科學研究所。其性能水準為每秒10.5千萬億次,使用sparc 64-viiifx處理器——八計算核心,主頻為2 ghz——同時采用tofu 5d定制化互連機制。順帶一提,這台裝置目前仍是linpack測試當中能源效率最高的方案,且安裝于五年多之前。
接下來,榜單十位的其它裝置全部由克雷公司打造,且采用其目前“aries”互連機制。其中trinity系統由洛斯阿拉莫斯國家實驗室與桑迪亞國家實驗室共同使用,這套克雷xc40系統采用16核心haswell至強e5-2698 v3處理器,能夠實作每秒8.1千萬億次處理性能。而piz daint則是一套xc30系統,采用8核心至強e5-2670處理器與英偉達tesla k20x gpu加速器,linpack測試成績為每秒6.27千萬億次計算能力。
hazel hen系統在本次榜單上位列第九,這套位于德國的系統擁有每秒5.64千萬億次處理能力的成績,使用12核心至強e5-2680 v3處理器。shaheen ii超級計算機位于沙特阿拉伯的阿蔔杜拉國王科技大學,配置有16核心haswell至強處理器,但總處理器數量低于trinity,性能水準為每秒5.54千萬億次。
考慮到超級計算中心一般第三到四年就會更新裝置,是以其中上榜的約五年期系統似乎已經有些過時。不過它們都顯示出了強大的生命力與處理性能,而且考慮到這類龐然大物的建構成本普遍超過2億美元,是以盡可能榨取其價值也在情理之中。
不過為了持續推進高性能計算中心的系統架構更新,各國紛紛投入巨額資源,也正因為如此全球五百強榜單也在不斷發生變化。但需要注意的是,目前這種更新速度已經開始放緩,因為依靠單一裝置實作極緻性能的作法在成本效益方面并不出彩。
千萬億次級别的裝置數量不斷增加,這得益于摩爾定律支援下的計算引擎與互連技術的進步。目前已經有95套系統在linpack基準測試中擁有超過1千萬億次的每秒處理能力,高于半年前的81套、一年前的68套、兩年前的37套以及三年前的26套。建構千萬億次級别的大規模系統确實變得更容易也更經濟,但我們還很難确定市場需求是否真的随之快速增長。另外值得一提的是,企業級資料中心與超級大規模基礎設施服務商也在擠占超算裝置的生存空間。
然而五百強榜單各系統的總體性能水準也在持續提升。2016年6月榜單中,全部裝置的計算能力總和為每秒566.7千萬億次,遠高于一年前的363千萬億次,兩年前的274千萬億次以及三年前的223千萬億次。另外,并發性系統——即跨叢集與mpp共享計算核心——的占比不斷增高,目前的平均共享水準為81995個核心,高于一年前的50495個,兩年前的43301個以及三年前的38700個。目前占據榜單首位的系統擁有數百萬個計算核心,未來的霸主則将擁有上千萬個核心。
另外值得注意的是,配合加速機制的裝置較上份榜單略有減少,由2015年11月的104套降低至83套。英偉達tesla業務部門已經實作了調整業務增長,是以榜單未能反映出這一點确實令人有些困惑。不過也可能是相當一部分用于機器學習的超大規模基礎設施消化了這部分産品,而其規模仍然無法與超算五百強相比肩。
另外,至強與至強phi系統間的分裂趨勢也非常有趣。許多混合系統會将二者分别建構在單一叢集内,而非将cpu與gpu共同塞進同一叢集節點。
毫無疑問,也有相當一部分裝置從來沒有運作過linpack測試,是以其性能雖然強大但卻無緣榜單。由克雷公司為美國國家超級計算應用中心打造的“blue waters”混合型cpu-gpu超級計算機,在峰值性能上可達到每秒13千萬億次以上,但我們從未聽說過其運作linpack基準測試。是以盡管這份榜單足以說明技術發展趨勢并幫助業界廠商制造系統、引導各國規劃發展方向,但其作為高性能計算系統的排名仍然不夠全面。
原文釋出時間為:2016-06-21
本文作者:畢波
本文來自雲栖社群合作夥伴至頂網,了解相關資訊可以關注至頂網。