天天看點

天梭M13為何具有大型機水準的高可用性

天梭m13——不是大型機,可替代大型機

2016年底,浪潮隆重釋出了新一代關鍵應用主機天梭m13,天梭m13可擴充1000個以上的計算核心,48tb記憶體,具有承載傳統大型機應用的能力。從高端八路伺服器,到可替代小型機的天梭k1,再到可承載大型機應用的新一代關鍵應用主機天梭m13,天梭m13是浪潮高端戰略堅持step by step的結果,也形成了浪潮擁有面向關鍵業務計算三類應用場景的産品布局(商業智能分析、交易性關鍵應用、大型核心資料應用)。

天梭M13為何具有大型機水準的高可用性

在研制第一代八路伺服器天梭 ts850的時候,浪潮就開始了對大型機市場的調研,直到2016年,天梭m13研發成功,這款産品凝結了浪潮對大型機的認識、對技術的慎重考慮——将m13作為一個強資料一緻性的大規模交易系統來設計,以擴充性、可用性和靈活性為核心,實作可比、甚至超越大型機的整體技術水準。

天梭m13是迄今為止,我國自主研制的線上交易處理性能最強的單機伺服器系統,提供基于應用的優化器,并支援國内外主流的資料庫和應用平台,可以根據應用場景的差異性和特點,推薦硬體層和作業系統層的專家核心參數模闆,使用者可以根據業務需求進行靈活選擇。天梭m13能夠日處理業務幾十億筆,在實時資料分析、交易處理等各類應用場景中都具有良好的性能表現。

多層級ras設計保障系統三個“不停頓”

相比擴充性和性能,天梭m13在穩定性方面的提升更為顯著,達到了大型機的水準。穩定性源于多層級的ras設計,即可靠性、可用性和可服務性,旨在確定讓系統不出故障,即使一旦出現故障,要使之不影響、或者少影響系統運作,這不僅是一個複雜的技術問題,而是一個複雜的系統工程問題。

一方面,需要依靠産品設計的無缺陷、選用工業級器件、苛刻的品控和生産流程控制等來保證,另一方面,就是在資源故障發生時,甚至發生前,盡快将相關資源從系統中隔離出去,激活備用資源,或者将系統降級運作,不影響所承載業務的連續性,主要依靠不同層面的故障自處理技術和備援設計實作。

天梭M13為何具有大型機水準的高可用性

天梭m13采用了自頂向下的多層級ras設計方案,在硬體和作業系統層面具有專門的一體化智能診斷系統sfdp(system failover diagnosis & prediction,sfdp),應用層面,有k-rac高可用資料庫叢集方案,橫向擴充系統性能的同時,能夠很好的屏蔽單點故障,在資料中心層面,專業的異地雙活容災方案,當發生地震、水災、斷電等資料中心災害時,業務可以自動切換到異地系統中,保障業務連續性不中斷。

依靠全備援設計及專門的一體化智能診斷系統sfdp,天梭m13可以做到“硬體故障不停機、單點故障不停機、本地系統毀損不停機”三個不停頓,為使用者提供7*24 小時不停頓的核心業務保障。高可靠性、高可用性是天梭m13差別于一般伺服器的主要特征。

浪潮集團副總裁胡雷鈞表達了他對主機ras設計的了解:“通過一體化的設計,從最底層的硬體到固件,到作業系統,再到應用平台和上層應用,需要有一套貫穿上下的設計體系來維護系統的高效、高可靠和高安全性。這種一體化設計,上貫穿到應用,下貫穿到硬體的設計思想,實際是天梭m13差別于我們原先做的各種不同的高端伺服器的一個關鍵差異。”

sfdp系統:軟硬體一體化的智能診斷系統

sfdp是一套軟硬一體化的智能診斷系統,可以對多種事件源進行故障采集與檢測,如cpu、記憶體、網卡、pcie、以及死鎖、xfs檔案系統,配置可擴充的故障診斷引擎子產品,包括機器學習關聯算法、故障預測、運作時态健康分析,通過基于決策樹算法,支援多種容錯方式,并且支援以自學習的方式完善故障處理規則庫,包括緩存重新整理、寄存器禁用、硬體實體隔離、cpu和記憶體熱插拔等,進而有效處理各類故障。sfdp系統內建在各個部分,隻有一個統一的互動界面,就是作業系統的故障管理中心,故障管理中心可以檢視部件狀态、修訂故障預測規則等。

三個層面的sfdp

sfdp是保障天梭m13高可用性的主要系統,分為鍊路、部件和系統三個層面,形成了對天梭m13整體性的加強和保護。

鍊路層面,主要是自動糾錯,因為部件正常運作的過程中會有一定的錯誤機率,高溫、電磁幹擾、震動、鍊路失效等各種因素都可以引起資料失真,例如cpu的訪存高速信道,誤碼率一般不高于10-12,但是處理器主頻為1-3g赫茲,也就是每秒10億-30億次,錯誤發生的次數并不少,是以信号校驗、重傳這樣的措施必不可少的。天梭m13采用了連結級循環備援碼驗證,保證了資訊傳遞的完整性和一緻性,當信号在傳遞過程中出現失真等錯誤時,接收端就會發現驗證碼錯誤,讓信号重新傳遞,當重傳達到一定次數後,系統就會認為該信号通道錯誤,将其标記為失效,将信号傳輸功能指定給其他的信号通道,并記入日志,報警。

部件層面,所有部件均為備援熱插拔設計,包括雙電源平面備援、時鐘備援等。

系統層面則在sfdp系統的統一支援下,系統能夠及時偵測和預估部件的異常、故障,進行糾正或者隔離處理,當使用者更換故障部件後,系統會将新部件納入到系統中來。

高可用的兩個執行個體

sfdp對于不同層次、不同部件執行的檢測強度是不同的,對記憶體等核心部件檢測強度最高,因為記憶體錯誤和記憶體故障是引起系統停機的主要原因之一,目前通用伺服器的記憶體錯誤主要依靠ecc記憶體技術來處理(error checking and correcting,錯誤檢查和糾正),記憶體硬體失效主要依靠記憶體鏡像和熱備來解決。天梭m13不僅包括以上技術,還采用了浪潮開發的另外一項技術,imd(intelligent memory defender,智能記憶體保護)。imd是sfdp系統的一部分。首先,sfdp在系統開機時即對記憶體進行高強度的記憶體診斷,發現的錯誤單元将被屏蔽,不進入os可用記憶體區域。其次,sfdp在系統運作過程中,會實時監測每個記憶體單元的工作狀态,對報錯單元及其相關的記憶體單元進行針對性檢測,結合獨有算法預測,若判斷有發生緻命錯誤的趨勢,結合os主動進行隔離,預防記憶體故障導緻的系統錯誤,屏蔽後的記憶體單元/區塊根本不進入os可用memory,同時系統會根據所有的記憶體錯誤完善故障處理規則庫,實作自學習,而被屏蔽的記憶體線上更換之後,會自動進入系統運作。 所有的上述處理都不需要停機重新開機。

在實際應用中,固件更新失敗是一類少見、但是對于業務有着緻命殺傷力的故障。sfdp提供了一套核心級微碼的線上更新和自動回退方案,當一個控制器在更新失敗,sfdp就會啟用另外一個備用的控制器進行系統啟動,并将原控制器進行回退,重新更新,避免固件等底層代碼更新失敗對系統的影響。

1.  應用層面——單點故障不停機

應用層面,浪潮可以向使用者提供基于m13的多活緊耦合并行資料庫叢集,最高支援16個節點,叢集内部實作負載均衡,支援1對1等各種熱備政策,停機節點的任務會自動被熱備節點接管,因而任何一個甚至多個節點的故障,都不會影響業務運作。

天梭m13資料庫叢集所有的執行個體通過共享的資料庫運作,叢集架構對于上層應用完全透明,硬體系統的擴充不會帶來引用系統複雜性的增加。

2.  異地雙活容災——隔離資料中心災害

浪潮開發了基于m13的異地雙活容災方案,可以實作“兩地三中心”,m13采用了備援ptp,通過gps授時,提供秒脈沖來同步信号,可實作10微秒的精度,用于多資料中心時鐘同步,保障容災資料的時間一緻性,保障異地金融、股票業務的高頻交易時間一緻性。這套方案采用了多重技術來保證生産資料庫和備份資料庫的資料一緻性和完整性,容災複制系統在資料同步時,完全嚴格按照生産系統的生産資料庫中的交易順序和流程完成。同時,還在資料的一緻性方面提供友善快捷的資料比對功能,可以對系統中的資料進行嚴格的資料比對和檢驗。容災複制系統除了對主系統的dml進行複制之外,還對生産系統的所有ddl進行捕獲和複制,對主系統上的所有對象(如procedure、sequence、function、index、view、role、table等等)的變化都進行複制,以保證生産系統和備份系統的完全一緻,備份系統能夠完成業務的應急接管。

該方案同城雙中心為同步複制,資料實時同步,rpo=0,異地無距離限制,另外,該方案可以提供多種同步方式和保護方式,通常備用資料庫隻讀打開通路,包括報告、查詢、排序、基于web 的通路等,這樣既可以保障生産庫的性能,又可以充分利用災備端資料庫資源,保障業務安全的同時,也最大限度的提高了裝置使用率。

主機的高可用設計永無止境

目前,浪潮已形成了完整的關鍵業務計算布局,覆寫了不同規模的各類關鍵應用系統。天梭ts860g3等适合承擔各類商業智能分析系統;天梭k1可替代小型機,适合承擔交易型關鍵應用系統;天梭m13則可替代大型機應用,專門針對各類“大型資料應用”,例如銀行卡系統、個人信貸審批、會計系統、中央社保管理系統等。

天梭M13為何具有大型機水準的高可用性

胡雷鈞表示,這三類産品不僅性能、擴充性是依次提升的,可用性設計更是如此,每一類産品在研發過程中,針對客戶應用的技術需求,借鑒上一款産品的可用性設計,以不斷完善正在研發的版本。

ras特性是主機與一般伺服器的主要差別,同時也是主機設計的一個難題,業界産品在技術上普遍具備了超過99.99%的高可用性,但是銀行、保險、證券交易所等核心業務系統的當機事件仍時有發生。100%的可靠是不存在的,但卻是每一個主機研發人員所追求的,浪潮會從每一個點去完善和提高天梭系列關鍵應用主機的ras設計,面向對穩定性和可用性極高的關鍵行業的關鍵業務,提供極緻的高可靠、高可用的主機系統。

原文釋出時間為:2017年1月12日

本文來自雲栖社群合作夥伴至頂網,了解相關資訊可以關注至頂網。