第一章,阿裡技術架構演進
1、金融級系統的6個關鍵支撐目标:
a、高可用--實實在在的4個9。系統可以容忍各種硬體故障,可以在服務不中斷的情況下更新,關鍵系統,具備異地容災能力
b、安全 --及時,多層次檢測防禦安全攻擊 ,具備快速阻斷大規模有組織的攻擊
c、性能 --實時交易--并發能力,批量交易--吞吐能力,系統具備可伸縮,快速平行增加資源情況下滿足突發的業務量
d、成本 --單筆交易成本,峰值交易處理成本 作為關鍵名額進行成本優化。
e、資金安全 --交易與資料的強一緻性,具備準實時的交易資金核對能力。
f、資料品質 -- 資料的準确,完成和及時性。
2、OceanBase:金融級分布式資料庫
商業資料庫成本高昂,擴充困難。OceanBase已支撐了阿裡的核心交易及賬務系統。--建議嘗試使用。
3、全鍊路壓測:世界級的創新,幫助了阿裡充分評估自己的系統性能弱點及資源規劃,--建議嘗試使用。
4、單元化架構
單元化架構可實作異地多活-阿裡為三地四中心,并可動态擴充。
實作思路:系統單元化演進--把大系統拆分成相對獨立的小規模系統,每一個單元系統可以部署到任何地點的資料中心,實作異地多活。
單元化架構的關鍵特性:
a.自包含性--比如一次充值交易,涉及到的所有計算與資料都在一個單元内完成;
b.松耦合性--跨單元隻能進行服務調用,不能直接通路資料庫,在使用者體驗允許的情況下盡量采用異步處理;
c.故障獨立性--一個單元的故障,不能傳播到其他單元;
d.容災性--單元之間互相備份;
5,金融級中間件
6.彈性混合雲。
第二章,穩定,雙11的生命線
1,阿裡的全鍊路壓力測試,是個偉大的發明,可線上上進行真實的全鍊路壓力測試,實作關鍵:
a、線上資料的同步和建立,
b、壓力模型系統,
c、隔離系統,防止對線上交易的影響(流量隔離,時間控制(修改jdk8的jvm時鐘))
d、構造執行系統。
e、事後分析系統
關鍵原則:建立一套線上影子體系滿足流量隔離
2.實時業務審計系統(BCP)
目标:業務資料的正确性,保證系統可用性及業務正确
a.配套資料鍊路排查工具,trace産品--鷹眼系統,監控及定位問題。
b.資料修複平台--實作發現問題後的自動修複。
3、故障治理
重視系統間的依賴關系,任何非核心業務均可能影響核心業務。
故障治理有效手段:故障重制,故障演練,故障突襲。
3.系統自我保護,穩定性的最後一道牆
建立系統保護體系:
a、限流
b、非關鍵業務的自動降級
c、流量排程
d、負載保護
e、重視預案的力量
自動發現問題是根本,在人為不幹預的情況下自動處理,通過系統自我保護,讓問題自愈。
對于突發情況,預案的準備及執行的透明是關鍵
第三章,技術拓展商業邊界
花呗風控系統應用架構
注重壓力測試/應急預案 的重要性。
第四章,移動端的技術創新之路
1.weex的大規模應用:相容了H5和Native的優勢,優點:釋出快,流暢度高。建議推廣。
2.tmf架構演進:交易平台作為電商的核心平台之一,承載着各類電商業務,而這些業務之間的業務邏輯差異非常大,TMF平台則是對這些業務的抽象功能封裝,保證各類交易開發的一緻性,盡可能複用原有經驗。
基于TMF架構的交易平台架構
第五章,繁榮生态,賦能商家
1、聚石塔
--提供IT基礎設定及資料雲服務,連結淘寶開放平台,為商家個性IT需求進行支撐。
2、阿裡中間件産品系列
-- 解決如何使設計出的平台具備真正意義上的線性擴充能力,不管業務如何增長,平台都能快速的應對業務的通路。--aliware
3、螞蟻金服 金融機構間的協同運維的探索和實踐
日常運作時由多根專線分擔交易流量,對通信成功率的關鍵名額進行監控
--建立機構能力檢測平台:自動以真實的業務的要求向下遊系統及銀行機構發起交易流量,使用真實的卡和資金,測試完成後自動回流。
--機構間自動化運作管理:限流,根據政策,分析網絡/銀行出現異動的情況下,采用支付寶側攔截并引導使用者使用其他支付工具的方式。自動以秒計方式進行調整。