天天看點

《盡在雙11》--阿裡巴巴技術演進與超越 讀書筆記

第一章,阿裡技術架構演進

1、金融級系統的6個關鍵支撐目标:

a、高可用--實實在在的4個9。系統可以容忍各種硬體故障,可以在服務不中斷的情況下更新,關鍵系統,具備異地容災能力

b、安全 --及時,多層次檢測防禦安全攻擊 ,具備快速阻斷大規模有組織的攻擊

c、性能 --實時交易--并發能力,批量交易--吞吐能力,系統具備可伸縮,快速平行增加資源情況下滿足突發的業務量

d、成本 --單筆交易成本,峰值交易處理成本 作為關鍵名額進行成本優化。

e、資金安全 --交易與資料的強一緻性,具備準實時的交易資金核對能力。

f、資料品質 -- 資料的準确,完成和及時性。

2、OceanBase:金融級分布式資料庫

  商業資料庫成本高昂,擴充困難。OceanBase已支撐了阿裡的核心交易及賬務系統。--建議嘗試使用。

3、全鍊路壓測:世界級的創新,幫助了阿裡充分評估自己的系統性能弱點及資源規劃,--建議嘗試使用。

4、單元化架構

單元化架構可實作異地多活-阿裡為三地四中心,并可動态擴充。

實作思路:系統單元化演進--把大系統拆分成相對獨立的小規模系統,每一個單元系統可以部署到任何地點的資料中心,實作異地多活。

單元化架構的關鍵特性:

a.自包含性--比如一次充值交易,涉及到的所有計算與資料都在一個單元内完成;

b.松耦合性--跨單元隻能進行服務調用,不能直接通路資料庫,在使用者體驗允許的情況下盡量采用異步處理;

c.故障獨立性--一個單元的故障,不能傳播到其他單元;

d.容災性--單元之間互相備份;

5,金融級中間件

6.彈性混合雲。

第二章,穩定,雙11的生命線

1,阿裡的全鍊路壓力測試,是個偉大的發明,可線上上進行真實的全鍊路壓力測試,實作關鍵:

a、線上資料的同步和建立,

b、壓力模型系統,

c、隔離系統,防止對線上交易的影響(流量隔離,時間控制(修改jdk8的jvm時鐘))

d、構造執行系統。

e、事後分析系統

關鍵原則:建立一套線上影子體系滿足流量隔離

2.實時業務審計系統(BCP)

目标:業務資料的正确性,保證系統可用性及業務正确

a.配套資料鍊路排查工具,trace産品--鷹眼系統,監控及定位問題。

b.資料修複平台--實作發現問題後的自動修複。

3、故障治理

重視系統間的依賴關系,任何非核心業務均可能影響核心業務。 

故障治理有效手段:故障重制,故障演練,故障突襲。

3.系統自我保護,穩定性的最後一道牆

建立系統保護體系:

a、限流

b、非關鍵業務的自動降級

c、流量排程

d、負載保護

e、重視預案的力量

    自動發現問題是根本,在人為不幹預的情況下自動處理,通過系統自我保護,讓問題自愈。

對于突發情況,預案的準備及執行的透明是關鍵

第三章,技術拓展商業邊界

花呗風控系統應用架構

注重壓力測試/應急預案 的重要性。

第四章,移動端的技術創新之路

1.weex的大規模應用:相容了H5和Native的優勢,優點:釋出快,流暢度高。建議推廣。

2.tmf架構演進:交易平台作為電商的核心平台之一,承載着各類電商業務,而這些業務之間的業務邏輯差異非常大,TMF平台則是對這些業務的抽象功能封裝,保證各類交易開發的一緻性,盡可能複用原有經驗。

基于TMF架構的交易平台架構

第五章,繁榮生态,賦能商家

      1、聚石塔

--提供IT基礎設定及資料雲服務,連結淘寶開放平台,為商家個性IT需求進行支撐。

      2、阿裡中間件産品系列

-- 解決如何使設計出的平台具備真正意義上的線性擴充能力,不管業務如何增長,平台都能快速的應對業務的通路。--aliware

3、螞蟻金服 金融機構間的協同運維的探索和實踐

     日常運作時由多根專線分擔交易流量,對通信成功率的關鍵名額進行監控

--建立機構能力檢測平台:自動以真實的業務的要求向下遊系統及銀行機構發起交易流量,使用真實的卡和資金,測試完成後自動回流。

--機構間自動化運作管理:限流,根據政策,分析網絡/銀行出現異動的情況下,采用支付寶側攔截并引導使用者使用其他支付工具的方式。自動以秒計方式進行調整。

繼續閱讀