天天看點

雲上資料庫容災解決方案

容災系統是指在相隔較遠的異地,建立兩套或多套功能相同的IT系統,互相之間可以進行健康狀态監視和功能切換,當一處系統因意外(如火災、地震等)停止工作時,整個應用系統可以切換到另一處,使得該系統功能可以繼續正常工作。容災技術是系統的高可用性技術的一個組成部分,容災系統更加強調處理外界環境對系統的影響,特别是災難性事件對整個IT節點的影響,提供節點級别的系統恢複功能。

目前常見的容災方案基本上模式比較簡單:

1、資料庫冷備:每天備份一次資料庫,儲存在錄音帶或CD光牒上;

2、雙機本地熱備:共享磁盤陣列,陣列做RAID(備援校驗),即一份資料存在不同盤陣上并多存幾份,保證壞一個盤不影響資料讀寫;

3、資料庫熱備:建立資料庫災備中心,與主庫實時進行資料同步,同時應用系統保持檔案實時同步,保證引用系統版本最新

雲上資料庫容災解決方案

資料問題導緻需要進行資料恢複

起因:

程式Bug,資料被污染;

誤操作,資料被删除。

需求:

資料可備份;

資料可恢複。

故障或災難發生後應用持續可用

機房發生故障;

城市級别的自然災害。

應用具備同城容災能力;

應用具備異地容災能力。

靠底層存儲來解決一切問題

雲上資料庫容災解決方案
雲上資料庫容災解決方案

RTO:是一個系統宕了之後多久恢複到應用恢複可用的時間目标

RPO:是一個應用的資料從最後一個備份到災害事件發生的時間,是應用容許丢失的資料目标,但以時間次元衡量

雲上資料庫容災解決方案
雲上資料庫容災解決方案
雲上資料庫容災解決方案

實施要點:

1、選擇合适的備份方式

2、確定正确的資料保留政策

3、確定資料的安全,包括加密和通路控制

4、周期的進行恢複測試

雲上資料庫容災解決方案

準備工作要點:

1、確定應用系統所需要的軟體包在阿裡雲都具備

2、對于關鍵的伺服器叢集建立ROS模闆

3、考慮自動化的建立雲上的資源

涉及産品:

ECS、RDS、DTS、ROS

雲上資料庫容災解決方案

恢複工作要點:

1、通過ROS模闆啟動雲上的ECS資源

2、更新資料庫的規格以适配新增的處理能力要求

3、修改DNS記錄指向災備環境SLB 

4、安裝和配置不在ROS模闆内的系統和應用

雲上資料庫容災解決方案

1、建立并維護ROS模闆

2、在阿裡雲ECS上運作最小化版本的應用環境

3、及時同步生産環境的更新檔、軟體更新以及配置檔案到雲上的環境

4、考慮自動化建立雲上的資源

SLB、ECS、RDS、DTS、ROS

雲上資料庫容災解決方案

1、增加ECS伺服器的數量應對真正的生産負載(水準擴充)

2、對于無法通過水準擴充的應用,加大ECS的規格,完成負載能力的提升(垂直擴充)

3、修改DNS記錄到災備環境SLB

4、更新資料庫的規格以适配新增的應用負載

SLB、ECS、RDS、ROS

雲上資料庫容災解決方案

1、在雲上建立與生産環境一緻的應用環境

2、設定DNS的權重,配置設定流量到兩個不同的環境,建立自動failover的流量配置設定機制

雲上資料庫容災解決方案

1、手工切換dns記錄,或者通過DNS的failover機制自動将所有流量全部切到雲上環境

2、切換App伺服器的資料庫調用到雲上本地資料庫

3、考慮自動擴充雲上環境的規模與規格以适應新增的負載

同城容災:同城不同IDC機房之間的斷網斷電容災等。

異地容災:單元或者區域不可用下的服務重路由。中心容災。

ADHA叢集:用于保障同城主備之間的高可用性。

雲上資料庫容災解決方案
雲上資料庫容災解決方案

在業務流量切換之前,必須參考異地複制時延;

引入禁寫規則,對于之前在源地域的業務使用者,進行短時間禁寫;

流量切換後,等異地同步時延消除後,放開禁寫規則;

基于其它原因,在未消除時延情況下開起的禁寫,需要在業務層面引入對帳系統;

基于其它原因,在未消除時延情況下開起的禁寫,需要在資料庫層面引入安全複制技術(如前鏡像比對)等。

雲上資料庫容災解決方案

方案優勢:

1、雲DNS提供智能解析、友善流量配置設定或容災切換。

2、提供VPC之間的高速通道,提供統一釋出、部署、配置變更等工作

3、産品化提供OSS不同區域之間的非結構化資料copy

4、通過資料傳輸服務(DTS)提供不同區域之間的結構化資料同步

技術架構

雲上資料庫容災解決方案

當DTS服務節點/叢集/站點出現故障時,傳輸任務會自動透明的切換至健康的節點/叢集/站點,業務無感覺

自動斷點續傳機制,在網絡/資料源/DTS元件出現故障時,DTS會記錄斷點,在從故障恢複後,會從斷點開始,繼續傳輸任務

雲上資料庫容災解決方案
雲上資料庫容災解決方案

容災的分類和選擇有很多。在阿裡雲平台實作容災,可以實作更細粒度的控制,可以通過更多已經産品化的功能子產品實作容災,提供更好的RPO、RTO,更高的成本效益。阿裡雲的是按需使用的服務,僅僅需要為您正在使用的服務和規模付費,這對容災一個非常大的優勢。

對容災而言,需要資源時,很重要、要求快速提供,但僅僅是在災難事件發生時才需要,雲恰恰就符合這個特點:

無論你用或者不用,雲就在那裡。