MySQL資料庫是目前開源應用最大的關系型資料庫,有海量的應用将資料存儲在MySQL資料庫中。存儲資料的安全性和可靠性是生産資料庫的關注重點。本文分析了目前采用較多的保障MySQL可用性方案。
MySQL Replication
MySQL Replication是MySQL官方提供的主從同步方案,用于将一個MySQL執行個體的資料,同步到另一個執行個體中。Replication為保證資料安全做了重要的保證,也是現在運用最廣的MySQL容災方案。Replication用兩個或以上的執行個體搭建了MySQL主從複制叢集,提供單點寫入,多點讀取的服務,實作了讀的scale out。
圖1. MySQL Replication主從複制叢集
如圖一所示,一個主執行個體(M),三個從執行個體(S),通過replication,Master生成event的binlog,然後發給slave,Slave将event寫入relaylog,然後将其送出到自身資料庫中,實作主從資料同步。對于資料庫之上的業務層來說,基于MySQL的主從複制叢集,單點寫入Master,在event同步到Slave後,讀邏輯可以從任何一個Slave讀取資料,以讀寫分離的方式,大大降低Master的運作負載,同時提升了Slave的資源利用。
對于高可用來說,MySQL Replication有個重要的缺陷:資料複制的時延。在通常情況下,MySQL Replication資料複制是異步的,即是MySQL寫binlog後,發送給Slave并不等待Slave傳回确認收到,本地事務就送出了。一旦出現網絡延遲或中斷,資料延遲發送到Slave側,主從資料就會出現不一緻。在這個階段中,Master一旦當機,未發送到Slave的資料就丢失了,無法做到資料的高可用。
為了解決這個問題,google提供了解決方案:半同步和同步複制。在資料異步複制的基礎之上,做了一點修改。半同步複制是Master等待event寫入Slave的relay後,再送出本地,保證Slave一定收到了需要同步的資料。同步複制不不僅是要求Slave收到資料,還要求Slave将資料commit到資料庫中,進而保證每次的資料寫入,主從資料都是一緻的。
基于半同步和同步複制,MySQL Replication的高可用得到了質的提升,特别是同步複制。基于同步複制的MySQL Replication叢集,每個執行個體讀取的資料都是一緻的,不會存在Slave幻讀。同時,Master當機後,應用程式切換到任何一個Slave都可以保證讀寫資料的一緻性。但是,同步複制帶來了重大的性能下降,這裡需要做一個折衷。另外,MySQL Replication的主從切換需要人工介入判斷,同時需要Slave的replaylog送出完畢,故障恢複時間會比較長。
MySQL Fabric
MySQL Fabric是MySQL社群提供的管理多個MySQL服務的擴充。高可用是它設計的主要特性之一。
Fabric将兩個及以上的MySQL執行個體劃分為一個HA Group。其中的一個是主,其餘的都是從。HA Group保證通路指定HA Group的資料總是可用的。其基礎的資料複制是基于MySQL Replication,然後,Fabric提供了更多的特性:
失效檢測和恢複:Fabric監控HA Group中的主執行個體,一旦發現主執行個體失效,Fabric會從HA Group中剩餘的從執行個體中選擇一個,并将其提升為主執行個體。
讀寫均衡:Fabric可以自動的處理一個HA Group的讀寫操作,将寫操作發送給主執行個體,而讀請求在多個從執行個體之間做負載均衡。
圖2. Fabric
MHA
MHA(MySQL-master-ha)是目前廣泛使用的MySQL主從複制的高可用方案。MHA設計目标是自動實作主執行個體當機後,從機切換為主,并盡量降低切換時延(通常在10-30s内切換完成)。同時,由MHA保證在切換過程中的資料一緻性。MHA對MySQL的主從複制叢集非常友好,沒有對叢集做任何侵入性的修改。
MHA的一個重點特性是:在主執行個體當機後,MHA可以自動的判斷主從複制叢集中哪個從執行個體的relaylog是最新的,并将最新從執行個體的差異log“應用”到其餘的從執行個體中,進而保證每個執行個體的資料一緻。通常情況下,MHA需要10s左右檢測主執行個體異常,并将主執行個體關閉進而避免腦裂。然後再用10s左右将差異的log event同步,并啟用新的Master。整個MHA的RTO時間大約在30s。
MySQL Cluster
MySQL Cluster是一個高度可擴充的,相容ACID事務的實時資料庫,基于分布式架構不存在單點故障,MySQL Cluster支援自動水準擴容,并能做自動的讀寫負載均衡。
MySQL Cluster使用了一個叫NDB的記憶體存儲引擎來整合多個MySQL執行個體,提供一個統一的服務叢集。如圖三所示。
圖3. MySQL Cluster組成
MySQL Cluster由SQL Nodes,DataNodes,和NDB Management Server組成。SQL Nodes是應用程式的接口,像普通的mysqld服務一樣,接受使用者的SQL輸入,執行并傳回結果。Data Nodes是資料存儲節點,NDB Management Server用來管理叢集中的每個node。
MySQL Cluster采用了新的資料分片和容錯的方式來實作資料安全和高可用。其由Partition,Replica,Data Node,Node Group構成。
Partition:NDB一張表的一個資料分片,包含一張表的一部分資料。
Replica:一個Partition的拷貝。一個Partition可以有一個或多個Replica,一個Partition的所有Replica資料都是一緻的。
Data Node:Replica的存儲載體,每個Node存儲一個或多個Replica。
Node Group:一個Data Node的集合。
圖4. MySQL Cluster資料高可用
一個MySQL Cluster有4個Node,被分為了兩個Grou。Node1和2歸屬于Group0,Node3和4歸屬于Group1,。有一張表被分為4個Partition,并分别有兩個Replica。Partition0和Partition2的兩個Replica,分别存儲在Node1和Node2上,Pratition1和Partition3的兩個Replica分别存在Node3和Node4上。這樣,對于一張表的一個Partition來說,在整個叢集有兩份資料,并分布在兩個獨立的Node上,實作了資料容災。同時,每次對一個Partition的寫操作,都會在兩個Replica上呈現,如果Primary Replica異常,那麼Backup Replica可以立即提供服務,實作資料的高可用。
小結
本文分析了目前MySQL使用較多的幾種MySQL資料複制和高可用方案,從使用來看,MySQL Replication是使用最為廣泛的資料複制方案,因為是MySQL原生支援,針對其在不同場景下的一些缺陷,衍生出了半同步複制,強同步複制等資料高可用的方案。在此基礎之上,為了運維友善,MySQL Fabric和MHA應運而生,從不同的方向解決了主從切換時資料一緻性問題和流程自動化的問題。此外,随着分布式系統架構和方案的逐漸成熟。MySQL Cluster設計了全新的分布式架構,采用多副本,Sharding等特性,支援水準擴充,做到了5個9的資料庫服務品質保證。