天天看點

這可能是史上最全 Redis 高可用解決方案總結

本文主要針對 Redis 常見的幾種使用方式及其優缺點展開分析。

一、常見使用方式

Redis 的幾種常見使用方式包括:

1. Redis 單副本;

2. Redis 多副本(主從);

3. Redis Sentinel(哨兵);

4. Redis Cluster;

5. Redis 自研。

二、各種使用方式的優缺點

1、Redis 單副本

Redis 單副本,采用單個 Redis 節點部署架構,沒有備用節點實時同步資料,不提供資料持久化和備份政策,适用于資料可靠性要求不高的純緩存業務場景。

這可能是史上最全 Redis 高可用解決方案總結

 優點:

架構簡單,部署友善;

高成本效益:緩存使用時無需備用節點(單執行個體可用性可以用 supervisor 或 crontab 保證),當然為了滿足業務的高可用性,也可以犧牲一個備用節點,但同時刻隻有一個執行個體對外提供服務;

高性能。

 缺點:

不保證資料的可靠性;

在緩存使用,程序重新開機後,資料丢失,即使有備用的節點解決高可用性,但是仍然不能解決緩存預熱問題,是以不适用于資料可靠性要求高的業務;

高性能受限于單核 CPU 的處理能力(Redis 是單線程機制),CPU 為主要瓶頸,是以适合操作指令簡單,排序、計算較少的場景。也可以考慮用 Memcached 替代。

2、Redis 多副本(主從)

Redis 多副本,采用主從(replication)部署結構,相較于單副本而言最大的特點就是主從執行個體間資料實時同步,并且提供資料持久化和備份政策。主從執行個體部署在不同的實體伺服器上,根據公司的基礎環境配置,可以實作同時對外提供服務和讀寫分離政策。

這可能是史上最全 Redis 高可用解決方案總結

高可靠性:一方面,采用雙機主備架構,能夠在主庫出現故障時自動進行主備切換,從庫提升為主庫提供服務,保證服務平穩運作;另一方面,開啟資料持久化功能和配置合理的備份政策,能有效的解決資料誤操作和資料異常丢失的問題;

讀寫分離政策:從節點可以擴充主庫節點的讀能力,有效應對大并發量的讀操作。

故障恢複複雜,如果沒有 RedisHA 系統(需要開發),當主庫節點出現故障時,需要手動将一個從節點晉升為主節點,同時需要通知業務方變更配置,并且需要讓其它從庫節點去複制新主庫節點,整個過程需要人為幹預,比較繁瑣;

主庫的寫能力受到單機的限制,可以考慮分片;

主庫的存儲能力受到單機的限制,可以考慮 Pika;

原生複制的弊端在早期的版本中也會比較突出,如:Redis 複制中斷後,Slave 會發起 psync,此時如果同步不成功,則會進行全量同步,主庫執行全量備份的同時可能會造成毫秒或秒級的卡頓;又由于 COW 機制,導緻極端情況下的主庫記憶體溢出,程式異常退出或當機;主庫節點生成備份檔案導緻伺服器磁盤 IO 和 CPU(壓縮)資源消耗;發送數 GB 大小的備份檔案導緻伺服器出口帶寬暴增,阻塞請求,建議更新到最新版本。

3、Redis Sentinel(哨兵)

Redis Sentinel 是社群版本推出的原生高可用解決方案,其部署架構主要包括兩部分:Redis Sentinel 叢集和 Redis 資料叢集。

其中 Redis Sentinel 叢集是由若幹 Sentinel 節點組成的分布式叢集,可以實作故障發現、故障自動轉移、配置中心和用戶端通知。Redis Sentinel 的節點數量要滿足 2n+1(n>=1)的奇數個。

這可能是史上最全 Redis 高可用解決方案總結
這可能是史上最全 Redis 高可用解決方案總結

Redis Sentinel 叢集部署簡單;

能夠解決 Redis 主從模式下的高可用切換問題;

很友善實作 Redis 資料節點的線形擴充,輕松突破 Redis 自身單線程瓶頸,可極大滿足 Redis 大容量或高性能的業務需求;

可以實作一套 Sentinel 監控一組 Redis 資料節點或多組資料節點。

部署相對 Redis 主從模式要複雜一些,原理了解更繁瑣;

資源浪費,Redis 資料節點中 slave 節點作為備份節點不提供服務;

Redis Sentinel 主要是針對 Redis 資料節點中的主節點的高可用切換,對 Redis 的資料節點做失敗判定分為主觀下線和客觀下線兩種,對于 Redis 的從節點有對節點做主觀下線操作,并不執行故障轉移。

不能解決讀寫分離問題,實作起來相對複雜。

 建議:

如果監控同一業務,可以選擇一套 Sentinel 叢集監控多組 Redis 資料節點的方案,反之選擇一套 Sentinel 監控一組 Redis 資料節點的方案。

sentinel monitor配置中的建議設定成 Sentinel 節點的一半加 1,當 Sentinel 部署在多個 IDC 的時候,單個 IDC 部署的 Sentinel 數量不建議超過(Sentinel 數量 – quorum)。

合理設定參數,防止誤切,控制切換靈敏度控制:

a. quorum

b. down-after-milliseconds 30000

c. failover-timeout 180000

d. maxclient

e. timeout

部署的各個節點伺服器時間盡量要同步,否則日志的時序性會混亂。

Redis 建議使用 pipeline 和 multi-keys 操作,減少 RTT 次數,提高請求效率。

自行搞定配置中心(zookeeper),友善用戶端對執行個體的連結通路。

4、Redis Cluster

Redis Cluster 是社群版推出的 Redis 分布式叢集解決方案,主要解決 Redis 分布式方面的需求,比如,當遇到單機記憶體,并發和流量等瓶頸的時候,Redis Cluster 能起到很好的負載均衡的目的。

Redis Cluster 叢集節點最小配置 6 個節點以上(3 主 3 從),其中主節點提供讀寫操作,從節點作為備用節點,不提供請求,隻作為故障轉移使用。

Redis Cluster 采用虛拟槽分區,所有的鍵根據哈希函數映射到 0~16383 個整數槽内,每個節點負責維護一部分槽以及槽所印映射的鍵值資料。

這可能是史上最全 Redis 高可用解決方案總結

無中心架構;

資料按照 slot 存儲分布在多個節點,節點間資料共享,可動态調整資料分布;

可擴充性:可線性擴充到 1000 多個節點,節點可動态添加或删除;

高可用性:部分節點不可用時,叢集仍可用。通過增加 Slave 做 standby 資料副本,能夠實作故障自動 failover,節點之間通過 gossip 協定交換狀态資訊,用投票機制完成 Slave 到 Master 的角色提升;

降低運維成本,提高系統的擴充性和可用性。

Client 實作複雜,驅動要求實作 Smart Client,緩存 slots mapping 資訊并及時更新,提高了開發難度,用戶端的不成熟影響業務的穩定性。目前僅 JedisCluster 相對成熟,異常處理部分還不完善,比如常見的“max redirect exception”。

節點會因為某些原因發生阻塞(阻塞時間大于 clutser-node-timeout),被判斷下線,這種 failover 是沒有必要的。

資料通過異步複制,不保證資料的強一緻性。

多個業務使用同一套叢集時,無法根據統計區分冷熱資料,資源隔離性較差,容易出現互相影響的情況。

Slave 在叢集中充當“冷備”,不能緩解讀壓力,當然可以通過 SDK 的合理設計來提高 Slave 資源的使用率。

Key 批量操作限制,如使用 mset、mget 目前隻支援具有相同 slot 值的 Key 執行批量操作。對于映射為不同 slot 值的 Key 由于 Keys 不支援跨 slot 查詢,是以執行 mset、mget、sunion 等操作支援不友好。

Key 事務操作支援有限,隻支援多 key 在同一節點上的事務操作,當多個 Key 分布于不同的節點上時無法使用事務功能。

Key 作為資料分區的最小粒度,不能将一個很大的鍵值對象如 hash、list 等映射到不同的節點。

不支援多資料庫空間,單機下的 redis 可以支援到 16 個資料庫,叢集模式下隻能使用 1 個資料庫空間,即 db 0。

複制結構隻支援一層,從節點隻能複制主節點,不支援嵌套樹狀複制結構。

避免産生 hot-key,導緻主庫節點成為系統的短闆。

避免産生 big-key,導緻網卡撐爆、慢查詢等。

重試時間應該大于 cluster-node-time 時間。

Redis Cluster 不建議使用 pipeline 和 multi-keys 操作,減少 max redirect 産生的場景。

5、Redis 自研

Redis 自研的高可用解決方案,主要展現在配置中心、故障探測和 failover 的處理機制上,通常需要根據企業業務的實際線上環境來定制化。

這可能是史上最全 Redis 高可用解決方案總結
這可能是史上最全 Redis 高可用解決方案總結

高可靠性、高可用性;

自主可控性高;

貼切業務實際需求,可縮性好,相容性好。

實作複雜,開發成本高;

需要建立配套的周邊設施,如監控,域名服務,存儲中繼資料資訊的資料庫等;

維護成本高。

原文釋出時間為:2018-09-29

本文作者:張東洪

本文來自雲栖社群合作夥伴“

Java技術棧

”,了解相關資訊可以關注“