天天看點

了解負載均衡

 什麼是負載均衡

負載均衡(Load Balance)是分布式系統架構設計中必須考慮的因素之一,它通常是指将請求/資料【均勻】分攤到多個操作單元上執行,負載均衡的關鍵在于【均勻】。

常見的負載均衡方案

了解負載均衡

常見網際網路分布式架構如上,分為用戶端層、反向代理nginx層、站點層、服務層、資料層。可以看到,每一個下遊都有多個上遊調用,隻需要做到,每一個上遊都均勻通路每一個下遊,就能實作“将請求/資料【均勻】分攤到多個操作單元上執行”。 

【用戶端層->反向代理層】的負載均衡

通過“DNS輪詢”實作的:DNS-server對于一個域名配置了多個解析ip,每次DNS解析請求來通路DNS-server,會輪詢傳回這些ip,保證每個ip的解析機率是相同的。這些ip就是nginx的外網ip,以做到每台nginx的請求配置設定也是均衡的。

【反向代理層->站點層】的負載均衡

【反向代理層】到【站點層】的負載均衡,是通過“nginx”實作的。通過修改nginx.conf,可以實作多種負載均衡政策:

1)請求輪詢:和DNS輪詢類似,請求依次路由到各個web-server

2)最少連接配接路由:哪個web-server的連接配接少,路由到哪個web-server

3)ip哈希:按照通路使用者的ip哈希值來路由web-server,隻要使用者的ip分布是均勻的,請求理論上也是均勻的,ip哈希均衡方法可以做到,同一個使用者的請求固定落到同一台web-server上,此政策适合有狀态服務,例如session(58沈劍備注:可以這麼做,但強烈不建議這麼做,站點層無狀态是分布式架構設計的基本原則之一,session最好放到資料層存儲)

4)…

【站點層->服務層】的負載均衡

【站點層】到【服務層】的負載均衡,是通過“服務連接配接池”實作的。

上遊連接配接池會建立與下遊服務多個連接配接,每次請求會“随機”選取連接配接來通路下遊服務。dubbo,thirft很多rpc都有此考慮。

【資料層】的負載均衡

在資料量很大的情況下,由于資料層(db,cache)涉及資料的水準切分,是以資料層的負載均衡更為複雜一些,它分為“資料的均衡”,與“請求的均衡”。

資料的均衡是指:水準切分後的每個服務(db,cache),資料量是差不多的。

請求的均衡是指:水準切分後的每個服務(db,cache),請求量是差不多的。

業内常見的水準切分方式有這麼幾種:

一、按照range水準切分

每一個資料服務,存儲一定範圍的資料,上圖為例:

user0服務,存儲uid範圍1-1kw

user1服務,存儲uid範圍1kw-2kw

這個方案的好處是:

(1)規則簡單,service隻需判斷一下uid範圍就能路由到對應的存儲服務

(2)資料均衡性較好

(3)比較容易擴充,可以随時加一個uid[2kw,3kw]的資料服務

不足是:

(1)請求的負載不一定均衡,一般來說,新注冊的使用者會比老使用者更活躍,大range的服務請求壓力會更大

二、按照id哈希水準切分

每一個資料服務,存儲某個key值hash後的部分資料。

(1)規則簡單,service隻需對uid進行hash能路由到對應的存儲服務

(3)請求均勻性較好

(1)不容易擴充,擴充一個資料服務,hash方法改變時候,可能需要進行資料遷移。 

總結

負載均衡(Load Balance)是分布式系統架構設計中必須考慮的因素之一,它通常是指,将請求/資料【均勻】分攤到多個操作單元上執行,負載均衡的關鍵在于【均勻】。

(1)【用戶端層】到【反向代理層】的負載均衡,是通過“DNS輪詢”實作的

(2)【反向代理層】到【站點層】的負載均衡,是通過“nginx”實作的

(3)【站點層】到【服務層】的負載均衡,是通過“服務連接配接池”實作的

(4)【資料層】的負載均衡,要考慮“資料的均衡”與“請求的均衡”兩個點,常見的方式有“按照範圍水準切分”與“hash水準切分”

繼續閱讀