1 簡介
本篇盡量用一些簡單的數學式子和流程圖和大家一起梳理一下這些叢集容錯算法.
2 靈魂拷問
- 談談dubbo中的負載均衡算法及特點
- 最小活躍數算法中是如何統計這個活躍數的
- 簡單談談你對一緻性雜湊演算法的認識
3 接口的繼承體系
4 RandomLoadBalance(随機)
随機,按權重設定随機機率
在一個截面上碰撞的機率高,但調用量越大分布越均勻,而且按機率使用權重後也比較均勻,有利于動态調整提供者權重。
預設政策,但是這個随機和我們了解上的随機還是不一樣的,因為他還有個概念叫weight(權重),就是用來控制這個随機的機率的,我們來看代碼實作.
package org.apache.dubbo.rpc.cluster.loadbalance;
import org.apache.dubbo.common.URL;
import org.apache.dubbo.rpc.Invocation;
import org.apache.dubbo.rpc.Invoker;
import java.util.List;
import java.util.concurrent.ThreadLocalRandom;
/**
* 此類從多個提供者中随機選擇一個提供者。
* 可以為每個提供商定義權重:
* 如果權重都相同,則将使用random.nextInt(調用者數)。
* 如果權重不同,則将使用random.nextInt(w1 + w2 + ... + wn)
* 請注意,如果機器的性能優于其他機器,則可以設定更大的重量。
* 如果性能不是很好,則可以設定較小的重量。
*/
public class RandomLoadBalance extends AbstractLoadBalance {
public static final String NAME = "random";
/**
* 使用随機條件在清單之間選擇一個invoker
* @param invokers 可能的invoker清單
* @param url URL
* @param invocation Invocation
* @param <T>
* @return 被選的invoker
*/
@Override
protected <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation) {
// invoker的數量
int length = invokers.size();
// 每個 invoker 有相同權重
boolean sameWeight = true;
// 每個invoker的權重
int[] weights = new int[length];
// 第一個 invoker 的權重
int firstWeight = getWeight(invokers.get(0), invocation);
weights[0] = firstWeight;
// 權重之和
int totalWeight = firstWeight;
for (int i = 1; i < length; i++) {
int weight = getWeight(invokers.get(i), invocation);
// 儲存以待後用
weights[i] = weight;
// Sum
totalWeight += weight;
if (sameWeight && weight != firstWeight) {
sameWeight = false;
}
}
if (totalWeight > 0 && !sameWeight) {
// 如果并非每個invoker都具有相同的權重且至少一個invoker的權重大于0,請根據totalWeight随機選擇
int offset = ThreadLocalRandom.current().nextInt(totalWeight);
// 根據随機值傳回invoker
for (int i = 0; i < length; i++) {
offset -= weights[i];
if (offset < 0) {
return invokers.get(i);
}
}
}
// 如果所有invoker都具有相同的權重值或totalWeight = 0,則平均傳回。
return invokers.get(ThreadLocalRandom.current().nextInt(length));
}
}
分析
- 流程圖
假設有四個叢集節點A,B,C,D,對應的權重分别是1,2,3,4,那麼請求到A節點的機率就為1/(1+2+3+4) = 10%.B,C,D節點依次類推為20%,30%,40%.
雖然這個随機算法了解起來是比較容易的,面試一般不會問這個,但是假如我們要實作類似的功能,他這個代碼實作的思路還是很優雅的,非常具有借鑒意義
他這個實作思路從純數學角度是很好了解的,我們還是按照上面數學分析中的前提條件.我們知道總權重為10(1+2+3+4),那麼怎麼做到按權重随機呢?
根據10随機出一個整數,假如為随機出來的是2.然後依次和權重相減,比如2(随機數)-1(A的權重) = 1,然後1(上一步計算的結果)-2(B的權重) = -1,此時-1 < 0,那麼則調用B,其他的以此類推
5 RoundRobinLoadBalance(輪詢)
輪詢,按公約後的權重設定輪循比率
存在慢的提供者累積請求的問題,比如:第二台機器很慢,但沒挂,當請求調到第二台時就卡在那,久而久之,所有請求都卡在調到第二台上
package org.apache.dubbo.rpc.cluster.loadbalance;
import org.apache.dubbo.common.URL;
import org.apache.dubbo.rpc.Invocation;
import org.apache.dubbo.rpc.Invoker;
import java.util.Collection;
import java.util.List;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ConcurrentMap;
import java.util.concurrent.atomic.AtomicBoolean;
import java.util.concurrent.atomic.AtomicLong;
/**
* Round robin load balance.
*/
public class RoundRobinLoadBalance extends AbstractLoadBalance {
public static final String NAME = "roundrobin";
private static final int RECYCLE_PERIOD = 60000;
protected static class WeightedRoundRobin {
private int weight;
private AtomicLong current = new AtomicLong(0);
private long lastUpdate;
public int getWeight() {
return weight;
}
public void setWeight(int weight) {
this.weight = weight;
current.set(0);
}
public long increaseCurrent() {
return current.addAndGet(weight);
}
public void sel(int total) {
current.addAndGet(-1 * total);
}
public long getLastUpdate() {
return lastUpdate;
}
public void setLastUpdate(long lastUpdate) {
this.lastUpdate = lastUpdate;
}
}
private ConcurrentMap<String, ConcurrentMap<String, WeightedRoundRobin>> methodWeightMap = new ConcurrentHashMap<String, ConcurrentMap<String, WeightedRoundRobin>>();
private AtomicBoolean updateLock = new AtomicBoolean();
/**
* 擷取為指定invocation緩存的invocation位址清單
* for unit test only
*/
protected <T> Collection<String> getInvokerAddrList(List<Invoker<T>> invokers, Invocation invocation) {
String key = invokers.get(0).getUrl().getServiceKey() + "." + invocation.getMethodName();
Map<String, WeightedRoundRobin> map = methodWeightMap.get(key);
if (map != null) {
return map.keySet();
}
return null;
}
@Override
protected <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation) {
String key = invokers.get(0).getUrl().getServiceKey() + "." + invocation.getMethodName();
ConcurrentMap<String, WeightedRoundRobin> map = methodWeightMap.get(key);
if (map == null) {
methodWeightMap.putIfAbsent(key, new ConcurrentHashMap<String, WeightedRoundRobin>());
map = methodWeightMap.get(key);
}
int totalWeight = 0;
long maxCurrent = Long.MIN_VALUE;
long now = System.currentTimeMillis();
Invoker<T> selectedInvoker = null;
WeightedRoundRobin selectedWRR = null;
for (Invoker<T> invoker : invokers) {
String identifyString = invoker.getUrl().toIdentityString();
WeightedRoundRobin weightedRoundRobin = map.get(identifyString);
int weight = getWeight(invoker, invocation);
if (weightedRoundRobin == null) {
weightedRoundRobin = new WeightedRoundRobin();
weightedRoundRobin.setWeight(weight);
map.putIfAbsent(identifyString, weightedRoundRobin);
}
if (weight != weightedRoundRobin.getWeight()) {
//weight changed
weightedRoundRobin.setWeight(weight);
}
long cur = weightedRoundRobin.increaseCurrent();
weightedRoundRobin.setLastUpdate(now);
if (cur > maxCurrent) {
maxCurrent = cur;
selectedInvoker = invoker;
selectedWRR = weightedRoundRobin;
}
totalWeight += weight;
}
if (!updateLock.get() && invokers.size() != map.size()) {
if (updateLock.compareAndSet(false, true)) {
try {
// copy -> modify -> update reference
ConcurrentMap<String, WeightedRoundRobin> newMap = new ConcurrentHashMap<>(map);
newMap.entrySet().removeIf(item -> now - item.getValue().getLastUpdate() > RECYCLE_PERIOD);
methodWeightMap.put(key, newMap);
} finally {
updateLock.set(false);
}
}
}
if (selectedInvoker != null) {
selectedWRR.sel(totalWeight);
return selectedInvoker;
}
// should not happen here
return invokers.get(0);
}
}
Nginx的負載均衡預設就是輪詢
6 LeastActiveLoadBalance(最少活躍數)
- 最少活躍調用數,相同活躍數的随機,活躍數指調用前後計數差
- 使慢的提供者收到更少請求,因為越慢的提供者的調用前後計數差會越大。
舉個例子.每個服務有一個活躍計數器
那麼我們假如有A,B兩個提供者.計數初始均為0
當A提供者開始處理請求,該計數+1,此時A還沒處理完,當處理完後則計數-1
而B請求接收到請求處理得很快.B處理完後A還沒處理完,是以此時A,B的計數為1,0
那麼當有新的請求來的時候,就會選擇B提供者(B的活躍計數比A小)
這就是文檔說的,使慢的提供者收到更少請求
package org.apache.dubbo.rpc.cluster.loadbalance;
import org.apache.dubbo.common.URL;
import org.apache.dubbo.rpc.Invocation;
import org.apache.dubbo.rpc.Invoker;
import org.apache.dubbo.rpc.RpcStatus;
import java.util.List;
import java.util.concurrent.ThreadLocalRandom;
/**
* 過濾活動調用次數最少的調用者數量,并計算這些調用者的權重和數量。
* 如果隻有一個調用程式,則直接使用該調用程式;
* 如果有多個調用者并且權重不相同,則根據總權重随機;
* 如果有多個調用者且權重相同,則将其随機調用。
*/
public class LeastActiveLoadBalance extends AbstractLoadBalance {
public static final String NAME = "leastactive";
@Override
protected <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation) {
// invoker的總個數
int length = invokers.size();
// invoker最小的活躍數
int leastActive = -1;
// 相同最小活躍數(leastActive)的invoker個數
int leastCount = 0;
// 相同最小活躍數(leastActive)的下标
int[] leastIndexes = new int[length];
// the weight of every invokers
int[] weights = new int[length];
// 所有最不活躍invoker的預熱權重之和
int totalWeight = 0;
// 第一個最不活躍的invoker的權重, 用于于計算是否相同
int firstWeight = 0;
// 每個最不活躍的調用者都具有相同的權重值?
boolean sameWeight = true;
// Filter out all the least active invokers
for (int i = 0; i < length; i++) {
Invoker<T> invoker = invokers.get(i);
// Get the active number of the invoker
int active = RpcStatus.getStatus(invoker.getUrl(), invocation.getMethodName()).getActive();
// Get the weight of the invoker's configuration. The default value is 100.
int afterWarmup = getWeight(invoker, invocation);
// save for later use
weights[i] = afterWarmup;
// If it is the first invoker or the active number of the invoker is less than the current least active number
if (leastActive == -1 || active < leastActive) {
// Reset the active number of the current invoker to the least active number
leastActive = active;
// Reset the number of least active invokers
leastCount = 1;
// Put the first least active invoker first in leastIndexes
leastIndexes[0] = i;
// Reset totalWeight
totalWeight = afterWarmup;
// Record the weight the first least active invoker
firstWeight = afterWarmup;
// Each invoke has the same weight (only one invoker here)
sameWeight = true;
// If current invoker's active value equals with leaseActive, then accumulating.
} else if (active == leastActive) {
// 記錄leastIndexes order最小活躍數下标
leastIndexes[leastCount++] = i;
// 累計總權重
totalWeight += afterWarmup;
// If every invoker has the same weight?
if (sameWeight && i > 0
&& afterWarmup != firstWeight) {
sameWeight = false;
}
}
}
// Choose an invoker from all the least active invokers
if (leastCount == 1) {
// 如果隻有一個最小則直接傳回
return invokers.get(leastIndexes[0]);
}
if (!sameWeight && totalWeight > 0) {
// 如果權重不相同且權重大于0則按總權重數随機
int offsetWeight = ThreadLocalRandom.current().nextInt(totalWeight);
// 并确定随機值落在哪個片斷上
for (int i = 0; i < leastCount; i++) {
int leastIndex = leastIndexes[i];
offsetWeight -= weights[leastIndex];
if (offsetWeight < 0) {
return invokers.get(leastIndex);
}
}
}
// 如果權重相同或權重為0則均等随機
return invokers.get(leastIndexes[ThreadLocalRandom.current().nextInt(leastCount)]);
}
}
這部分代碼概括起來就兩部分
- 活躍數和權重的統計
- 選擇invoker.也就是他把最小活躍數的invoker統計到leastIndexs數組中,如果權重一緻(這個一緻的規則參考上面的随機算法)或者總權重為0,則均等随機調用,如果不同,則從leastIndexs數組中按照權重比例調用(還是和随機算法中的那個依次相減的思路一樣).還不明白沒關系,看下面的流程圖和數學分析
理論
假設A,B,C,D節點的最小活躍數分别是1,1,2,3,權重為1,2,3,4.則leastIndexs(該數組是最小活躍數組,因為A,B的活躍數是1,均為最小)數組内容為[A,B].A,B的權重是1和2,是以調用A的機率為 1/(1+2) = 1/3,B的機率為 2/(1+2) = 2/3
活躍數的變化是在
org.apache.dubbo.rpc.filter.ActiveLimitFilter
中
如果沒有配置
dubbo:reference
的
actives
屬性,預設是調用前活躍數+1,調用結束-1
鑒于很多人可能沒用過這個屬性,是以我把文檔截圖貼出來
另外如果使用該種負載均衡算法,則
dubbo:service
中還需要配置
filter="activelimit"
7 ConsistentHashLoadBalance(一緻性哈希)
- 一緻性 Hash,相同參數的請求總是發到同一提供者
- 當某一台提供者挂時,原本發往該提供者的請求,基于虛拟節點,平攤到其它提供者,不會引起劇烈變動。
- 推薦閱讀 http://en.wikipedia.org/wiki/Consistent_hashing
預設隻對第一個參數 Hash,如果要修改,請配置
<dubbo:parameter key="hash.arguments" value="0,1" />
預設用 160 份虛拟節點,如果要修改,請配置
<dubbo:parameter key="hash.nodes" value="320" />
package org.apache.dubbo.rpc.cluster.loadbalance;
import org.apache.dubbo.common.URL;
import org.apache.dubbo.rpc.Invocation;
import org.apache.dubbo.rpc.Invoker;
import org.apache.dubbo.rpc.support.RpcUtils;
import java.nio.charset.StandardCharsets;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.List;
import java.util.Map;
import java.util.TreeMap;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ConcurrentMap;
import static org.apache.dubbo.common.constants.CommonConstants.COMMA_SPLIT_PATTERN;
public class ConsistentHashLoadBalance extends AbstractLoadBalance {
public static final String NAME = "consistenthash";
/**
* Hash nodes name
*/
public static final String HASH_NODES = "hash.nodes";
/**
* Hash arguments name
*/
public static final String HASH_ARGUMENTS = "hash.arguments";
private final ConcurrentMap<String, ConsistentHashSelector<?>> selectors = new ConcurrentHashMap<String, ConsistentHashSelector<?>>();
@SuppressWarnings("unchecked")
@Override
protected <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation) {
String methodName = RpcUtils.getMethodName(invocation);
String key = invokers.get(0).getUrl().getServiceKey() + "." + methodName;
int identityHashCode = System.identityHashCode(invokers);
ConsistentHashSelector<T> selector = (ConsistentHashSelector<T>) selectors.get(key);
if (selector == null || selector.identityHashCode != identityHashCode) {
selectors.put(key, new ConsistentHashSelector<T>(invokers, methodName, identityHashCode));
selector = (ConsistentHashSelector<T>) selectors.get(key);
}
return selector.select(invocation);
}
private static final class ConsistentHashSelector<T> {
private final TreeMap<Long, Invoker<T>> virtualInvokers;
private final int replicaNumber;
private final int identityHashCode;
private final int[] argumentIndex;
ConsistentHashSelector(List<Invoker<T>> invokers, String methodName, int identityHashCode) {
this.virtualInvokers = new TreeMap<Long, Invoker<T>>();
this.identityHashCode = identityHashCode;
URL url = invokers.get(0).getUrl();
this.replicaNumber = url.getMethodParameter(methodName, HASH_NODES, 160);
String[] index = COMMA_SPLIT_PATTERN.split(url.getMethodParameter(methodName, HASH_ARGUMENTS, "0"));
argumentIndex = new int[index.length];
for (int i = 0; i < index.length; i++) {
argumentIndex[i] = Integer.parseInt(index[i]);
}
for (Invoker<T> invoker : invokers) {
String address = invoker.getUrl().getAddress();
for (int i = 0; i < replicaNumber / 4; i++) {
byte[] digest = md5(address + i);
for (int h = 0; h < 4; h++) {
long m = hash(digest, h);
virtualInvokers.put(m, invoker);
}
}
}
}
public Invoker<T> select(Invocation invocation) {
String key = toKey(invocation.getArguments());
byte[] digest = md5(key);
return selectForKey(hash(digest, 0));
}
private String toKey(Object[] args) {
StringBuilder buf = new StringBuilder();
for (int i : argumentIndex) {
if (i >= 0 && i < args.length) {
buf.append(args[i]);
}
}
return buf.toString();
}
private Invoker<T> selectForKey(long hash) {
Map.Entry<Long, Invoker<T>> entry = virtualInvokers.ceilingEntry(hash);
if (entry == null) {
entry = virtualInvokers.firstEntry();
}
return entry.getValue();
}
private long hash(byte[] digest, int number) {
return (((long) (digest[3 + number * 4] & 0xFF) << 24)
| ((long) (digest[2 + number * 4] & 0xFF) << 16)
| ((long) (digest[1 + number * 4] & 0xFF) << 8)
| (digest[number * 4] & 0xFF))
& 0xFFFFFFFFL;
}
private byte[] md5(String value) {
MessageDigest md5;
try {
md5 = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
throw new IllegalStateException(e.getMessage(), e);
}
md5.reset();
byte[] bytes = value.getBytes(StandardCharsets.UTF_8);
md5.update(bytes);
return md5.digest();
}
}
}
該算法的代碼實作拿出來講的話篇幅較大,主要講三個關鍵詞,原理,down機影響,虛拟節點
原理
簡單講就是,假設我們有個時鐘,各伺服器節點映射放在鐘表的時刻上,把key也映射到鐘表的某個時刻上,然後key順時針走,碰到的第一個節點則為我們需要找的伺服器節點
還是假如我們有a,b,c,d四個節點(感覺整篇文章都在做這個假如....),把他們通過某種規則轉成整數,分别為0,3,6,9.是以按照時鐘分布如下圖
假設這個key通過某種規則轉化成1,那麼他順時針碰到的第一個節點就是b,也就是b是我們要找的節點
這個規則你可以自己設計,但是要注意的是,不同的節點名,轉換為相同的整數的機率就是衡量這個規則的好壞,如果你能做到不同的節點名唯一對應一個整數,那就是棒棒哒.當然java裡面的CRC32這個類你可以了解一下.
說到這裡可能又會有另個疑問,時鐘點數有限,萬一裝不下怎麼辦
其實這個時鐘隻是友善大家了解做的比喻而已,在實際中,我們可以在圓環上分布[0,2^32-1]的數字,這量級全世界的伺服器都可以裝得下.
down機影響
通過上圖我們可以看出,當b節點挂了之後,根據順時針的規則,那麼目标節點就是c,也就是說,隻影響了一個節點,其他節點不受影響.
如果是輪詢的取模算法,假設從N台伺服器變成了N-1台,那麼命中率就變成1/(N-1),是以伺服器越多,影響也就越大.
虛拟節點
為什麼要有虛拟節點的概念呢?我們還是回到第一個假設,我們還是有a,b,c,d四個節點,他們通過某個規則轉化成0,3,6,9這種自然是均勻的.但是萬一是0,1,2,3這樣,那就是非常不均勻了.事實上, 一般的Hash函數對于節點在圓環上的映射,并不均勻.是以我們需要引入虛拟節點,那麼什麼是虛拟節點呢?
假如有N個真實節點,把每個真實節點映射成M個虛拟節點,再把 M*N 個虛拟節點, 散列在圓環上. 各真實節點對應的虛拟節點互相交錯分布這樣,某真實節點down後,則把其影響平均分擔到其他所有節點上.
也就是a,b,c,d的虛拟節點a0,a1,a2,b0,b1,b2,c0,c1,c2,d0,d1,d2散落在圓環上,假設C号節點down,則c0,c1,c2的壓力分别傳給d0,a1,b1,如下圖