後端架構設計：如何扛住100億次請求？

1. 前言

前幾天，偶然看到了《扛住100億次請求——如何做一個“有把握”的春晚紅包系統”》一文，看完以後，感慨良多，收益很多。正所謂他山之石，可以攻玉，雖然此文發表于2015年，我看到時已經過去良久，但是其中的思想仍然是可以為很多後端設計借鑒。

同時作為一微信後端工程師，看完以後又會思考，學習了這樣的文章以後，是否能給自己的工作帶來一些實際的經驗呢？所謂紙上得來終覺淺，絕知此事要躬行，能否自己實踐一下100億次紅包請求呢？否則讀完以後腦子裡能剩下的東西不過就是100億 1400萬QPS整流這樣的字眼，剩下的文章将展示作者是如何以此過程為目标，在本地環境的模拟了此過程。

實作的目标：單機支援100萬連接配接，模拟了搖紅包和發紅包過程，單機峰值QPS 6萬，平穩支援了業務。

注：本文以及作者所有内容，僅代表個人了解和實踐，過程和微信團隊沒有任何關系，真正的線上系統也不同，隻是從一些技術點進行了實踐，請讀者進行區分。

2. 背景知識

QPS：Queries per second 每秒的請求數目
PPS：Packets per second 每秒資料包數目
搖紅包：用戶端發出一個搖紅包的請求，如果系統有紅包就會傳回，使用者獲得紅包
發紅包：産生一個紅包裡面含有一定金額，紅包指定數個使用者，每個使用者會收到紅包資訊，使用者可以發送拆紅包的請求，擷取其中的部分金額。

3. 确定目标

在一切系統開始以前，我們應該搞清楚我們的系統在完成以後，應該有一個什麼樣的負載能力。

3.1 使用者總數

通過文章我們可以了解到接入伺服器638台，服務上限大概是14.3億使用者，是以單機負載的使用者上限大概是14.3億/638台=228萬使用者/台。但是目前中國肯定不會有14億使用者同時線上，參考 http://qiye.qianzhan.com/show/detail/160818-b8d1c700.html的說法，2016年Q2 微信使用者大概是8億，月活在5.4 億左右。是以在2015年春節期間，雖然使用的使用者會很多，但是同時線上肯定不到5.4億。

3.2. 伺服器數量

一共有638台伺服器，按照正常運維設計，我相信所有伺服器不會完全上線，會有一定的硬體備援，來防止突發硬體故障。假設一共有600台接入伺服器。

3.3 單機需要支援的負載數

每台伺服器支援的使用者數：5.4億/600 = 90萬。也就是平均單機支援90萬使用者。如果真實情況比90萬更多，則模拟的情況可能會有偏差，但是我認為QPS在這個實驗中更重要。

3.4. 單機峰值QPS

文章中明确表示為1400萬QPS.這個數值是非常高的，但是因為有600台伺服器存在，是以單機的QPS為 1400萬/600= 約為2.3萬QPS, 文章曾經提及系統可以支援4000萬QPS，那麼系統的QPS 至少要到4000萬/600 = 約為 6.6萬, 這個數值大約是目前的3倍，短期來看并不會被觸及。但是我相信應該做過相應的壓力測試。

3.5. 發放紅包

文中提到系統以5萬個每秒的下發速度，那麼單機每秒下發速度50000/600 ＝83個/秒，也就是單機系統應該保證每秒以83個的速度下發即可。

最後考慮到系統的真實性，還至少有使用者登入的動作，拿紅包這樣的業務。真實的系統還會包括聊天這樣的服務業務。

最後整體的看一下 100億次搖紅包這個需求，假設它是均勻地發生在春節聯歡晚會的4個小時裡，那麼伺服器的QPS 應該是10000000000/600/3600/4.0=1157. 也就是單機每秒1000多次，這個數值其實并不高。如果完全由峰值速度1400萬消化 10000000000/(1400*10000) = 714秒，也就是說隻需要峰值堅持11分鐘，就可以完成所有的請求。可見網際網路産品的一個特點就是峰值非常高，持續時間并不會很長。

總結

從單台伺服器看，它需要滿足下面一些條件：

支援至少100萬連接配接使用者
每秒至少能處理2.3萬的QPS，這裡我們把目标定得更高一些分别設定到了3萬和6萬。
搖紅包：支援每秒83個的速度下發放紅包，也就是說每秒有2.3萬次搖紅包的請求，其中83個請求能搖到紅包，其餘的2.29萬次請求會知道自己沒搖到。當然用戶端在收到紅包以後，也需要確定用戶端和伺服器兩邊的紅包數目和紅包内的金額要一緻。因為沒有支付子產品，是以我們也把要求提高一倍，達到200個紅包每秒的分發速度
支援使用者之間發紅包業務，確定收發兩邊的紅包數目和紅包内金額要一緻。同樣也設定200個紅包每秒的分發速度為我們的目标。

想完整模拟整個系統實在太難了，首先需要海量的伺服器，其次需要上億的模拟用戶端。這對我來說是辦不到，但是有一點可以确定，整個系統是可以水準擴充的，是以我們可以模拟100萬用戶端，在模拟一台伺服器那麼就完成了1/600的模拟。

和現有系統差別：和大部分高QPS測試的不同，本系統的側重點有所不同。我對2者做了一些對比。

4. 基礎軟體和硬體

4.1軟體

Golang 1.8r3 , shell, python (開發沒有使用c++ 而是使用了golang, 是因為使用golang 的最初原型達到了系統要求。雖然golang 還存在一定的問題，但是和開發效率比，這點損失可以接受)

伺服器作業系統：Ubuntu 12.04

用戶端作業系統：debian 5.0

4.2硬體環境

服務端：dell R2950。8核實體機，非獨占有其他業務在工作，16G記憶體。這台硬體大概是7年前的産品，性能應該不是很高要求。

伺服器硬體版本：

伺服器CPU資訊：

用戶端：esxi 5.0 虛拟機，配置為4核 5G記憶體。一共17台，每台和伺服器建立6萬個連接配接。完成100萬用戶端模拟

5. 技術分析和實作

5.1) 單機實作100萬使用者連接配接

這一點來說相對簡單，筆者在幾年前就早完成了單機百萬使用者的開發以及操作。現代的伺服器都可以支援百萬使用者。相關内容可以檢視：

github代碼以及相關文檔：

https://github.com/xiaojiaqi/C1000kPracticeGuide

系統配置以及優化文檔：

https://github.com/xiaojiaqi/C1000kPracticeGuide/tree/master/docs/cn

5.2) 3萬QPS

這個問題需要分2個部分來看用戶端方面和伺服器方面。

用戶端QPS

因為有100萬連接配接連在伺服器上，QPS為3萬。這就意味着每個連接配接每33秒，就需要向伺服器發一個搖紅包的請求。因為單IP可以建立的連接配接數為6萬左右，有17台伺服器同時模拟用戶端行為。我們要做的就保證在每一秒都有這麼多的請求發往伺服器即可。

其中技術要點就是用戶端協同。但是各個用戶端的啟動時間，建立連接配接的時間都不一緻，還存在網絡斷開重連這樣的情況，各個用戶端如何判斷何時自己需要發送請求，各自該發送多少請求呢？

我是這樣解決的：利用NTP服務，同步所有的伺服器時間，用戶端利用時間戳來判斷自己的此時需要發送多少請求。

算法很容易實作：假設有100萬使用者，則使用者id 為0-999999.要求的QPS為5萬，用戶端得知QPS為5萬，總使用者數為100萬，它計算 100萬/5萬=20，所有的使用者應該分為20組，如果 time() % 20 == 使用者id % 20，那麼這個id的使用者就該在這一秒送出請求，如此實作了多用戶端協同工作。每個用戶端隻需要知道總使用者數和QPS 就能自行準确送出請求了。

（擴充思考：如果QPS是3萬這樣不能被整除的數目，該如何辦？如何保證每台用戶端發出的請求數目盡量的均衡呢？）

伺服器QPS

伺服器端的QPS相對簡單，它隻需要處理用戶端的請求即可。但是為了客觀了解處理情況，我們還需要做2件事情。

第一：需要記錄每秒處理的請求數目，這需要在代碼裡埋入計數器。
第二：我們需要監控網絡，因為網絡的吞吐情況，可以客觀的反映出QPS的真實資料。為此，我利用python腳本結合ethtool 工具編寫了一個簡單的工具，通過它我們可以直覺的監視到網絡的資料包通過情況如何。它可以客觀的顯示出我們的網絡有如此多的資料傳輸在發生。

工具截圖：

5.3) 搖紅包業務

搖紅包的業務非常簡單，首先伺服器按照一定的速度生産紅包。紅包沒有被取走的話，就堆積在裡面。伺服器接收一個用戶端的請求，如果伺服器裡現在有紅包就會告訴用戶端有，否則就提示沒有紅包。

因為單機每秒有3萬的請求，是以大部分的請求會失敗。隻需要處理好鎖的問題即可。

我為了減少競争，将所有的使用者分在了不同的桶裡。這樣可以減少對鎖的競争。如果以後還有更高的性能要求，還可以使用高性能隊列——Disruptor來進一步提高性能。

注意，在我的測試環境裡是缺少支付這個核心服務的，是以實作的難度是大大的減輕了。另外提供一組數字：2016年淘寶的雙11的交易峰值僅僅為12萬/秒，微信紅包分發速度是5萬/秒，要做到這點是非常困難的。（http://mt.sohu.com/20161111/n472951708.shtml）

5.4) 發紅包業務

發紅包的業務很簡單，系統随機産生一些紅包，并且随機選擇一些使用者，系統向這些使用者提示有紅包。這些使用者隻需要發出拆紅包的請求，系統就可以随機從紅包中拆分出部分金額，分給使用者，完成這個業務。同樣這裡也沒有支付這個核心服務。

5.5）監控

最後我們需要一套監控系統來了解系統的狀況，我借用了我另一個項目(https://github.com/xiaojiaqi/fakewechat) 裡的部分代碼完成了這個監控子產品，利用這個監控，伺服器和用戶端會把目前的計數器内容發往監控，監控需要把各個用戶端的資料做一個整合和展示。同時還會把日志記錄下來，給以後的分析提供原始資料。線上系統更多使用opentsdb這樣的時序資料庫，這裡資源有限，是以用了一個原始的方案。

監控顯示日志大概這樣：

6. 代碼實作及分析

在代碼方面，使用到的技巧實在不多，主要是設計思想和golang本身的一些問題需要考慮。

首先golang的goroutine 的數目控制，因為至少有100萬以上的連接配接，是以按照普通的設計方案，至少需要200萬或者300萬的goroutine在工作。這會造成系統本身的負擔很重。

其次就是100萬個連接配接的管理，無論是連接配接還是業務都會造成一些心智的負擔。

我的設計是這樣的：

首先将100萬連接配接分成多個不同的SET，每個SET是一個獨立，平行的對象。每個SET 隻管理幾千個連接配接，如果單個SET 工作正常，我隻需要添加SET就能提高系統處理能力。

其次謹慎的設計了每個SET裡資料結構的大小，保證每個SET的壓力不會太大，不會出現消息的堆積。

再次減少了gcroutine的數目，每個連接配接隻使用一個goroutine,發送消息在一個SET裡隻有一個gcroutine負責，這樣節省了100萬個goroutine。這樣整個系統隻需要保留 100萬零幾百個gcroutine就能完成業務。大量的節省了cpu 和記憶體

系統的工作流程大概是：每個用戶端連接配接成功後，系統會配置設定一個goroutine讀取用戶端的消息，當消息讀取完成，将它轉化為消息對象放至在SET的接收消息隊列，然後傳回擷取下一個消息。

在SET内部，有一個工作goroutine，它隻做非常簡單而高效的事情，它做的事情如下，檢查SET的接受消息，它會收到3類消息：

用戶端的搖紅包請求消息
用戶端的其他消息比如聊天好友這一類
伺服器端對用戶端消息的回應

對于第1種消息用戶端的搖紅包請求消息是這樣處理的，從用戶端拿到搖紅包請求消息，試圖從SET的紅包隊列裡擷取一個紅包，如果拿到了就把紅包資訊傳回給用戶端，否則構造一個沒有搖到的消息，傳回給對應的用戶端。

對于第2種消息用戶端的其他消息比如聊天好友這一類，隻需簡單地從隊列裡拿走消息，轉發給後端的聊天服務隊列即可，其他服務會把消息轉發出去。

對于第3種消息伺服器端對用戶端消息的回應。SET 隻需要根據消息裡的使用者id，找到SET裡保留的使用者連接配接對象，發回去就可以了。

對于紅包産生服務，它的工作很簡單，隻需要按照順序在輪流在每個SET的紅包産生對列裡放至紅包對象就可以了。這樣可以保證每個SET裡都是公平的，其次它的工作強度很低，可以保證業務穩定。

github位址及代碼見：

https://github.com/xiaojiaqi/10billionhongbaos

7. 實踐

實踐的過程分為3個階段

階段1

分别啟動伺服器端和監控端，然後逐一啟動17台用戶端，讓它們建立起100萬的連結。在伺服器端，利用ss 指令統計出每個用戶端和伺服器建立了多少連接配接。

指令如下：

Alias ss2=Ss –ant | grep 1025 | grep EST | awk –F: “{print \$8}” | sort | uniq –c’

結果如下：

階段2

利用用戶端的http接口，将所有的用戶端QPS 調整到3萬，讓用戶端發出3W QPS強度的請求。

運作如下指令：

觀察網絡監控和監控端回報，發現QPS 達到預期資料，網絡監控截圖：

在伺服器端啟動一個産生紅包的服務，這個服務會以200個每秒的速度下發紅包，總共4萬個。此時觀察用戶端在監控上的日志，會發現基本上以200個每秒的速度擷取到紅包。

等到所有紅包下發完成後，再啟動一個發紅包的服務，這個服務系統會生成2萬個紅包，每秒也是200個，每個紅包随機指定3位使用者，并向這3個使用者發出消息，用戶端會自動來拿紅包，最後所有的紅包都被拿走。

階段3

利用用戶端的http接口，将所有的用戶端QPS 調整到6萬，讓用戶端發出6W QPS強度的請求。

如法炮制，在伺服器端，啟動一個産生紅包的服務，這個服務會以200個每秒的速度下發紅包。總共4萬個。此時觀察用戶端在監控上的日志，會發現基本上以200個每秒的速度擷取到紅包。

最後，實踐完成。

8. 分析資料

在實踐過程中，伺服器和用戶端都将自己内部的計數器記錄發往監控端，成為了日志。我們利用簡單python 腳本和gnuplt 繪圖工具，将實踐的過程可視化，由此來驗證運作過程。

第一張是用戶端的QPS發送資料：

這張圖的橫坐标是時間，機關是秒，縱坐标是QPS，表示這時刻所有用戶端發送的請求的QPS。

圖的第一區間，幾個小的峰值，是100萬用戶端建立連接配接的，圖的第二區間是3萬QPS 區間，我們可以看到資料比較穩定的保持在3萬這個區間。最後是6萬QPS區間。但是從整張圖可以看到QPS不是完美地保持在我們希望的直線上。這主要是以下幾個原因造成的

當非常多goroutine 同時運作的時候，依靠sleep 定時并不準确，發生了偏移。我覺得這是golang本身排程導緻的。當然如果cpu比較強勁，這個現象會消失。
因為網絡的影響，用戶端在發起連接配接時，可能發生延遲，導緻在前1秒沒有完成連接配接。
伺服器負載較大時，1000M網絡已經出現了丢包現象，可以通過ifconfig 指令觀察到這個現象，是以會有QPS的波動。

第二張是伺服器處理的QPS圖：

和用戶端的向對應的，伺服器也存在3個區間，和用戶端的情況很接近。但是我們看到了在大概22：57分，系統的處理能力就有一個明顯的下降，随後又提高的尖狀。這說明代碼還需要優化。

整體觀察在3萬QPS區間，伺服器的QPS比較穩定，在6萬QSP時候，伺服器的處理就不穩定了。我相信這和我的代碼有關，如果繼續優化的話，還應該能有更好的效果。

将2張圖合并起來：

基本是吻合的，這也證明系統是符合預期設計的。

這是紅包生成數量的狀态變化圖：

非常的穩定。

這是用戶端每秒擷取的搖紅包狀态：

可以發現3萬QPS區間，用戶端每秒擷取的紅包數基本在200左右，在6萬QPS的時候，以及出現劇烈的抖動，不能保證在200這個數值了。我覺得主要是6萬QPS時候，網絡的抖動加劇了，造成了紅包數目也在抖動。

最後是golang 自帶的pprof 資訊，其中有gc 時間超過了10ms, 考慮到這是一個7年前的硬體，而且非獨占模式，是以還是可以接受。

按照設計目标，我們模拟和設計了一個支援100萬使用者，并且每秒至少可以支援3萬QPS，最多6萬QPS的系統，簡單模拟了微信的搖紅包和發紅包的過程。可以說達到了預期的目的。

如果600台主機每台主機可以支援6萬QPS，隻需要7分鐘就可以完成 100億次搖紅包請求。

雖然這個原型簡單地完成了預設的業務，但是它和真正的服務會有哪些差别呢？我羅列了一下

後端架構設計：如何扛住100億次請求？

繼續閱讀

【網絡篇】第五篇——網絡套接字程式設計(一)(socket詳解)socket程式設計LINUX下socket程式的示範

網絡空間安全中高職業院校職技能大賽——Telnet弱密碼滲透測試

門戶通專訪月光部落格：第一部落格是如何打造成的

解讀2008年網絡技術熱詞之雲計算

磁盤結構及在Linux中的命名

寶塔java項目部署日志路徑

Centos 7 Apache配置虛拟主機

Ubunto 安裝Apache2以後 httpd.conf檔案找不到問題

Apache httpd 安裝啟動demo（Window版）

Apache配置檔案中的deny和allow的使用

最小化DevOps自動化流程(Golang)

配置網頁内容通路

艱難安裝LDAP,SSL認證

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服務

開源按鍵元件Multi_Button的使用,含測試工程