前言
很多小夥伴回報說,高并發專題學了那麼久,但是,在真正做項目時,仍然不知道如何下手處理高并發業務場景!甚至很多小夥伴仍然停留在隻是簡單的提供接口(CRUD)階段,不知道學習的并發知識如何運用到實際項目中,就更别提如何建構高并發系統了!
究竟什麼樣的系統算是高并發系統?今天,我們就一起解密高并發業務場景下典型的秒殺系統的架構,結合高并發專題下的其他文章,學以緻用。
電商系統架構
在電商領域,存在着典型的秒殺業務場景,那何謂秒殺場景呢。簡單的來說就是一件商品的購買人數遠遠大于這件商品的庫存,而且這件商品在很短的時間内就會被搶購一空。 比如每年的618、雙11大促,小米新品促銷等業務場景,就是典型的秒殺業務場景。
我們可以将電商系統的架構簡化成下圖所示。
由圖所示,我們可以簡單的将電商系統的核心層分為:負載均衡層、應用層和持久層。接下來,我們就預估下每一層的并發量。
- 假如負載均衡層使用的是高性能的Nginx,則我們可以預估Nginx最大的并發度為:10W+,這裡是以萬為機關。
- 假設應用層我們使用的是Tomcat,而Tomcat的最大并發度可以預估為800左右,這裡是以百為機關。
- 假設持久層的緩存使用的是Redis,資料庫使用的是MySQL,MySQL的最大并發度可以預估為1000左右,以千為機關。Redis的最大并發度可以預估為5W左右,以萬為機關。
是以,負載均衡層、應用層和持久層各自的并發度是不同的,那麼,為了提升系統的總體并發度和緩存,我們通常可以采取哪些方案呢?
(1)系統擴容
系統擴容包括垂直擴容和水準擴容,增加裝置和機器配置,絕大多數的場景有效。
(2)緩存
本地緩存或者集中式緩存,減少網絡IO,基于記憶體讀取資料。大部分場景有效。
(3)讀寫分離
采用讀寫分離,分而治之,增加機器的并行處理能力。
秒殺系統的特點
對于秒殺系統來說,我們可以從業務和技術兩個角度來闡述其自身存在的一些特點。
秒殺系統的業務特點
這裡,我們可以使用12306網站來舉例,每年春運時,12306網站的通路量是非常大的,但是網站平時的通路量卻是比較平緩的,也就是說,每年春運時節,12306網站的通路量會出現瞬時突增的現象。
再比如,小米秒殺系統,在上午10點開售商品,10點前的通路量比較平緩,10點時同樣會出現并發量瞬時突增的現象。
是以,秒殺系統的流量和并發量我們可以使用下圖來表示。
由圖可以看出,秒殺系統的并發量存在瞬時凸峰的特點,也叫做流量突刺現象。
我們可以将秒殺系統的特點總結如下。
(1)限時、限量、限價
在規定的時間内進行;秒殺活動中商品的數量有限;商品的價格會遠遠低于原來的價格,也就是說,在秒殺活動中,商品會以遠遠低于原來的價格出售。
例如,秒殺活動的時間僅限于某天上午10點到10點半,商品數量隻有10萬件,售完為止,而且商品的價格非常低,例如:1元購等業務場景。
限時、限量和限價可以單獨存在,也可以組合存在。
(2)活動預熱
需要提前配置活動;活動還未開始時,使用者可以檢視活動的相關資訊;秒殺活動開始前,對活動進行大力宣傳。
(3)持續時間短
購買的人數數量龐大;商品會迅速售完。
在系統流量呈現上,就會出現一個突刺現象,此時的并發通路量是非常高的,大部分秒殺場景下,商品會在極短的時間内售完。
秒殺系統的技術特點
我們可以将秒殺系統的技術特點總結如下。
(1)瞬時并發量非常高
大量使用者會在同一時間搶購商品;瞬間并發峰值非常高。
(2)讀多寫少
系統中商品頁的通路量巨大;商品的可購買數量非常少;庫存的查詢通路數量遠遠大于商品的購買數量。
在商品頁中往往會加入一些限流措施,例如早期的秒殺系統商品頁會加入驗證碼來平滑前端對系統的通路流量,近期的秒殺系統商品詳情頁會在使用者打開頁面時,提示使用者登入系統。這都是對系統的通路進行限流的一些措施。
(3)流程簡單
秒殺系統的業務流程一般比較簡單;總體上來說,秒殺系統的業務流程可以概括為:下單減庫存。
針對這種短時間内大流量的系統來說,就不太适合使用系統擴容了,因為即使系統擴容了,也就是在很短的時間内會使用到擴容後的系統,大部分時間内,系統無需擴容即可正常通路。 那麼,我們可以采取哪些方案來提升系統的秒殺性能呢?
秒殺系統方案
針對秒殺系統的特點,我們可以采取如下的措施來提升系統的性能。
(1)異步解耦
将整體流程進行拆解,核心流程通過隊列方式進行控制。
(2)限流防刷
控制網站整體流量,提高請求的門檻,避免系統資源耗盡。
(3)資源控制
将整體流程中的資源排程進行控制,揚長避短。
由于應用層能夠承載的并發量比緩存的并發量少很多。是以,在高并發系統中,我們可以直接使用OpenResty由負載均衡層通路緩存,避免了調用應用層的性能損耗。大家可以到https://openresty.org/cn/來了解有關OpenResty更多的知識。同時,由于秒殺系統中,商品數量比較少,我們也可以使用動态渲染技術,CDN技術來加速網站的通路性能。
如果在秒殺活動開始時,并發量太高時,我們可以将使用者的請求放入隊列中進行處理,并為使用者彈出排隊頁面。
秒殺系統時序圖
網上很多的秒殺系統和對秒殺系統的解決方案,并不是真正的秒殺系統,他們采用的隻是同步處理請求的方案,一旦并發量真的上來了,他們所謂的秒殺系統的性能會急劇下降。我們先來看一下秒殺系統在同步下單時的時序圖。
同步下單流程
1.使用者發起秒殺請求
在同步下單流程中,首先,使用者發起秒殺請求。商城服務需要依次執行如下流程來處理秒殺請求的業務。
(1)識别驗證碼是否正确
商城服務判斷使用者發起秒殺請求時送出的驗證碼是否正确。
(2)判斷活動是否已經結束
驗證目前秒殺活動是否已經結束。
(3)驗證通路請求是否處于黑名單
在電商領域中,存在着很多的惡意競争,也就是說,其他商家可能會通過不正當手段來惡意請求秒殺系統,占用系統大量的帶寬和其他系統資源。此時,就需要使用風控系統等實作黑名單機制。為了簡單,也可以使用攔截器統計通路頻次實作黑名單機制。
(4)驗證真實庫存是否足夠
系統需要驗證商品的真實庫存是否足夠,是否能夠支援本次秒殺活動的商品庫存量。
(5)扣減緩存中的庫存
在秒殺業務中,往往會将商品庫存等資訊存放在緩存中,此時,還需要驗證秒殺活動使用的商品庫存是否足夠,并且需要扣減秒殺活動的商品庫存數量。
(6)計算秒殺的價格
由于在秒殺活動中,商品的秒殺價格和商品的真實價格存在差異,是以,需要計算商品的秒殺價格。
注意:如果在秒殺場景中,系統涉及的業務更加複雜的話,會涉及更多的業務操作,這裡,我隻是列舉出一些常見的業務操作。
2.送出訂單
(1)訂單入口
将使用者送出的訂單資訊儲存到資料庫中。
(2)扣減真實庫存
訂單入庫後,需要在商品的真實庫存中将本次成功下單的商品數量扣除。
如果我們使用上述流程開發了一個秒殺系統,當使用者發起秒殺請求時,由于系統每個業務流程都是串行執行的,整體上系統的性能不會太高,當并發量太高時,我們會為使用者彈出下面的排隊頁面,來提示使用者進行等待。
此時的排隊時間可能是15秒,也可能是30秒,甚至是更長時間。這就存在一個問題:在使用者發起秒殺請求到伺服器傳回結果的這段時間内,用戶端和伺服器之間的連接配接不會被釋放,這就會占大量占用伺服器的資源。
網上很多介紹如何實作秒殺系統的文章都是采用的這種方式,那麼,這種方式能做秒殺系統嗎?答案是可以做,但是這種方式支撐的并發量并不是太高。此時,有些網友可能會問:我們公司就是這樣做的秒殺系統啊!上線後一直在用,沒啥問題啊!我想說的是:使用同步下單方式确實可以做秒殺系統,但是同步下單的性能不會太高。之是以你們公司采用同步下單的方式做秒殺系統沒出現大的問題,那是因為你們的秒殺系統的并發量沒達到一定的量級,也就是說,你們的秒殺系統的并發量其實并不高。
是以,很多所謂的秒殺系統,存在着秒殺的業務,但是稱不上真正的秒殺系統,原因就在于他們使用的是同步的下單流程,限制了系統的并發流量。之是以上線後沒出現太大的問題,是因為系統的并發量不高,不足以壓死整個系統。
如果12306、淘寶、天貓、京東、小米等大型商城的秒殺系統是這麼玩的話,那麼,他們的系統遲早會被玩死,他們的系統工程師不被開除才怪!是以,在秒殺系統中,這種同步處理下單的業務流程的方案是不可取的。
以上就是同步下單的整個流程操作,如果下單流程更加複雜的話,就會涉及到更多的業務操作。
異步下單流程
既然同步下單流程的秒殺系統稱不上真正的秒殺系統,那我們就需要采用異步的下單流程了。異步的下單流程不會限制系統的高并發流量。
使用者發起秒殺請求後,商城服務會經過如下業務流程。
(1)檢測驗證碼是否正确
使用者發起秒殺請求時,會将驗證碼一同發送過來,系統會檢驗驗證碼是否有效,并且是否正确。
(2)是否限流
系統會對使用者的請求進行是否限流的判斷,這裡,我們可以通過判斷消息隊列的長度來進行判斷。因為我們将使用者的請求放在了消息隊列中,消息隊列中堆積的是使用者的請求,我們可以根據目前消息隊列中存在的待處理的請求數量來判斷是否需要對使用者的請求進行限流處理。
例如,在秒殺活動中,我們出售1000件商品,此時在消息隊列中存在1000個請求,如果後續仍然有使用者發起秒殺請求,則後續的請求我們可以不再處理,直接向使用者傳回商品已售完的提示。
是以,使用限流後,我們可以更快的處理使用者的請求和釋放連接配接的資源。
(3)發送MQ
使用者的秒殺請求通過前面的驗證後,我們就可以将使用者的請求參數等資訊發送到MQ中進行異步處理,同時,向使用者響應結果資訊。在商城服務中,會有專門的異步任務處理子產品來消費消息隊列中的請求,并處理後續的異步流程。
在使用者發起秒殺請求時,異步下單流程比同步下單流程處理的業務操作更少,它将後續的操作通過MQ發送給異步處理子產品進行處理,并迅速向使用者傳回響應結果,釋放請求連接配接。
2.異步處理
我們可以将下單流程的如下操作進行異步處理。
(1)判斷活動是否已經結束
(2)判斷本次請求是否處于系統黑名單,為了防止電商領域同行的惡意競争可以為系統增加黑名單機制,将惡意的請求放入系統的黑名單中。可以使用攔截器統計通路頻次來實作。
(3)扣減緩存中的秒殺商品的庫存數量。
(4)生成秒殺Token,這個Token是綁定目前使用者和目前秒殺活動的,隻有生成了秒殺Token的請求才有資格進行秒殺活動。
這裡我們引入了異步處理機制,在異步進行中,系統使用多少資源,配置設定多少線程來處理相應的任務,是可以進行控制的。
3.短輪詢查詢秒殺結果
這裡,可以采取用戶端短輪詢查詢是否獲得秒殺資格的方案。例如,用戶端可以每隔3秒鐘輪詢請求伺服器,查詢是否獲得秒殺資格,這裡,我們在伺服器的處理就是判斷目前使用者是否存在秒殺Token,如果伺服器為目前使用者生成了秒殺Token,則目前使用者存在秒殺資格。否則繼續輪詢查詢,直到逾時或者伺服器傳回商品已售完或者無秒殺資格等資訊為止。
采用短輪詢查詢秒殺結果時,在頁面上我們同樣可以提示使用者排隊進行中,但是此時用戶端會每隔幾秒輪詢伺服器查詢秒殺資格的狀态,相比于同步下單流程來說,無需長時間占用請求連接配接。
此時,可能會有網友會問:采用短輪詢查詢的方式,會不會存在直到逾時也查詢不到是否具有秒殺資格的狀态呢?答案是:有可能! 這裡我們試想一下秒殺的真實場景,商家參加秒殺活動本質上不是為了賺錢,而是提升商品的銷量和商家的知名度,吸引更多的使用者來買自己的商品。是以,我們不必保證使用者能夠100%的查詢到是否具有秒殺資格的狀态。
4.秒殺結算
(1)驗證下單Token
用戶端送出秒殺結算時,會将秒殺Token一同送出到伺服器,商城服務會驗證目前的秒殺Token是否有效。
(2)加入秒殺購物車
商城服務在驗證秒殺Token合法并有效後,會将使用者秒殺的商品添加到秒殺購物車。
5.送出訂單
(1)訂單入庫
(2)删除Token
秒殺商品訂單入庫成功後,删除秒殺Token。
這裡大家可以思考一個問題:我們為什麼隻在異步下單流程的粉色部分采用異步處理,而沒有在其他部分采取異步削峰和填谷的措施呢?
這是因為在異步下單流程的設計中,無論是在産品設計上還是在接口設計上,我們在使用者發起秒殺請求階段對使用者的請求進行了限流操作,可以說,系統的限流操作是非常前置的。在使用者發起秒殺請求時進行了限流,系統的高峰流量已經被平滑解決了,再往後走,其實系統的并發量和系統流量并不是非常高了。
是以,網上很多的文章和文章中在介紹秒殺系統時,說是在下單時使用異步削峰來進行一些限流操作,那都是在扯淡! 因為下單操作在整個秒殺系統的流程中屬于比較靠後的操作了,限流操作一定要前置處理,在秒殺業務後面的流程中做限流操作是沒啥卵用的。
高并發“黑科技”與緻勝奇招
假設,在秒殺系統中我們使用Redis實作緩存,假設Redis的讀寫并發量在5萬左右。我們的商城秒殺業務需要支援的并發量在100萬左右。如果這100萬的并發全部打入Redis中,Redis很可能就會挂掉,那麼,我們如何解決這個問題呢?接下來,我們就一起來探讨這個問題。
在高并發的秒殺系統中,如果采用Redis緩存資料,則Redis緩存的并發處理能力是關鍵,因為很多的字首操作都需要通路Redis。而異步削峰隻是基本的操作,關鍵還是要保證Redis的并發處理能力。
解決這個問題的關鍵思想就是:分而治之,将商品庫存分開放。
暗度陳倉
我們在Redis中存儲秒殺商品的庫存數量時,可以将秒殺商品的庫存進行“分割”存儲來提升Redis的讀寫并發量。
例如,原來的秒殺商品的id為10001,庫存為1000件,在Redis中的存儲為(10001, 1000),我們将原有的庫存分割為5份,則每份的庫存為200件,此時,我們在Redia中存儲的資訊為(10001_0, 200),(10001_1, 200),(10001_2, 200),(10001_3, 200),(10001_4, 200)。
此時,我們将庫存進行分割後,每個分割後的庫存使用商品id加上一個數字辨別來存儲,這樣,在對存儲商品庫存的每個Key進行Hash運算時,得出的Hash結果是不同的,這就說明,存儲商品庫存的Key有很大機率不在Redis的同一個槽位中,這就能夠提升Redis處理請求的性能和并發量。
分割庫存後,我們還需要在Redis中存儲一份商品id和分割庫存後的Key的映射關系,此時映射關系的Key為商品的id,也就是10001,Value為分割庫存後存儲庫存資訊的Key,也就是10001_0,10001_1,10001_2,10001_3,10001_4。在Redis中我們可以使用List來存儲這些值。
在真正處理庫存資訊時,我們可以先從Redis中查詢出秒殺商品對應的分割庫存後的所有Key,同時使用AtomicLong來記錄目前的請求數量,使用請求數量對從Redia中查詢出的秒殺商品對應的分割庫存後的所有Key的長度進行求模運算,得出的結果為0,1,2,3,4。再在前面拼接上商品id就可以得出真正的庫存緩存的Key。此時,就可以根據這個Key直接到Redis中擷取相應的庫存資訊。
移花接木
在高并發業務場景中,我們可以直接使用Lua腳本庫(OpenResty)從負載均衡層直接通路緩存。
這裡,我們思考一個場景:如果在秒殺業務場景中,秒殺的商品被瞬間搶購一空。此時,使用者再發起秒殺請求時,如果系統由負載均衡層請求應用層的各個服務,再由應用層的各個服務通路緩存和資料庫,其實,本質上已經沒有任何意義了,因為商品已經賣完了,再通過系統的應用層進行層層校驗已經沒有太多意義了!!而應用層的并發通路量是以百為機關的,這又在一定程度上會降低系統的并發度。
為了解決這個問題,此時,我們可以在系統的負載均衡層取出使用者發送請求時攜帶的使用者id,商品id和秒殺活動id等資訊,直接通過Lua腳本等技術來通路緩存中的庫存資訊。如果秒殺商品的庫存小于或者等于0,則直接傳回使用者商品已售完的提示資訊,而不用再經過應用層的層層校驗了。 針對這個架構,我們可以參見本文中的電商系統的架構圖(正文開始的第一張圖)。
寫在最後
如果覺得文章對你有點幫助,請微信搜尋并關注「 冰河技術 」微信公衆号,跟冰河學習高并發程式設計技術。
最後,附上并發程式設計需要掌握的核心技能知識圖,祝大家在學習并發程式設計時,少走彎路。
分類: 高并發