天天看點

大型分布式網站架構技術總結:高性能+高可用+可擴充+可伸縮架構

本文是大型分布式網站架構的技術總結,文末有分布式架構設計33精講資料~

一、大型網站架構特點

使用者多,分布廣泛

大流量,高并發

海量資料,服務高可用

安全環境惡劣,易受網絡攻擊

功能多,變更快,頻繁釋出

從小到大,漸進發展

以使用者為中心

免費服務,付費體驗

二、大型網站架構目标

高性能:提供快速的通路體驗。

高可用:網站服務一直可以正常通路。

可伸縮:通過硬體增加/減少,提高/降低處理能力。

安全性:提供網站安全通路和資料加密,安全存儲等政策。

擴充性:友善的通過新增/移除方式,增加/減少新的功能/子產品。

靈活性:随需應變,快速響應;

三、大型網站架構模式

分層:一般可分為,應用層,服務層,資料層,管理層,分析層;

分割:一般按照業務/子產品/功能特點進行劃分,比如應用層分為首頁,使用者中心。

分布式:将應用分開部署(比如多台實體機),通過遠端調用協同工作。

叢集:一個應用/子產品/功能部署多份(如:多台實體機),通過負載均衡共同提供對外通路。

緩存:将資料放在距離應用或使用者最近的位置,加快通路速度。

異步:将同步的操作異步化。用戶端送出請求,不等待服務端響應,等服務端處理完畢後,使用通知或輪詢的方式告知請求方。一般指:請求——響應——通知 模式。

備援:增加副本,提高可用性,安全性,性能。

安全:對已知問題有有效的解決方案,對未知/潛在問題建立發現和防禦機制。

自動化:将重複的,不需要人工參與的事情,通過工具的方式,使用機器完成。

靈活性:積極接受需求變更,快速響應業務發展需求。

四、高性能架構

以使用者為中心,提供快速的網頁通路體驗。主要參數有較短的響應時間,較大的并發處理能力,較高的吞吐量,穩定的性能參數。

可分為前端優化,應用層優化,代碼層優化,存儲層優化。

前端優化:網站業務邏輯之前的部分;

浏覽器優化:減少Http請求數,使用浏覽器緩存,啟用壓縮,Css Js位置,Js異步,減少Cookie傳輸;

CDN加速,反向代理;

應用層優化:處理網站業務的伺服器。使用緩存,異步,叢集

代碼優化:合理的架構,多線程,資源複用(對象池,線程池等),良好的資料結構,JVM調優,單例,Cache等;

存儲優化:緩存,固态硬碟,光纖傳輸,優化讀寫,磁盤備援,分布式存儲(HDFS),NOSQL等;

五、高可用架構

大型網站應該在任何時候都可以正常通路。正常提供對外服務。因為大型網站的複雜性,分布式,廉價伺服器,開源資料庫,作業系統等特點。要保證高可用是很困難的,也就是說網站的故障是不可避免的。

如何提高可用性,就是需要迫切解決的問題。首先,需要從架構級别,在規劃的時候,就考慮可用性。行業内一般用幾個9表示可用性名額。比如四個9(99.99),一年内允許的不可用時間是53分鐘。

不同層級使用的政策不同,一般采用備援備份和失效轉移解決高可用問題。

應用層:一般設計為無狀态的,對于每次請求,使用哪一台伺服器處理是沒有影響的。一般使用負載均衡技術(需要解決Session同步問題),實作高可用。

服務層:負載均衡,分級管理,快速失敗(逾時設定),異步調用,服務降級,幂等設計等。

資料層:備援備份(冷,熱備[同步,異步],溫備),失效轉移(确認,轉移,恢複)。資料高可用方面著名的理論基礎是CAP理論(持久性,可用性,資料一緻性[強一緻,使用者一緻,最終一緻])

六、可伸縮架構

伸縮性是指在不改變原有架構設計的基礎上,通過添加/減少硬體(伺服器)的方式,提高/降低系統的處理能力。

應用層:對應用進行垂直或水準切分。然後針對單一功能進行負載均衡(DNS,HTTP[反向代理],IP,鍊路層)。

服務層:與應用層類似;

資料層:分庫,分表,NOSQL等;常用算法Hash,一緻性Hash。

七、可擴充架構

可以友善的進行功能子產品的新增/移除,提供代碼/子產品級别良好的可擴充性。

子產品化,元件化:高内聚,内耦合,提高複用性,擴充性。

穩定接口:定義穩定的接口,在接口不變的情況下,内部結構可以“随意”變化。

設計模式:應用面向對象思想,原則,使用設計模式,進行代碼層面的設計。

消息隊列:子產品化的系統,通過消息隊列進行互動,使子產品之間的依賴解耦。

分布式服務:公用子產品服務化,提供其他系統使用,提高可重用性,擴充性。

八、安全架構

對于安全問題,首先要提高安全意識,建立一個安全的有效機制,從政策層面,組織層面進行保障。比如伺服器密碼不能洩露,密碼每月更新,并且三次内不能重複;每周安全掃描等。以制度化的方式,加強安全體系的建設。同時,需要注意與安全有關的各個環節。安全問題不容忽視。包括基礎設施安全,應用系統安全,資料保密安全等。

基礎設施安全:硬體采購,作業系統,網絡環境方面的安全。一般采用,正規管道購買高品質的産品,選擇安全的作業系統,及時修補漏洞,安裝防毒軟體防火牆。防範病毒,後門。設定防火牆政策,建立DDOS防禦系統,使用攻擊檢測系統,進行 子網隔離等手段。

應用系統安全:在程式開發時,對已知常用問題,使用正确的方式,在代碼層面解決掉。防止跨站腳本攻擊(XSS),注入攻擊,跨站請求僞造(CSRF),錯誤資訊,HTML注釋,檔案上傳,路徑周遊等。還可以使用Web應用防火牆(比如:ModSecurity),進行安全漏洞掃描等措施,加強應用級别的安全。

資料保密安全:存儲安全(存在在可靠的裝置,實時,定時備份),儲存安全(重要的資訊加密儲存,選擇合适的人員複雜儲存和檢測等),傳輸安全(防止資料竊取和資料篡改);

常用的加解密算法(單項散列加密[MD5,SHA],對稱加密[DES,3DES,RC]),非對稱加密[RSA]等。

九、靈活性

網站的架構設計,運維管理要适應變化,提供高伸縮性,高擴充性。友善的應對快速的業務發展,突增高流量通路等要求。

除上面介紹的架構要素外,還需要引入靈活管理,靈活開發的思想。使業務,産品,技術,運維統一起來,随需應變,快速響應。

十、大型架構舉例

以上采用七層邏輯架構:

第一層客戶層

第二層前端優化層

第三層應用層

第四層服務層

第五層資料存儲層

第六層大資料存儲層

第七層大資料處理層。

客戶層:支援PC浏覽器和手機APP。差别是手機APP可以直接通路通過IP通路,反向代理伺服器。

前端層:使用DNS負載均衡,CDN本地加速以及反向代理服務;

應用層:網站應用叢集;按照業務進行垂直拆分,比如商品應用,會員中心等;

服務層:提供公用服務,比如使用者服務,訂單服務,支付服務等;

資料層:支援關系型資料庫叢集(支援讀寫分離),NOSQL叢集,分布式檔案系統叢集;以及分布式Cache;

大資料存儲層:支援應用層和服務層的日志資料收集,關系資料庫和NOSQL資料庫的結構化和半結構化資料收集;

大資料處理層:通過Mapreduce進行離線資料分析或Storm實時資料分析,并将處理後的資料存入關系型資料庫。(實際使用中,離線資料和實時資料會按照業務要求進行分類處理,并存入不同的資料庫中,供應用層或服務層使

更多分布式架構設計33精講

歡迎Java工程師朋友們加入Java工程師學習交流群:795632998,進群即可領取資料。群内提供免費的Java架構學習資料(裡面有高可用、高并發、高性能及分布式、Jvm性能調優、Spring源碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料)合理利用自己每一分每一秒的時間來學習提升自己,不要再用"沒有時間“來掩飾自己思想上的懶惰!趁年輕,使勁拼,給未來的自己一個交代!