天天看點

F5公司的負載均衡解決方案在銀行中起什麼作用?

  F5公司的負載均衡解決方案在銀行中起什麼作用?今天我們就來探讨一下這個問題。

  我是民生銀行的,我所在銀行采用負載均衡解決方案實作了同城雙活資料中心的業務部署和資料中心之間的業務快速切換,除此之外,在多個資料中心向兩個建立資料中心整合的遷移、IP位址改造和日常業務上線的測試、驗證、釋出及維護過程中也起到了非常大的作用。

  F5公司的技術和産品在金融行業有着廣泛深入的應用, F5整體應用傳遞解決方案中包括多中心多活并行的應用傳遞解決方案,與資料中心多活實踐的需求相吻合。F5的多中心多活并行應用傳遞解決方案在實作多資料中心應用多活部署的同時還包括應用加速、應用安全、集中管理等功能,可立體地滿足業務發展需求。在部署F5多資料中心并行應用傳遞解決方案後,在後續業務擴容和功能追加時可平滑地擴充:當需要增加F5裝置的功能時隻需增加license而無需進行硬體的調整;按需插卡式裝置隻需在原來裝置中添加闆卡即可擴充裝置的性能,而整個架構和裝置的配置均無需發生任何變化。

  F5提供GSLB+LB(即GTM+LTM),RHI,N+M cluster等多種方式的多中心多活并行解決方案,可根據實際的基礎架構和應用需求選擇一種或多種方案實作多資料中心的應用多活。根據我所在銀行的實際需求,我們選擇了GSLB+LB的方案來實作對網際網路業務的雙中心流量的選擇智能引導,N+M Cluster的方案來實作對資料中心内部業務的雙中心狀态探測和切換,具體包括如下的考慮。

  主動的健康檢查:這包括對網絡鍊路狀态監測、對伺服器的應用狀态深度健康檢查,通過F5多樣化的健康檢查方式,可以在鍊路層面、伺服器硬體層面、應用軟體層對雙中心的可用情況做出準确的判斷,進而确定雙中心是否需要切換、以及是整體切換還是部分資源切換。

  靈活的負載分擔政策:建設多活中心的重要特征是“多活”,以充分利用各中心的資源,提升資源使用率。F5可以根據業務需要,基于使用者來源地域、延時情況、使用的營運商、負載權重等不同的因素來制定負載分擔政策,實作在多個資料中心之間進行業務的配置設定。

  基于業務需求的NAT:在多活資料中心的環境中,經常可能的切換對IP位址提出了動态漂移的要求,F5可以提供一對一、一對多、多對多的位址轉換,靈活适應業務切換的需要。

  自定義的iRules:根據多中心的要求,通過F5的iRules腳本的定制編寫,可實作不同業務定制化的流量牽引,例如對雙資料中心的突發流量應急排程牽引,出向流量的優化控制,根據業務場景動态選擇不同的SNAT/SSL profile等;

  可預設定的接管順序:基于F5的N+M cluster機制,通過F5叢集節點之間的切換和接管,牽引業務流在資料中心之間重新分布,更為重要的是,叢集節點之間的切換可以預先定義接管順序,使多活中心的運維是可管理和可預期的,并符合資料中心的分布使得延時和影響最小。這種可以預定義接管順序已在業界得到了實踐驗證。

  盡量減少現有基礎架構變動:基礎架構的調整影響非常大,采用局部優化、循序漸進改造的方式控制風險,對業務的穩定運作非常重要。同時,在實施的過程中,我們重點考慮了雙活資料中心高可用方案的可管理性和可運維性,使之不僅僅隻是一個好的紙面方案,更能是一個好的實踐工程,能真正地在銀行的生産環境中可靠運作。這些實施過程中的考慮要點包括:

  本地同機房切換優先:業務在同機房的切換會影響小些,而如果是同城跨機房的切換,則相對影響要大一些。在考慮基于F5的叢集N+M的切換實作時,我們在兩個同城機房各部署了兩台F5 LTM裝置,一共四台組成N+M叢集,在切換的時候,某一個業務可以從其中一台LTM向其他三台中的一台進行流量牽引。從業務平滑的角度考慮,我們需要優先保證同機房的優先切換,是以,針對每一個業務,在設定N+M叢集的切換順序時,都應該按照先同機房,後同城的順序來設定叢集接管順序。

  管理排程:考慮業務分布在同城雙中心是否按1:1部署。在雙活資料中心的設計中,由于每個資料中心都是“活”的對外承擔業務的,本身容量的設計并不需要1:1的部署,但是考慮到如果一個資料中心完全失效的極端情況下(雙中心割裂是目前的主要風險),另一個資料中心的處理容量應能夠承擔完整的業務量。同時,基于“雙活”的情景,管理排程能力應可以實作對突發流量的應急處理,在多中心之間自動削峰排程。

  切換的協同關聯:在建設雙中心時,往往由于實際客觀條件的限制,會存在某些環節不能實作完全的備援備份,例如最常見的是與不同營運商的網絡出口,例如電信、聯通的線路配備了雙出口,但是移動、廣電等線路還是單出口。我們需要将雙中心的各個環節進行梳理,針對實際建設中的單點環節,專門考慮協同切換,将受影響的因素進行捆綁協同。

  運維自動化考慮:包括和系統、應用的配合互動,包括監控和響應。由于雙活資料中心涉及到的環節和流程特别多,為了更好地運維雙活中心,可采用大量的自動化腳本,同時充分利用F5的iControl接口,可實作一鍵DC切換,一鍵DB切換,自動配置采集及上傳,F5配置合規性檢驗,單一資料中心配置關聯性提取,多資料中心配置一緻性對比,F5應用統一視圖生成等,并和統一運維管理平台進行內建,提升多中心環境下的運維水準和運維能力。筆者所在銀行采用這些功能設計實作了同城雙活資料中心的業務部署和資料中心之間的業務快速切換,除此之外,在多個資料中心向兩個建立資料中心整合的遷移、IP位址改造和日常業務上線的測試、驗證、釋出及維護過程中也起到了非常大的作用。

  使用跨中心雙活叢集,在新資料中心部署業務後,可以無縫的将一個業務從一個中心變為兩個中心雙活。同時跨中心叢集的使用,将A/A, A/S模式的雙機結構擴充為N+M模式,如下圖所示:

 

F5公司的負載均衡解決方案在銀行中起什麼作用?

  通過SNAT功能,将服務位址與真實伺服器完全解耦。F5裝置所在的位置與伺服器位置完全無關,這樣就給予應用在資料中心之間遷移或搬遷最大的靈活度,當一個業務系統要從A中心的搬遷到B中心時,完全不需要進行業務中斷。IP位址的改造時,可以留給業務系統更多的彈性時間。在多中心整合過程中建構業務多活場景,簡化業務遷移過程,最終整合為同城雙中心。

  通過負載均衡裝置進行差異化業務驗證。多中心運作的業務,在進行業務測試或變更過程中,通過負載均衡技術可以将部分或特定的業務通路(比如指定用戶端IP或HTTP URI等)發送到指定伺服器進行業務驗證。

  同城多中心均能承擔業務流量并周期性進行故障演練,演練涉及各個節點的故障模拟場景,多中心的以不同業務負載比例線上服務,實時驗證“備用”環境的可用性,杜絕真正發生一個資料中心故障時切換不成功的問題。

  裝置的多角色分權管理。負載均衡裝置涉及與應用相關的處理,橫跨多個部門,是以裝置的分權管理尤為重要,既要有相關變更權限,又要避免互相影響。是以在資料中心裝置管理中,負載均衡裝置管理者權限由網絡部門統一管理,同時可為不同應用部門配置設定不同的隻針對其職責内的變更和配置權限,将具體應用層面的日常操作從網絡部門裝置運維中剝離,既簡化運維管理工作,又能明确權責劃分。

  資料中心實作多活後,效益是多方面的,不僅提高了業務的持續性,同時還在資産使用效率等方面提高顯著:

  快速感覺和故障快速恢複:當一個資料中心業務發生故障時,健康檢查和探測對故障的感覺降到分鐘級甚至秒級,在大部分故障場景下,可實作分鐘級甚至秒級的切換。

  按需切換:當伺服器或業務需要切換時,并不需要把全部應用都切換至備份中心。

  資産盤活:在傳統主備資料中心的模型中,備份資料中心完全不進行業務處理而僅僅做為熱備或冷備,這對資源的使用是極大的浪費。多活資料中心的引入則盤活了備用的資産,提高了資産使用率。

  通過F5這些方案和功能設計,我所在銀行目前已完成20餘套業務系統的雙中心部署及多套系統的同城多中心整合遷移,并在實際使用、維護過程中得到驗證。

  多活資料中心作為資料中心發展的一個階段,其必然不是一成不變的,随着業務需求的不斷發展,資料中心還将朝更加先進的方向前進,而負載均衡解決方案在目前及可預見的相當一段時間内仍有很大的使用空間,是以,利用負載均衡解決方案來配合多中心建設是一項非常具有實際意義的實踐。

繼續閱讀