天天看點

新型雲網融合編排與排程系統架構與分析

作者:AI智能官

算力時代,新型算力業務的異構資料處理需要雲邊協同的泛在化算力支援,同時算力也在向包括算力、存力、運力與能力的新型算力演進,以滿足新型算力業務對算力服務的多樣化需求,這就需要雲網融合編排排程系統具備自動化、智能化、孿生化的新型算力編排排程能力,實作雲網全局拓撲下,業務目标服務等級協定與雲網資源組合的聯合最優解,進而提升算力效能。在分析現有雲網融合編排排程系統不足的基礎上,提出了一種自動化、智能化與孿生化的新型雲網融合編排排程系統架構,給出了典型場景,并提出營運商雲網融合編排與排程系統的演進路徑建議。

引言

算力作為數字時代的核心資源,不僅改變了人類的生産方式、生活模式和科研範式,而且逐漸成為科技進步和經濟社會發展的底座,預示着算力成為數字經濟的主要生産力[1]。随着算力技術的發展,算力呈現出多樣性、泛在化、智能化、綠色化與可信化等趨勢[2],對雲網融合成為一體化的數字資訊基礎設施提出了迫切需求,雲網融合成為數字資訊基礎設施的核心,算力基礎設施是其重要組成部分。

随着智慧城市、智能制造、自動駕駛(Vehicle to X,V2X)、增強現實(Augmented Reality,AR)/虛拟現實(Virtual Reality,VR)/擴充現實(Extended Reality,XR)等新型算力業務場景的出現,算力資源需求日益旺盛,驅動資料中心高速發展。到2025年,全球網聯裝置總數将超過270 億,超過75%的資料需要分流到網絡邊緣側,各類新型算力業務的異構資料處理需要雲邊協同的泛在化算力支援[3]。截至2022年年初,大陸已建成資料中心500 萬标準機架,整體算力達到130 EFLOPS,但受限于算力的泛在化特征,國内資料中心的平均使用率僅為55%左右,需要通過自動化、智能化、孿生化的雲網融合編排排程實作算力的效能提升[4]。

同時,算力的定義也從原有的CPU類基礎算力、GPU類智能算力向包括算力(基礎算力、智能算力、超算算力等)、存力(存儲容量、存儲效能等)、運力(網絡資源、性能與品質等)與能力(AI、大資料、區塊鍊等通用目的技術能力等)的新型算力演進,以便滿足新型算力業務對算力服務的多樣化需求。這就需要雲網融合編排排程系統具備自動化、智能化、孿生化的算力、運力、存力與能力的編排排程能力,并實作在雲網全局拓撲下,業務目标服務等級協定(Service Level Agreement,SLA)與雲網資源組合的聯合最優解。

雲網融合編排與排程系統現狀與不足

通信營運商早期的雲網融合實踐以雲網業務聯合快速開通為主要抓手,以軟體定義網絡(Software Defined Network,SDN)/網絡功能虛拟化(Network Function Virtualization,NFV)技術實作為主要特征,實作了網絡控制系統與自身雲管理系統和外部主要公有雲業務系統的互聯互通,進而使雲網業務的同開同調成為可能[5],該階段實作了雲網融合業務的流程貫通與初步自動化(見圖1)。

新型雲網融合編排與排程系統架構與分析

早期雲網融合編排與排程系統

算力時代,随着新型算力業務的發展,雲網融合編排與排程系統需要支援泛在算力與多樣算力服務的編排與排程,早期的雲網融合編排與排程系統存在以下3方面不足。

(1)自動化不足。雲網融合時代早期,以雲為主體,旨在将不同地理位置、規模各異的雲計算節點統一納管到一套雲管理系統中,為雲使用者提供标準統一、高效便捷、安全可靠的雲服務。但在雲網融合初級階段,網絡能力開放程度有限,尤其是在網絡接入側。由于泛終端接入位置的廣泛性和不确定性,雲廠商很難建構或租用一張泛在接入網絡的基礎設施實作算力的随時随地接入。另外,最重要的短闆在于,由于網絡開放能力的缺失以及雲和網統一編排排程的标準缺失,雲網融合編排與排程系統無法自動、靈活、實時地根據使用者需求選擇并調配恰當的算力資源與網絡資源,無從實作算力在雲、邊、端的自動化協同排程,亦無法滿足新型算力業務驅動的算力,算力+能力(AI、數字孿生等通用目的技術)與算力+算力應用的編排排程需求。

(2)智能化不足。雲網融合時代早期,雲和網的業務SLA是獨立的,網絡提供帶寬、時延等資源與性能SLA保障,雲提供虛機CPU、記憶體等資源與性能SLA保障。但是到了算力時代,新型算力業務需要實作面向算力、運力、存力的多元雲網資源組合與客戶目标SLA聯合最優。早期的雲網融合編排排程系統由于缺少基于人工智能技術的智能化編排與排程,無法實作在雲網全局拓撲下,業務目标服務等級協定(Service Level Agreement,SLA)與雲網資源組合的聯合最優解。

(3)孿生化不足。目前,網絡數字孿生技術基于數字孿生與人工智能等技術,已基本實作通信網絡全要素全生命周期的數字化管理,支撐全程全網業務的編排仿真、流量預測、新業務預測試、配置預稽核、網絡預規劃等服務[6]。算力時代,為更好地支撐新型雲網融合業務,需實作從網絡數字孿生向雲網數字孿生的演進,實作雲網融合業務的編排仿真、态勢感覺、需求預測與創新引流(将雲網數字孿生作為算力應用對外提供服務)。

是以,為滿足算力時代新型算力業務的算力泛在化與算力服務多樣化的需求,需建設自動化、智能化與孿生化的新型雲網融合編排與排程系統,實作算力、存力、運力與能力的雲邊協同智能編排與排程。

新型雲網融合編排與排程系統架構與關鍵技術

新型雲網融合編排與排程系統架構

基于新型算力業務對雲網融合編排與排程系統的自動化、智能化與孿生化編排與排程需求,建議新型雲網融合編排與排程系統架構如圖2所示,主要包括雲網編排中心、雲網管理排程中心、雲網數字孿生中心與雲網智能引擎。

新型雲網融合編排與排程系統架構與分析

新型雲網融合編排與排程系統

(1)雲網融合編排中心

雲網編排中心實作雲網融合業務網絡和雲資源、流程、模型等的統一編排,北向對接客戶關系管理(Customer Relationship Management,CRM)等雲網融合業務營運系統,接受業務編排請求;南向對接網絡管理調中心和雲管理排程中心,實作運力、算力、存力與能力的排程;東西向連接配接雲網智能引擎和雲網數字孿生中心系統,實作編排注智與仿真等。

雲網編排中心支援算力、存力、運力(網絡)資源資料的實時感覺,實作算力、存力與運力(網絡)的融合資源視圖,并基于人工智能、數字孿生等新技術實作雲網業務的資源需求分析與端到端雲網資源一體編排,最終完成運力、算力、存力與能力的一體編排。相比早期的雲網編排系統,新型雲網編排系統可以兼顧算力、運力(網絡)、存力等多個資源次元因素,實作資源聯合價值最大化。

(2)雲網管理排程中心

雲網管理排程中心包括網絡與雲管理排程中心,其中網絡管理排程中心負責網絡(運力)的排程管理。北向對接雲網編排中心,接受網絡排程請求;南向對接雲網基礎設施,完成網絡配置激活;東西向連接配接雲網智能引擎和數字孿生中心,實作網絡排程注智。雲管理排程中心負責算力、存力、算力應用與能力服務的排程管理。北向對接雲網編排中心,為算力與存力的排程、編排和管理提供決策資料;南向對接雲網基礎設施,執行雲網編排中心的指令,執行雲排程、算力節點并網、資源同步,雲網應用部署和為使用者提供雲資源綁定等服務。

網絡管理排程中心支援跨域端到端網絡管理排程,實作端到端網絡配置管理、性能管理和告警管理以及多域資料采集,包括IP網、光傳送網(Optical Transport Network,OTN)/切片分組網(Slicing Packet Network,SPN)/無源光網絡(Passive Optical Network,PON)等傳輸網,5G核心網與5G無線網等。網絡管理排程中心支援端到端網絡性能需求到單域網絡性能需求的分解,實作網絡性能需求到網絡配置要求的映射。

雲管理排程中支援雲原生化的容器管理,支援包括多個雲資源的排程分發以及相應的雲服務的彈性伸縮管理,并為雲網提供算力注冊、發現、排程與雲網應用的部署能力。

(3)雲網智能引擎

雲網智能引擎是雲網融合編排與排程系統的智能決策中樞,通過模型訓練和推理服務,提供節點能力評估、路徑尋優、意圖識别、資源排程等AI能力,為雲網融合編排與排程系統提供注智引擎和AI服務,最終實作雲網全局圖譜下,雲網融合業務目标SLA與雲網資源組合的聯合最優解。

雲網智能引擎内置雲網資源多因子名額體系,如帶寬、時延、容量、吞吐率、成本等,可根據需求實作多元度精細化解析,以保障選擇最優算網節點和網絡最優路徑。雲網智能引擎從場景出發,結合目前資源消耗和網絡拓撲結構,可自動推薦算網節點和網絡路徑的最佳編排政策。

(4)雲網數字孿生中心

雲網數字孿生中心為雲網融合編排與排程系統提供編排仿真、态勢感覺、業務預測與創新引流等服務。雲網數字孿生中心以數字化方式建立雲網實體的虛拟孿生體,且可與雲網實體進行實時互動映射。通過實時或者非實時的資料采集方式将實體實體資料、空間資料、資源資料,以及協定、接口、路由、信令、流程、性能、告警、日志、狀态等資訊存儲到資料倉庫,為建構雲網孿生體以及為雲網孿生體賦能提供資料支撐,并且基于這些資料形成功能豐富的資料模型。

雲網數字孿生中心支援通過靈活組合的方式建立多種雲網模型執行個體,服務于各種雲網應用,并提供基于低代碼的可視化搭建工具,對已有拓撲、圖表與符号資源進行拖拉拽操作,實作三維雲網數字孿生可視化應用。雲網數字孿生中心通過可視化的雲網孿生體與實體映射,實作可視化、孿生化的雲網孿生體與實體實體實時互動;并通過人工智能、AI算法、專家經驗、大資料分析等技術實作對實體雲網進行全生命周期的分析、診斷、仿真和控制。

關鍵技術

對企業客戶而言,需要通過多雲部署、高性能雲邊協同、一體化開通服務等幫助其提升競争優勢;對政府客戶而言,數字城市、數字社群等對雲的能力和安全性有越來越高的要求。這些場景,都對雲網融合編排與排程提出了新的技術要求。

為加快推進新型雲網融合編排與排程系統建設,需建構新型雲網編排與排程系統技術圖譜,具體參見圖3。

新型雲網融合編排與排程系統架構與分析

新型雲網編排與排程系統技術圖譜

算力度量,要求量化異構算力資源以及多樣化業務需求,并建立統一的描述語言,賦能算力流通屬性的同時,為算力的感覺、管控、服務提供基礎和标準。

算力感覺,在算力進行統一度量與辨別的基礎上,捕捉業務算力需求資訊以及算力資源資訊的技術,進而為算力網絡排程編排提供基礎,實作資源配置的最優化。

基于IPv6的段路由(Segment Routing IPv6,SRv6)[7]/ 軟體定義廣域網(Software Defined Wide Area Network,SD-WAN)[8]/ 開放式無線電接入網(Open Radio Access Network,O-RAN)[9]等網絡技術,在無線網、核心網、IP網、傳輸網,甚至衛星網絡等各領域,将從深度和廣度兩個方面提升網絡連接配接的性能品質與覆寫範圍,實作多種連接配接方式的端到端協同,構築面向空天地海一體化的泛在連接配接。

數字孿生,通過感覺、采集網絡和雲等資源相關資訊及運作狀态,實作對雲網實體資源的數字孿生拓撲、模組化、仿真等,進而建構雲網資源的數字孿生體,用于對雲網營運的實時狀态進行仿真和監測。

面向雲網多要素、多因子的融合編排管理需求,管理對象種類多、數量大,新型雲網融合編排排程系統也需要通過與人工智能、大資料等技術深度融合,探索雲網自智、意圖網絡等新方向,不斷增強雲網融合自動化、智能化能力,并提供智能閉環保障能力,逐漸實作雲網自智。

一體編排,在雲網排程、智能引擎、數字孿生能力基礎上,根據交易合約快速配置設定雲網資源,并且需要在合約内快速資源的更新、回收,最終完成新型雲網融合與排程能力。

自動化、智能化、孿生化的新型雲網融合編排與排程系統

智能化

雲網智能引擎是新型雲網融合編排與排程系統的核心,其基于對雲網的測量感覺,進行雲網全局拓撲下的智能決策,并通過雲網編排中心,實作對雲網的統一排程。雲網智能引擎的智能決策,就是要在雲網全局拓撲下,實作雲網目标SLA與雲網資源組合的聯合最優解。在滿足雲網目标SLA的前提下,實作代價最優的雲網資源排程。

如圖4所示,雲網SLA包括資源限制型、業務敏感型、綠色環保型、經濟敏感型、安全敏感型的多因子名額集(KPIs)。多因子名額集量化表征了雲網SLA,并形成雲網決策組合(SLA Portfolio)。

新型雲網融合編排與排程系統架構與分析

雲網多資源多因子名額集

新型雲網融合編排與排程系統架構與分析

自動化

雲網編排自動化是雲網融合編排與排程系統的關鍵能力,面向雲網融合演進的新型網絡架構,通過雲資源與網絡資源及邊緣雲資源與中心雲資源狀态的協同排程,将不同應用的業務通過最優路徑,自動化排程到最優的計算節點,實作使用者體驗最優的同時,保證營運商網絡資源和計算資源使用率最優化。

為實作雲網融合業務的一體化自動化開通,需借助雲網智能引擎和數字孿生的注智能力實作雲網業務、資源的統一編排與集中排程,并支撐實作業務開通流程的全程貫通。其中,網絡側管理編排包括無線網、傳輸網、IP網和核心網的開通能力标準化、自動化與智能化,并實作跨專業網絡端到端管理編排、排程與運維;雲側管理編排在統一架構模式之下,基于混合多雲管理的能力,實作異構雲資源的統一納管、統一排程、統一運維。

同時,面向新型算力業務,需實作算力應用的自動化部署,為應用的建構、部署、運作和維護提供必要的托管和支援服務。如圖5所示,新型雲網融合編排與排程系統支援通過控制台服務與接口服務兩種方式實作應用的自動化部署與托管服務。

新型雲網融合編排與排程系統架構與分析

雲網融合應用自動化部署與托管

控制台服務:通過控制台服務門戶直接輸出應用的建構、部署、運作和維護的服務支撐能力,為租戶提供可視化的應用托管服務。接口服務:算力網絡通過API接口服務為可信的第三方PaaS平台提供應用的部署、運作和維護等服務支撐能力。

雲網融合編排自動化,在計算次元層面需支援雲網業務的多量綱計量方式,如算力的類型、精度、品質、等級等名額量綱,網絡的帶寬、時延、可靠性等名額量綱;在雲網資源層面,支援雲資源和網絡資源的資料實時感覺,實作算力和網絡的融合資源視圖,完成算力資源和網絡資源一體編排。相比網絡編排系統與算力編排系統兩個獨立系統的方案,雲網融合編排與排程系統可以兼顧算力和網絡兩個資源次元因素,自動化實作資源聯合價值最大化。

孿生化

雲網數字孿生作為貫穿雲網融合排程、智能編排的核心技術,為新型雲網融合編排與排程系統提供拿來即用的數字孿生元件與工具集,實作雲網資源與拓撲仿真,流程與業務編排的仿真,自動化測試仿真等。

如圖6所示,雲網數字孿生在業務支撐層面,實作面向雲網融合的數字模組化,建構雲網融合模拟運作環境及仿真環境,有效支撐業務開通測試、網絡模拟驗證、業務發展預測等能力。在業務營運層面,實作算力分布、态勢感覺、業務開通、業務分布、需求預測等雲網融合業務的營運;在創新應用層面,數字孿生作為6G潛在通用目的技術,将作為新型算力能力實作雲渲染、雲XR等算力服務為雲網業務引流,激活雲網資源營運。

新型雲網融合編排與排程系統架構與分析

雲網數字孿生

雲網融合編排與排程智能化、自動化與孿生化演進分級

随着雲網融合技術的持續演進,雲網融合編排與排程智能化、自動化與孿生化相關技術與功能的演進發展可分為4個階段,包括雲網單體協同、雲網泛在協同、雲網融合協同、雲網原生協同階段,具體如表1所示。

新型雲網融合編排與排程系統架構與分析

新型雲網融合編排與排程典型場景

新型雲網融合編排與排程作為雲計算和網絡深度融合的産物,“雲+網+X”模式本身帶動了以雲平台和網絡為基礎的雲網融合解決方案,形成了“雲+網+應用”的服務架構,面向垂直行業又形成“雲+網+行業”的服務架構。這些基礎架構為多元化發展開拓了新的雲網融合生态藍海。

AR/VR業務新型雲網融合編排與排程方案

雲AR/VR應用從雲生成的視訊和音頻,經過編碼、壓縮,然後通過高帶寬網絡傳輸回終端裝置,實作AR/VR業務内容上雲、渲染上雲。通過計算任務分級解除安裝,提高了雲、邊、網資源使用率以及業務體驗。計算負載大的大型計算、内容産生等任務可部署在中心雲上;計算要求較低的視訊編解碼、内容渲染等任務可動态解除安裝至邊緣計算(Multi-Access Edge Computing,MEC)[10]節點處完成。雲AR/VR服務對網絡品質和計算都有很高的要求,需要通過新型雲網編排與排程系統選擇符合雲AR/VR業務需求的計算節點與網絡路徑,實作業務的雲、邊、端協同,保證業務品質與使用者感覺。AR/VR場景下網絡拓撲如圖7所示。

新型雲網融合編排與排程系統架構與分析

AR/VR場景下網絡拓撲

雲網需求

在雲網需求場景下進一步将AR/VR應用總體服務分解為兩大類服務需求,具體如下。

• 低延遲時間服務:AR/VR視覺渲染等。

• 非低延遲時間服務:AR/VR内容制作、内容同步等。

相關名額要求如表2所示。

新型雲網融合編排與排程系統架構與分析

AR/VR場景網絡名額要求

新型雲網融合編排與排程關鍵業務流程

如圖8所示,該場景下的新型雲網融合編排與排程系統選擇符合AR/VR業務需求的計算節點與網絡路徑,實作業務的雲邊端自動化協同,保證業務品質與使用者感覺。

新型雲網融合編排與排程系統架構與分析

AR/VR場景下新型雲網編排與排程關鍵業務流程

結束語

綜合業界技術及營運商實踐,目前營運商雲網融合編排與排程智能化、自動化與孿生化處于L1泛在協同階段。雲網融合編排與排程需在标準化及關鍵技術上持續演進。在标準化上,需進一步細化雲網融合編排與排程功能要求,如算力注冊、政策管理、雲網資源拓撲等;定義端到端編排流程,如雲網業務開通、變更、撤銷及業務應用部署流程等;定義雲網融合編排北向接口,編排中心與雲、網排程中心接口,雲平台北向接口,網絡控制台北向接口等各層級API,以達到廠家互通能力。在關鍵技術上,需加強算力度量、評估,實時的算力、網絡感覺,空天一體星雲網絡,雲網資源的綠色節能等。最終演進為具備自動化、智能化、孿生化的新型雲網融合編排與排程系統,為客戶提供一體化供給、一體化服務、一體化營運能力。

未來,新型雲網融合編排與排程系統将向更廣次元的雲網資源、更高效的編排排程能力、更精确的客戶服務政策、更确定的資源排程和更融合的雲網一體基礎設施五大方面演進,成為“雲網大腦”。

【來源:《資訊通信技術與政策》】

繼續閱讀