天天看點

大模型湧現、CentOS停服,伺服器OS“何去何從”?

大模型湧現、CentOS停服,伺服器OS“何去何從”?

當下,資料已經成為企業的重要資産,而伺服器作業系統(伺服器Operating System,簡稱:伺服器OS)作為管理和處理資料的“關鍵元件”,其重要性不言而喻。

距離CentOS宣布停服已經過去近三年時間,在此之前,國内幾乎所有企業在選擇伺服器OS時都會選擇CentOS,脫離CentOS體系後,企業面臨系統遷移的難題,這其中,資金與時間成為衆多中國企業伺服器OS遷移過程中的痛。

不僅于此,伺服器作業系統是“十四五”期間國家重點關注、要求實作自主研發和自主演進的基礎軟體。國家頒布的《"十四五”數字經濟發展規劃》等多項政策亦強調作業系統國産化的重要性,關鍵技術國産化、自主創新發展的重要性和緊迫性已越發凸顯。

而在大模型“誕生”火熱的當下,各行業對于算力的需求也愈發旺盛,甚至GPU晶片一度成為了“硬通貨”,而作為承接底層硬體與上層應用的伺服器OS,在全民AI時代如何發展才能起到更好的連接配接作用,這點對于中國伺服器OS而言,是挑戰,更是機遇。

大模型時代,伺服器OS新需求

随着大模型時代的到來,伺服器從傳統的CPU,向着CPU+GPU,甚至疊加DPU、FPGA等多元晶片轉變,由此也産生多元異構算力,對于這些多元異構算力的管理和調用,已成為當下企業如何用好算力的關鍵。

除此之外,在算力産業的快速發展下,資料中心也由傳統的存儲中心,向着計算中心轉轉變,中國資訊通信研究院雲計算與大資料研究所所長何寶宏也曾指出,資料中心已經從簡單的存儲能力供給向着算力供給轉變。無獨有偶,龍蜥社群副理事長張東表示,現階段對于伺服器而言,除了傳統的記憶體,非易失性記憶體、存算一體的算力不斷出現。多種算力也給整個算力管理帶來了巨大的挑戰。

按照實體伺服器出貨量核算,2022年中國伺服器作業系統行業裝機量達到 401.2萬套,商業版裝機量達到 189.6萬套。根據 IDC等機構預測,2024年全球伺服器複合增長率為 23%。中國伺服器市場增速更加迅猛,預計擁有41%的增長,在2024 年将達到全球伺服器總額的 33%,增長速率和市場佔有率都将位居全球市場前列。

在上述種種的驅動下,伺服器OS也進入了革新的時代,對此,浪潮資訊系統軟體部總經理蘇志遠對钛媒體表示,原先提到伺服器OS,人們總是提出“AI For System”的概念,“但是現在我們需要更多的考慮‘System For AI’。”蘇志遠指出。

而如何讓這些異構的晶片在伺服器中“跑起來”,是伺服器OS首先需要滿足的條件,也是一切應用的前提。

當異構晶片能“跑起來”以後,接下來要考慮的就是如何能跑得更好。随着算力需求的增加,所産生的資料自然随之增長,在蘇志遠看來,接下來大模型時代,如何做好CXL分層記憶體管理和優化是很關鍵的一步,“如何讓記憶體用得更高效将成為未來伺服器OS很重要的一項‘工作’。”蘇志遠強調。

在算力發展的過程中,算力網絡的建設是其中重要的一環,聯網的能力也對新的伺服器OS提出了更高的要求。新的伺服器OS還需要在高吞吐、低延遲時間的前提下,滿足新的網絡協定,實作更好的聯機能力,“關于網絡系統的優化,I/O讀寫優化,甚至最新的SMC-RDMA技術的優化能力将是接下來伺服器OS的新的需求及挑戰。”蘇志遠表示。不僅于此,在蘇志遠看來,面向智算開發的場景,除了伺服器OS以外,更多還需要伺服器軟體能力的提升,“将資料、調優,以及靈活開發的能力融合起來,已成為當下的一大挑戰。”蘇志遠強調。

而在這個過程中,為了能更好地、更充分地利用計算資源,伺服器作業系統需要支援分布式系統,具備将多個計算節點組成一個虛拟超級計算機的能力,進而進一步提升計算效率,虛拟化能力也從單機時代,向着聯機時代邁進。

而在張東看來,上述使用者的種種需求可以總結為:“算力如何為應用提供支撐”——這才是使用者最核心的問題,而作業系統作為這其中的關鍵環節,如何發揮好作用,需要産業上下遊共同努力。

中國開源伺服器OS社群湧現

一方面是算力産業高速發展下,使用者對于伺服器OS越來越高的要求;另一面是CentOS停服導緻了中國多數企業無伺服器OS可用,亟需平穩遷移的尴尬局面。

據開放資料中心委員會(ODCC)釋出的《國産伺服器作業系統發展報告》顯示,願意留在 CentOS 體系下的使用者僅占8%;而72%的使用者,有意願、且正在計劃和試點轉投國内伺服器 OS,其中半數以上,都希望在1年内完成這個過渡。

在上述兩個方面因素的影響下,中國伺服器OS進入了新階段,以開源為核心理念的生态化、社群化模式在中國逐漸發展開來。對此,張東表示,随着數字産業的發展,中國湧現出了很多新興的晶片和應用廠商,使用者對于作業系統的需求也越來越旺盛,但是“各自為戰”最終将導緻發展緩慢,“這時候就需要大家‘抱團取暖’,”張東指出,“通過打造一個社群,大家共同努力解決面臨的問題,同時還能促進開源社群的發展。”

值得注意的是,在為數不多的伺服器OS開源社群中,當屬龍蜥作業系統開源社群(OpenAnolis)與歐拉作業系統開源社群(OpenEuler)生态建設得較為完善。

龍蜥社群理事長、阿裡雲基礎軟體部副總裁馬濤對钛媒體表示,中國開源社群形式上具備國外開源社群的治理架構,但在營運模式上又不斷創新,與國外社群有很大差異,“如在社群貢獻上中國開源社群主要來源于項目的發起方,開源項目也更多地以商業利益為導向,”馬濤指出,“中國的模式更注重效率,可大大縮短項目從發起到商業化落地的時間,在社群内衆多龍頭企業和擁有開源情懷的個人開發者的帶領下社群氛圍也更具活力和創新力。”

目前在市場、技術、生态上,龍蜥開源社群和歐拉開源社群形成齊頭并進的發展态勢,各自擁有非常明确的商業生态模式,龍蜥開源社群的“繼承+創新”路徑與歐拉開源社群的“革命+重建”路徑,二者互為補充,合力應對 CentOS 停服沖擊,緊跟技術浪潮的更新疊代,踐行伺服器作業系統開源生态的多路線發展方向。

同時,钛媒體注意到,多元化也是中國伺服器OS開源社群的一大優勢。國外的諸如Red Hat、Fedora、CentOS Stream等社群多是一家廠商牽頭主導建立的,一旦該廠商“不玩了”,社群營運将面臨很大難題。與之相比,中國的開源社群更多元化,社群内部涉及産業上下遊衆多廠商,以“貢獻度”決定在社群中的“地位”,即便有一家廠商退出社群,社群依舊可以穩定運作,“這種模式是對社群的負責,也是對廣大使用者及開發者負責。”馬濤如是說。

道阻且長,行則将至

當然,伺服器OS開源社群在中國發展還處于初期階段,與國際上伺服器操作市場還存在一定差距。據了解,現階段中國伺服器作業系統市場還是以海外廠商為主,不過各個行業對于中國伺服器作業系統的關注度逐年上升,選擇度也呈現出逐年上升的态勢,據統計,截至目前,歐拉累計裝機量超過610萬套,而目前龍蜥社群的夥伴也已有800多家,裝機量也已超過600萬。

《國産伺服器作業系統發展報告》中顯示,近年來,國内作業系統性能水準穩步提升,現階段已經能滿足75%左右的場景需求,國内産品的競争力越來越高。

談及中國作業系統時,馬濤和張東均表示,當下使用者對于穩定可靠還是存在些許顧慮,“長期的穩定性對于使用者來說是目前遷移到國内作業系統過程中最關注的問題。”張東指出,“作業系統對于各類不同廠商的闆卡、機器等硬體是否相容,以及能否長期安全穩定地運作,其實在這方面OpenAnolis在伺服器OS開源社群中還是有一定優勢的。”

确實,正如張東所說,我們一起看看龍蜥社群中的成員就不難看出,中國伺服器OS開源社群在這方面優勢明顯。

龍蜥社群當中重要成員包括了阿裡雲、浪潮資訊、英特爾等在内的衆多相關産業龍頭企業。英特爾自不用多贅述,而阿裡雲作為國内雲計算領域的龍頭企業,應用場景豐富,在對國内作業系統的“調教”過程中,可以提供豐富的應用場景。進而再來看浪潮資訊,作為全球AI伺服器出貨量第一的伺服器供應商,在硬體層面的調優有着豐富的經驗,尤其是AI領域,這種雲+AI的模式,讓龍蜥社群具備了當下對于作業系統需求近乎所有的要素。

另一方面,與龍蜥社群相似的openEuler社群也通過資源的整合,彙聚了以華為為代表的中國數字技術頂尖企業,兩大開源社群已經足以支撐中國企業選擇伺服器OS方面的諸多需求。

伴随着伺服器OS開源社群的發展,中國作業系統已經開始慢慢被國内的企業所接受,據近期信通院面向使用者群體的調研顯示,龍蜥作業系統以53%的占比成為使用者意願遷移的首位,與此同時,據調查,目前包括網際網路、政府、金融、醫療、電信、制造等在内的多個行業對遷移至中國作業系統持積極态度。

不過目前中國作業系統距離國際頂尖水準還确實存在一些差距,馬濤表示,真正優秀的作業系統需要滿足三大條件,分别是:穩定性更高、生态圈更大,以及應用範圍更廣,“目前,中國作業系統還需要通過技術創新、聯合更多産業上下遊企業,以及更多的應用推廣等手段,讓中國作業系統更好、更優秀,”馬濤強調。

随着以大模型為代表的AI産業的快速發展,未來對上承應用,下接硬體基礎設施的伺服器作業系統将提出更多、更高的要求。面向未來,唯有産業上下遊“抱團取暖”,共同推進中國作業系統開源化發展,才能更好地釋放算力價值,賦能AI産業發展。

(本文首發于钛媒體APP,作者|張申宇)

繼續閱讀