天天看点

大模型涌现、CentOS停服,服务器OS“何去何从”?

大模型涌现、CentOS停服,服务器OS“何去何从”?

当下,数据已经成为企业的重要资产,而服务器操作系统(服务器Operating System,简称:服务器OS)作为管理和处理数据的“关键组件”,其重要性不言而喻。

距离CentOS宣布停服已经过去近三年时间,在此之前,国内几乎所有企业在选择服务器OS时都会选择CentOS,脱离CentOS体系后,企业面临系统迁移的难题,这其中,资金与时间成为众多中国企业服务器OS迁移过程中的痛。

不仅于此,服务器操作系统是“十四五”期间国家重点关注、要求实现自主研发和自主演进的基础软件。国家颁布的《"十四五”数字经济发展规划》等多项政策亦强调操作系统国产化的重要性,关键技术国产化、自主创新发展的重要性和紧迫性已越发凸显。

而在大模型“诞生”火热的当下,各行业对于算力的需求也愈发旺盛,甚至GPU芯片一度成为了“硬通货”,而作为承接底层硬件与上层应用的服务器OS,在全民AI时代如何发展才能起到更好的连接作用,这点对于中国服务器OS而言,是挑战,更是机遇。

大模型时代,服务器OS新需求

随着大模型时代的到来,服务器从传统的CPU,向着CPU+GPU,甚至叠加DPU、FPGA等多元芯片转变,由此也产生多元异构算力,对于这些多元异构算力的管理和调用,已成为当下企业如何用好算力的关键。

除此之外,在算力产业的快速发展下,数据中心也由传统的存储中心,向着计算中心转转变,中国信息通信研究院云计算与大数据研究所所长何宝宏也曾指出,数据中心已经从简单的存储能力供给向着算力供给转变。无独有偶,龙蜥社区副理事长张东表示,现阶段对于服务器而言,除了传统的内存,非易失性内存、存算一体的算力不断出现。多种算力也给整个算力管理带来了巨大的挑战。

按照物理服务器出货量核算,2022年中国服务器操作系统行业装机量达到 401.2万套,商业版装机量达到 189.6万套。根据 IDC等机构预测,2024年全球服务器复合增长率为 23%。中国服务器市场增速更加迅猛,预计拥有41%的增长,在2024 年将达到全球服务器总额的 33%,增长速率和市场份额都将位居全球市场前列。

在上述种种的驱动下,服务器OS也进入了革新的时代,对此,浪潮信息系统软件部总经理苏志远对钛媒体表示,原先提到服务器OS,人们总是提出“AI For System”的概念,“但是现在我们需要更多的考虑‘System For AI’。”苏志远指出。

而如何让这些异构的芯片在服务器中“跑起来”,是服务器OS首先需要满足的条件,也是一切应用的前提。

当异构芯片能“跑起来”以后,接下来要考虑的就是如何能跑得更好。随着算力需求的增加,所产生的数据自然随之增长,在苏志远看来,接下来大模型时代,如何做好CXL分层内存管理和优化是很关键的一步,“如何让内存用得更高效将成为未来服务器OS很重要的一项‘工作’。”苏志远强调。

在算力发展的过程中,算力网络的建设是其中重要的一环,联网的能力也对新的服务器OS提出了更高的要求。新的服务器OS还需要在高吞吐、低时延的前提下,满足新的网络协议,实现更好的联机能力,“关于网络系统的优化,I/O读写优化,甚至最新的SMC-RDMA技术的优化能力将是接下来服务器OS的新的需求及挑战。”苏志远表示。不仅于此,在苏志远看来,面向智算开发的场景,除了服务器OS以外,更多还需要服务器软件能力的提升,“将数据、调优,以及敏捷开发的能力融合起来,已成为当下的一大挑战。”苏志远强调。

而在这个过程中,为了能更好地、更充分地利用计算资源,服务器操作系统需要支持分布式系统,具备将多个计算节点组成一个虚拟超级计算机的能力,从而进一步提升计算效率,虚拟化能力也从单机时代,向着联机时代迈进。

而在张东看来,上述用户的种种需求可以总结为:“算力如何为应用提供支撑”——这才是用户最核心的问题,而操作系统作为这其中的关键环节,如何发挥好作用,需要产业上下游共同努力。

中国开源服务器OS社区涌现

一方面是算力产业高速发展下,用户对于服务器OS越来越高的要求;另一面是CentOS停服导致了中国多数企业无服务器OS可用,亟需平稳迁移的尴尬局面。

据开放数据中心委员会(ODCC)发布的《国产服务器操作系统发展报告》显示,愿意留在 CentOS 体系下的用户仅占8%;而72%的用户,有意愿、且正在计划和试点转投国内服务器 OS,其中半数以上,都希望在1年内完成这个过渡。

在上述两个方面因素的影响下,中国服务器OS进入了新阶段,以开源为核心理念的生态化、社区化模式在中国逐渐发展开来。对此,张东表示,随着数字产业的发展,中国涌现出了很多新兴的芯片和应用厂商,用户对于操作系统的需求也越来越旺盛,但是“各自为战”最终将导致发展缓慢,“这时候就需要大家‘抱团取暖’,”张东指出,“通过打造一个社区,大家共同努力解决面临的问题,同时还能促进开源社区的发展。”

值得注意的是,在为数不多的服务器OS开源社区中,当属龙蜥操作系统开源社区(OpenAnolis)与欧拉操作系统开源社区(OpenEuler)生态建设得较为完善。

龙蜥社区理事长、阿里云基础软件部副总裁马涛对钛媒体表示,中国开源社区形式上具备国外开源社区的治理架构,但在运营模式上又不断创新,与国外社区有很大差异,“如在社区贡献上中国开源社区主要来源于项目的发起方,开源项目也更多地以商业利益为导向,”马涛指出,“中国的模式更注重效率,可大大缩短项目从发起到商业化落地的时间,在社区内众多龙头企业和拥有开源情怀的个人开发者的带领下社区氛围也更具活力和创新力。”

当前在市场、技术、生态上,龙蜥开源社区和欧拉开源社区形成齐头并进的发展态势,各自拥有非常明确的商业生态模式,龙蜥开源社区的“继承+创新”路径与欧拉开源社区的“革命+重建”路径,二者互为补充,合力应对 CentOS 停服冲击,紧跟技术浪潮的更新迭代,践行服务器操作系统开源生态的多路线发展方向。

同时,钛媒体注意到,多元化也是中国服务器OS开源社区的一大优势。国外的诸如Red Hat、Fedora、CentOS Stream等社区多是一家厂商牵头主导建立的,一旦该厂商“不玩了”,社区运营将面临很大难题。与之相比,中国的开源社区更多元化,社区内部涉及产业上下游众多厂商,以“贡献度”决定在社区中的“地位”,即便有一家厂商退出社区,社区依旧可以稳定运行,“这种模式是对社区的负责,也是对广大用户及开发者负责。”马涛如是说。

道阻且长,行则将至

当然,服务器OS开源社区在中国发展还处于初期阶段,与国际上服务器操作市场还存在一定差距。据了解,现阶段中国服务器操作系统市场还是以海外厂商为主,不过各个行业对于中国服务器操作系统的关注度逐年上升,选择度也呈现出逐年上升的态势,据统计,截至目前,欧拉累计装机量超过610万套,而目前龙蜥社区的伙伴也已有800多家,装机量也已超过600万。

《国产服务器操作系统发展报告》中显示,近年来,国内操作系统性能水平稳步提升,现阶段已经能满足75%左右的场景需求,国内产品的竞争力越来越高。

谈及中国操作系统时,马涛和张东均表示,当下用户对于稳定可靠还是存在些许顾虑,“长期的稳定性对于用户来说是目前迁移到国内操作系统过程中最关注的问题。”张东指出,“操作系统对于各类不同厂商的板卡、机器等硬件是否兼容,以及能否长期安全稳定地运作,其实在这方面OpenAnolis在服务器OS开源社区中还是有一定优势的。”

确实,正如张东所说,我们一起看看龙蜥社区中的成员就不难看出,中国服务器OS开源社区在这方面优势明显。

龙蜥社区当中重要成员包括了阿里云、浪潮信息、英特尔等在内的众多相关产业龙头企业。英特尔自不用多赘述,而阿里云作为国内云计算领域的龙头企业,应用场景丰富,在对国内操作系统的“调教”过程中,可以提供丰富的应用场景。进而再来看浪潮信息,作为全球AI服务器出货量第一的服务器供应商,在硬件层面的调优有着丰富的经验,尤其是AI领域,这种云+AI的模式,让龙蜥社区具备了当下对于操作系统需求近乎所有的要素。

另一方面,与龙蜥社区相似的openEuler社区也通过资源的整合,汇聚了以华为为代表的中国数字技术顶尖企业,两大开源社区已经足以支撑中国企业选择服务器OS方面的诸多需求。

伴随着服务器OS开源社区的发展,中国操作系统已经开始慢慢被国内的企业所接受,据近期信通院面向用户群体的调研显示,龙蜥操作系统以53%的占比成为用户意愿迁移的首位,与此同时,据调查,目前包括互联网、政府、金融、医疗、电信、制造等在内的多个行业对迁移至中国操作系统持积极态度。

不过目前中国操作系统距离国际顶尖水平还确实存在一些差距,马涛表示,真正优秀的操作系统需要满足三大条件,分别是:稳定性更高、生态圈更大,以及应用范围更广,“目前,中国操作系统还需要通过技术创新、联合更多产业上下游企业,以及更多的应用推广等手段,让中国操作系统更好、更优秀,”马涛强调。

随着以大模型为代表的AI产业的快速发展,未来对上承应用,下接硬件基础设施的服务器操作系统将提出更多、更高的要求。面向未来,唯有产业上下游“抱团取暖”,共同推进中国操作系统开源化发展,才能更好地释放算力价值,赋能AI产业发展。

(本文首发于钛媒体APP,作者|张申宇)

继续阅读