弹性高性能计算(E-HPC, https://ehpc.console.aliyun.com/ )基于阿里云基础设施,为用户提供一站式的公有云HPC服务。除了自动化整合IaaS层硬件资源为用户提供云上HPC集群外,E-HPC还致力于推出面向主流行业方向的定制化PaaS服务,帮助用户更方便地使用云上资源。渲染应用是典型的数字内容创作(DCC-DigitalContentCreation)HPC应用,相比于传统求解微分方程积分方程的仿真计算,DCC具备“完美任务并行”的特点。本文主要介绍阿里云超算E-HPC推出的弹性影视渲染方案。
影视渲染
场景介绍
画面渲染可分为两种,一种是3D游戏里的实时渲染(Real-time Rendering),另一种是动画电影常用到的离线渲染(Offline Rendering)。前者因为需要保证渲染速度而不得不在画质上做出妥协,后者则可以为了追求真实感而投入更高的成本。本文介绍的影视渲染场景属于离线渲染的范畴。
特征 | 优点 | 缺点 | 使用行业 | |
---|---|---|---|---|
离线渲染 | 美学和视觉效果展现,通过渲染后,最终展示给用户的电影/图片效果非常逼真, 电影/图片的细节,灯光可以做到非常的真实,用户无法辨别出是否是真实的 | 可以不考虑时间对渲染效果的影响 | 渲染画面播放时用户不用实时控制物体和场景 | 影视、动画、效果图、广告 |
实时渲染 | 交互性和实时性,其模型通常具有较少的细节,以提高绘制速度并减少滞后时间。 比起离线渲染,实时渲染更看重对现实世界各种现象的模拟和对数据的有效整合 | 可以实时操控 | 受系统的负荷能力的限制、必要时要牺牲画面效果 | 游戏、模拟物理测试 |
软件栈
影视渲染业务常用到的软件包括渲染管理系统和渲染引擎。渲染管理系统负责整合集群硬件资源、分发调度渲染任务,并为用户提供交互式操作界面,如Deadline;渲染引擎则负责渲染任务的求解,当前市面上的渲染引擎众多,认可度高的有RenderMan、V-Ray、Maya、Houdini等。
这里对渲染管理系统Deadline重点介绍一下。Deadline由著名的Frantic Films电影特效制作公司开发,面向Windows/Linux/MacOS系统,支持几乎所有的主流渲染引擎、2D和3D制作软件,和后端处理软件,并为每种渲染引擎提供简洁的作业提交模板。
渲染管理系统Deadline包含3个必要组件。
Deadline Server:负责维护渲染数据仓库和渲染任务的分发,共享渲染参数比如渲染进度、报错信息等。考虑到需要为其他节点开放读写权限,通常安装在共享文件系统上。
Deadline Slave:定时上报节点/任务信息到数据仓库,部署在执行渲染任务的计算节点上,节点配置要求高。
Deadline Monitor:负责为用户提供交互式渲染操作界面,可以部署在集群头节点或图形节点上,通常对节点配置要求不高。
业务需求
海量计算需求:CG镜头渲染非常耗时,对节点配置要求高。通常一个纯CG影片渲染量以千万核时计,渲染高峰期通常会有数千台节点并行执行渲染任务。
存储性能需求:多帧读取资产文件很大概率是同一个,因此带来并发顺序读压力。同时媒资文件具有单文件较大(数百G),小文件(KB级别)众多的两极化特点,所以要考虑渲染进行中对存储设备的读写吞吐、IOPS压力。
IT资源利用需求:根据影片档期走,渲染有周期性特点,通常会有3-4个月的渲染高峰期。项目制特点导致制作期需要大规模渲染节点,而空档期服务器和软件license资源闲置。
自建IDC渲染vs公共云渲染
自建渲染集群 | 阿里云渲染 | |
---|---|---|
资源弹性 | 固定资产支出,无弹性 | 资源弹性,按使用量付费 |
服务器规格 | 机器配置固定,升级难度大 | 配置多样化,快速升降配,性能上限高 |
存储灾备 | 本地做RAID,实际存储利用率达不到100% | 天然三备份,数据可靠性高 |
技术服务 | 用户自行运维 | 专业技术服务支持/企业钉钉群 |
E-HPC弹性影视渲染方案
阿里云超算深度集成业界主流渲染管理系统Deadline,结合EHPC当前功能特性,推出云上弹性影视渲染方案,帮助渲染用户灵活使用云上资源,提高渲染效率,降低上云成本。
- 与阿里云IaaS计算资源互通,支持用户通过自定义镜像一键创建云上Deadline渲染集群;提供云图站/VNC等远程图形界面接入方式,兼容用户线下操作习惯。
- 支持用户根据业务需求快速扩容云上多种计算实例规格;实时感知集群任务负载,支持集群规模的动态伸缩。
- 提供云上性能分析引擎Cloudmetrics,全方位监测集群资源利用情况,为用户推荐最优的云平台配置。