5月9-11日,2017 gpu技术大会(gtc17)将在美国圣何塞举行。本届大会设置深度学习与人工智能、自动驾驶与无人车、vr与ar、计算机与机器视觉等12大核心议题,开设654场小型研讨会,有799位嘉宾将分享他们在gpu各个应用领域的心得与经验。
大会现场
据悉gtc17大会期间,浪潮将联合nvidia发布最新一代强大的的ai超级计算机,并将是本届大会在人工智能领域最具看点的新品之一。同时,作为铂金赞助商,浪潮还将现场展示sr-ai整机柜、nx5460m4、nf5280m5等多款面向人工智能应用的服务器,以及ai station深度学习管理系统、t-eye训练调优工具和并行深度学习框架caffe-mpi等融工具、管理与框架于一体的强大ai软件平台。
浪潮为gtc17的铂金赞助商
gpu密度最高的sr-ai整机柜
浪潮在4月26日的ipf2017上与百度联合发布的sr-ai整机柜,是目前业界集成度最高的gpu box。该产品是全球首个采用pcie fabric互联架构设计的ai方案,通过pci-e交换机和i/o box两个模块的配合,gpu和cpu物理解耦池化,二者灵活配置,可实现支持16个gpu的超大扩展性节点,最大支持64块gpu,比一般的gpu服务器方案性能提高5-10倍,可支持千亿样本、万亿参数级别的模型训练。
在ipf2017上发布的sr-ai整机柜服务器
企业级ai刀片服务器nx5460m4
nx5460m4是一款面向企业级ai设计的gpu刀片节点,单节点可支持2块gpu卡,单系统可根据实际需求部署8-24个节点,具备极高的可扩展性并支持多种外形、散热和电源设计方案,单一i/o通道交换速率高达100gbps,而集中管理和无电缆设计则可以有效降低opex(运营成本)。
通用高扩展性ai服务器nf5280m5
nf5280m5是浪潮新一代旗舰双路服务器,将支持2u4卡的gpu异构方案,采用新一代cpu平台,性能提升得到大幅提升。同时,nf5280m5拥有目前业界最高的可扩展性设计,可支持24块2.5"硬盘和24条ddr4内存,并凭借优化的散热系统和模块化设计,在有限的空间内展现了高效可靠、智能高扩展特性。
提供更高效生产力的ai平台软件
ai station是浪潮自主研发的人工智能深度学习管理系统,面向深度学习训练集群,可以支持多种深度学习框架,能够快速部署深度学习训练环境,全面管理深度学习训练任务,为深度学习用户提供高效易用的平台。
t-eye是浪潮自主研发的应用特征分析软件,主要用于分析ai应用程序在gpu集群上运行时对硬件及系统资源占用的情况,反映出应用程序的运行特征、热点及瓶颈,从而帮助用户对应用程序算法作出针对性的调整优化。
caffe-mpi是浪潮开发的全球首款高性能mpi集群版的caffe深度学习计算框架,在伯克利caffe架构的基础上,采用mpi技术对caffe予以数据并行的优化,实现了多机多卡的并行计算,可部署到大规模训练平台上完成对大规模数据样本的训练。新版本的caffe-mpi充分发挥了nvidia最新的cudnn性能并实现高性能扩展。
gpu17大会现场
此外,在大会期间,浪潮集团副总裁胡雷钧将做"浪潮ai端到端解决方案"的主题报告,并举行"sr-ai整机柜在深度学习上的应用与示范"、"浪潮caffe-mpi的优化"等现场报告。
原文发布时间为: 2017年5月11日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。