降低人工智能成本50% 阿里云推出新一代异构实例GN5i

2017-10-01 23:50:00

9月12日，阿里云正式推出最新一代GPU实例GN5i。这款产品主要适用于深度学习的在线推理(Inference)阶段，可一键部署TensorFlow等主流深度学习框架，提供智能调度、自动运维、实时扩容等服务。人工智能产业用户可通过GN5i搭建微秒级响应的AI服务，在线服务成本减少50%以上。

阿里云官网显示，GN5i采用了英伟达Pascal架构P4图形处理器，提供最大45Tops INT8整型计算能力和11TFlops FP32单精度浮点计算能力，在满足数据处理吞吐的基础上，时延最低可达微秒级。支持小时付费，也支持包月包年。

此外，针对自建GPU服务器经常会遇到的扩容难、适配难的问题，GN5i规格族提供了灵活弹性的系列化配置，可以根据深度学习计算力的要求，按需选择合适的规格，分钟级即可完成实例的创建，并可根据运算力需求进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配。

阿里云高级技术专家龙欣介绍，在面向AI深度学习在线推理场景时，GN5i实例能够给客户带来以下价值：

· 稳定的企业级GPU计算能力，保障深度学习推理任务处理效率;

· 全面兼容主流深度学习框架，如TensorFlow、Caffe、MXNet、CNTK等;

· 配备阿里云高性能SSD云存储，加速数据的读取性能;搭配阿里云的OSS存储服务，能达到最佳的存储性价比;

· 在满足数据处理吞吐的基础上，时延最低可达微秒级;

· 推理型专用GPU，大幅降低AI在线服务建设成本;

· GN5i的推出进一步丰富了阿里云异构计算家族的产品线。针对模型训练学习，阿里云在今年5月推出了高性能GPU实例GN5，单实例最多可提供8个英伟达 P100 GPU、2万多个并行处理核心，最高75TFLOPS FP32单精度浮点、150 TFLOPS FP16半精度浮点和37 TFLOPS FP64双精度浮点运算能力，每个P100搭配的16GB HBM2 3D堆叠内存提供了高达732GB每秒的数据传输速率，配合GN5i可有效保障深度学习的处理效率。

除了产品层面，阿里云还提供了全方位的人工智能产业服务，包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务，这些技术正通过阿里云ET对外输出。过去一年，阿里云推出ET城市大脑、ET工业大脑、ET医疗大脑等行业垂直的人工智能系统，为工厂或者医院创造更多利润或者更高的诊断准确率。

本文作者：佚名

来源：51CTO

降低人工智能成本50% 阿里云推出新一代异构实例GN5i

继续阅读

吴恩达deeplearning

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

吴恩达机器学习笔记（3）

吴恩达j机器学习之过拟合

吴恩达机器学习(一) 介绍

BMP文件结构及图像每行字节计算方法

磁盘结构及在Linux中的命名

深度学习模型分析人类复杂疾病的准确性

疾病研究：重症肌无力

人工智能如何有效地运用于自然语言处理

新闻 | Mapbox 牵手阿里，飞猪旅行上线六大城市地图功能

[HTML5]自定义属性 data-* 和 jQuery.data 详解

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

2021年危险化学品经营单位安全管理人员考试题库及危险化学品经营单位安全管理人员考试技巧

无人机--飞控科普