天天看点

阿里云机器学习平台PAI使用简明教程(一)

概述

阿里云机器学习平台是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。很多用户在初次使用PAI过程中因为对平台比较陌生,总是会遇到这样或那样的困惑。本文以通用的机器学习流程为指导,结合PAI平台逐一介绍数据准备、模型搭建与训练、模型部署与调用,将目前PAI平台的主要操作流程做一个梳理。 本文的主要目的是做PAI平台使用流程的演示,所以算法上选择最简单的线性回归算法,便于用户的理解和操作。

操作

数据准备

1、

Dataworks | DataStudio

中创建数据表

阿里云机器学习平台PAI使用简明教程(一)
  • SQL脚本
CREATE TABLE `am_test_input` (
  `value` bigint,
  `output1` bigint
);           

2、数据导入

目前支持多种方式将数据导入到表,如果是大数据量导入,请使用tunnel客户端工具导入数据到表中。本示例使用的数据量较少,直接通过SQL脚本的方式导入数据。
阿里云机器学习平台PAI使用简明教程(一)
INSERT into table am_test_input values (1,2);

INSERT into table am_test_input values (2,4);

INSERT into table am_test_input values (3,6);

INSERT into table am_test_input values (4,8);

INSERT into table am_test_input values (5,10);           

3、查看导入的数据

阿里云机器学习平台PAI使用简明教程(一)
select * from am_test_input;           

4、数据表

阿里云机器学习平台PAI使用简明教程(一)

模型搭建与训练

1、新建空表实验

阿里云机器学习平台PAI使用简明教程(一)

2、拖入组件“源/目标的”读数据表模块,配置:

阿里云机器学习平台PAI使用简明教程(一)

3、拖入组件“数据预处理”拆分模块,用于将原数据集拆分为训练集和测试集:

阿里云机器学习平台PAI使用简明教程(一)

4、拖入组件“机器学习”线性回归模块,分别指定特征及标签,用于训练模型:

阿里云机器学习平台PAI使用简明教程(一)

5、拖入组件“机器学习”预测模块,用于预测测试集的情况:

阿里云机器学习平台PAI使用简明教程(一)

6、整个流程:

阿里云机器学习平台PAI使用简明教程(一)

7、点击页面左上角运行按钮运行整个模型,当然也可以点击到具体的模块选择运行到此处,还可以分别查询各个模块的运行结果:

阿里云机器学习平台PAI使用简明教程(一)

8、运行的结果

阿里云机器学习平台PAI使用简明教程(一)

模型的部署与调用

机器学习模型在线部署功能可以将您的模型一键部署为Restful API,您可以通过HTTP请求的方式进行调用。

1、部署模型

注意: 模型正常运行后才能部署,并不是搭建的实验都能生成模型,普通的数值处理不能生成模型,常见的可以生成模型算法包括:GBDT二分类、线性支持向量机、逻辑回归二分类、逻辑回归多分类、随机森林、KMeans、线性回归、GBDT回归(GBDT回归算法不支持int型数据格式输入,所以在部署前请注意GBDT算法输入应为Double型)、Tensorflow等。
阿里云机器学习平台PAI使用简明教程(一)

2、Rest调用的参数

阿里云机器学习平台PAI使用简明教程(一)

3、在线调试

阿里云机器学习平台PAI使用简明教程(一)
[{"value":25}]           

原文链接

阿里云机器学习平台PAI使用简明教程(一)

继续阅读