天天看点

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

注:maxcompute原名odps,是阿里云自研的大数据计算平台,文中出现的maxcompute与odps都指代同一平台,不做区分

首先,你需要在部署的服务器上安装oracle jdk 1.7,并配置好相应的java_home环境变量,这步不做赘述。

下载后解压到服务器上的某个目录下,比如笔者解压到了本地目录:/users/emerson/develop_tools/zeppelin-0.6.1-bin-all,该目录即为zeppelin的根目录了。在根目录下执行:

这说明zeppelin已经部署成功。

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

接着,我们来为maxcompute jdbc创建一个interpreter。

然后回到zeppelin页面,用鼠标点击右上角的“anonymous”,在弹出的下拉列表中选择“interpreter”。

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

你将进入如下页面,然后点击右上角的“+create”按钮。

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

接着,便进入了解释器的新建页面,如下图:

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

填入interpreter的名称和分组,分别是“odps”和“jdbc”。

然后增减并修改配置如下:

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

其中 default.user 和 default.password 分别是你在maxcompute对应的 accessid 和 accesskey 。而 default.url 则是对应的maxcompute jdbc的url,请注意替换其中的project名,此处笔者使用的是odpsdemo。

而dependencies处的artifact填写之前下载的odps-jdbc-1.9-jar-with-dependencies.jar的本地路径。

完成配置后保存并重启该名为odps的interpreter。

现在,你便可以新建notebook来测试该interpreter了。

用鼠标点击上方的“notebook”按钮,并选择“+create new note”,如下图所示:

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

为新note命名为“odps_jdbc”,如下图:

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

在新的note页面点击右上角的“齿轮”按钮,完成note与新interpreter的绑定,如下图所示:

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

将名为“odps”的interpreter选中并拖拽到顶部,作为默认的interpreter使用。

保存后,即可在note中输入符合maxcompute sql语法的sql,点击运行按钮完成数据查询:

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

zeppelin提供了非常丰富且简单的可视化功能,点击如下图中的可视化选项,完成简单的setting配置,即可看到不同种类的可视化图表了:

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化
原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化
原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化
原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化
原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化