通过阿里云容器服务深度学习解决方案开发tensorflow应用
熟悉阿里云容器服务深度学习解决方案的基本功能
练习利用深度学习解决方案创建一个tensorflow开发环境,运行一个mnist程序,并且利用tensorboard的可视化功能观测训练效果
<a href="https://help.aliyun.com/document_detail/52674.html">基本介绍</a>
请安装chrome浏览器
请携带个人笔记本
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicmbw5ibpd2bs9FajVGdvwVehRGajVGdvw1cn5Was92b09CXt92YuM3YuVXepxWYuU3bop3ZuFGat42YtM3cv5SZjlmdyV2cyVmbpFGdu92YuVXepxWYvw1LcpDc0RHaiojIsJye.png)
2. 创建容器集群
为了方便使用,我们已经帮用户创建了一个集群。点击左上角“产品与服务”,找到r下面的“容器服务”,查看集群是否处于运行状态,点击左侧导航栏中的“集群”,查看集群是否处于运行状态。
3. 创建模型开发环境
点击左侧导航栏中“镜像与方案”->“解决方案”,找到<code>模型开发</code>,点击<code>创建</code>
3.1. 设置模型开发环境的配置
选择集群: 默认即可 填写应用名称:tensorflow 选择训练框架: tensorflow的1.1.0版本 gpu数量:0 数据卷名: 不使用数据卷 jupyter密码: tensorflow 勾选<code>训练监控</code>,保留默认<code>训练日志路径</code>:<code>/output/training_logs</code>
点击<code>确定</code>
3.2. 创建成功后,就自动跳转到<code>应用列表</code>页面,就可以看到刚刚创建的应用<code>tensorflow</code>,点击刷新<code>按钮</code>,直到状态变成就绪
3.3. 这时就可以点击应用名称<code>tensorflow</code>进入应用详情,选择<code>路由列表</code>, 就可以看到两个链接,分别是以<code>jupyter</code>和<code>tensorboard</code>为开头的链接
4. 下载tensorflow示例代码
4.1. 单击jupyter开头的链接,并且输入 <code>jupyter</code> 的密码: <code>tensorflow</code>,就能进入 jupyter 环境, 创建<code>terminal</code>
4.2. 从阿里云code下载<code>tensorflow-examples</code>, 在linux terminal
4.2.1. 执行 <code>bash</code>
4.2.2. 执行 <code>git clone https://code.aliyun.com/kubernetes/tensorflow-examples.git</code>
5. 运行示例代码并且查看tensorboard
5.1. 回到jupyter的主页面,就可以看到下载的<code>tensorflow-examples</code>, 跳到<code>tensorflow-examples/notebooks/4_utils</code>,打开<code>tensorboard_basic.ipynb</code>
5.2. 这样,就可以在jupyter中开发和运行mnist代码, 需要把tensorflow的训练日志路径,设置成前面3.1中指定的<code>训练日志路径</code>,对于本实验来说是<code>/output/training_logs</code>, 点击<code>run all</code>
5.3. 使用tensorboard查看训练结果
5.3.1. 再次访问3.3中应用的<code>路由列表</code>,点击其中<code>tensorboard</code>为开头的链接,这样就跳到了tensorboard的<code>scalars</code>页面,可以看到loss和accuracy
5.3.2. 通过<code>image</code>页面查看输入数据是否正确
5.3.3. 通过<code>graphs</code>页面查看模型结构