TensorFlowOnSpark

2017-11-11 23:50:00

雅虎昨日宣布开源 TensorFlowOnSpark。

众所周知，深度学习有海量数据需求。雷锋网了解到，许多业内公司利用 Spark 对超大规模的数据集进行管理。让深度学习框架直接、方便地获取这部分数据，将为 ML 开发提供极大助力。

雅虎在官方博客中宣布了这一消息，并解释了此前雅虎 Big ML 开发团队遇到的问题：

“现有的深度学习框架，往往需要设立单独的深度学习数据组。这强迫我们为同一个机器学习流水线创建多个程序。维护多个独立的数据组，要求我们在它们之间传输海量数据集——这导致不必要的系统复杂性和端到端的学习延迟。”

为解决这一问题，雅虎此前开发了 CaffeOnSpark。它使得基于 Caffe 机器学习框架开发的程序，能与 Apache Spark 兼容。雷锋网了解到，雅虎已将基于 CaffeOnSpark 的程序，用于鉴别搜索中的不恰当搜索结果，以及自动探测电子竞技游戏直播视频中的关键看点。

雅虎去年开源了 CaffeOnSpark。如今它对 TensorFlow 做了同样的工作。两者的原理几乎相同，只是把机器学习框架换成了 TensorFlow。

雅虎表示，把 TensorFlow 程序移植到 TensorFlowOnSpark 相对方便，并经过反公司内部的反复验证。

“这通常只需要修改十行以内的 Python 代码。许多使用 TensorFlow 的雅虎开发者已轻松地把 TensorFlow 程序，移植到 TensorFlowOnSpark 执行。”

<a href="http://mt.sohu.com/it/d20170215/126316942_470008.shtml" target="_blank">http://mt.sohu.com/it/d20170215/126316942_470008.shtml</a>

<a href="http://blog.csdn.net/fishseeker/article/details/61918138?utm_source=tuicool&utm_medium=referral" target="_blank">http://blog.csdn.net/fishseeker/article/details/61918138?utm_source=tuicool&utm_medium=referral</a>

<a href="https://github.com/yahoo/TensorFlowOnSpark" target="_blank">https://github.com/yahoo/TensorFlowOnSpark</a>

本文转自 stock0991 51CTO博客，原文链接:http://blog.51cto.com/qing0991/1928360

TensorFlowOnSpark

继续阅读

学习软件测试基础测试第七天

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

Zeppelin 配置访问 REST APIApache Zeppelin Configuration REST API

【Torch】最简洁logging使用指南

27. Remove Element(列表)题目代码

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服务

Apache2.4.x 配置文件详解Apache配置需要了解如下：开始讲解：

配置apache支持PHP（win7）

Cloud Studio初体验

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

使用 ctypes 进行 Python 和 C 的混合编程

【python】【数据处理】画多维数据分布图

【python】netconf协议对接管理设备

「Python 网络自动化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 网络设备

在python中创建excel并写入