百度釋出 paddlepaddle 新 api,以及免費手冊《使用 paddlepaddle 進行深度學習》 微軟更新 linux 平台的資料科學虛拟機(dsvm) 谷歌釋出機器學習資料清理服務 cloud dataprep 每日推薦閱讀 什麼是資料虛拟化:一個資料的大超市
昨日,百度宣布已完成 paddlepaddle 新 api 的内測版本。paddlepaddle 是百度研發的深度學習開源平台,于去年 9 月對公衆開放,稱得上是國内機器學習開源項目的領軍者。雷鋒網(公衆号:雷鋒網)獲悉,該新 api 接口大幅精簡了 paddlepaddle 的代碼量。下面百度官方公布的對比圖,左為舊 api 上的 cnn 程式,右為新 api。
如圖所示,新 api 的代碼非常簡潔。百度表示,這主要是由于三個方面的改進:
新的概念模型
提供“訓練、“測試”、“推理”等新的進階 api,并支援 kubernetes 。
組合的 data bricks
此外,百度還開放了《使用 paddlepaddle 進行深度學習》的使用手冊,其中有示例教程。
該虛拟機全稱是 data science virtual machine,一個基于微軟 azure 雲服務的定制虛拟機鏡像,内置一系列資料科學和機器學習的開發工具,旨在友善開發者開發和部署機器學習應用軟體。
dsvm 有兩個平台的版本:windows 和 linux。微軟宣布更新了 linux 版的 dsvm,加入了對 spark、hadoop、microsoft r server 等平台的支援, 并在工具包中提供 juliapro。
在昨日的 google cloud next 谷歌雲開發者大會上,谷歌釋出了一項新服務—— google cloud dataprep。它能自動檢索資料中的模式(schemas)、連接配接(joins)以及異常部分,比如缺失或者重負的值,并在這一過程中不需要人工寫代碼幹預。這一過程中它利用了機器學習技術,以篩選出符合使用者要求的資料清理規則。 簡單來說, cloud dataprep 能幫助開發者為機器學習準備、清理資料。
外媒 venturebeat 指出, cloud dataprep 事實上是谷歌版的 wrangler enterprise app,後者是初創公司 trifacta 所推出,讓開發者在簡單易用的互動界面上清理資料。
目前 cloud dataprep 的公測版本已可下載下傳。但據雷鋒網了解,谷歌計劃把 cloud dataprep 作為一項收費服務。
與此同時,谷歌還宣布了 bigquery 的一系列改進。
如題,以超市做比喻,解釋什麼是資料虛拟化(data virtualization)。非常生動自然,有助于初學者進行了解。
欄目介紹:ai 開發者頭條是雷鋒網旗下 ai 研習社推出的資訊欄目,周一到周五更新,彙總每天 ai 開發圈的重磅新聞,并推薦技術幹貨。你所關注的 ai 技術資訊,盡在開發者頭條。
關注 ai 研習社公衆号,擷取每日頭條推送。
本文作者:三川