天天看點

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

2017 年夏天,果農劉連全的大桃有了别樣的用途,為智能桃子分揀機提供了 6400 張照片。

北京工業大學的 4 位學生利用百度 PaddlePaddle 開源平台上的深度學習模型,用這些大桃照片,通過機器學習和模型訓練,制造了一台智能桃子分揀機,從形狀、大小、色澤、光潔度等多元度,對桃子自動分級,進而實作自動分揀。

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器
機器分揀大桃
4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器
桃農使用機器

深度學習與果蔬分揀融合,減輕農民的負擔

CB Insights 的資料表明,過去 5 年,農業科技初創企業募集了超過 8 億美元的資金。自 2014 年起,融資交易開始猛增,與醫療、金融等領域相比,毫不遜色。

據世界銀行的資料顯示,到 2050 年,世界食物産量至少需要提高 50%,這樣才足以養活屆時可能達到 90 億的龐大人口。但逐漸變暖的氣候變化可能緻使農作物産量減少超過 25%。

人工智能則有望解決這一問題。

據《連線》雜志報道,生物學家戴維·休斯(David Hughes)和作物流行病學家馬塞爾·薩拉斯(Marcel Salathé)使用深度學習,通過對 5 萬多張植物葉照片的訓練,可以檢測出 14 種作物的 26 種疾病,準确率高達 99.35%。

農業機器人公司 Blue River Technology 開發的智能化機器人通過攜帶的照相裝置每分鐘掃描 5000 株幼苗,利用機器學習以及計算機視覺技術識别作物幼苗和雜草。如果是雜草或者長勢不好的作物,就使用農藥噴霧,如果幼苗間距過小,就會自動拔掉一棵。

Prospera 公司則依靠實時監控攝像頭和溫度傳感器使農民實時了解農作物的情況,使農民按需給予水、農藥和肥料,高效精準地種植農作物。

機器學習算法和智能化機器人技術變革農業的生産方式,使農作物的種植由傳統依靠經驗和直覺變成依靠資料、分析、預測的精準農業。此外,在農業的收割階段,機器學習也能廣泛地應用,比如蔬果的自動分揀。在傳統的自動水果分類機中,隻能按照重量或大小分類,不能同時兼顧大小、賣相等決定水果品質的多元度因素,因而無法解決農民精細分類、精準定價的痛點。

以周忠祥為首的 4 位北京工業大學的學生,決定使用機器視覺技術對水果精确分類,實作智能分揀,以解決果農痛點,減輕他們的負擔。

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

學生收集資料

使用PaddlePaddle模型訓練,完成桃子多重屬性分類

圖像分類作為智能分揀的核心,是計算機視覺中重要的基本問題,也是物體檢測、圖像分割、物體跟蹤、行為分析等其他高層視覺任務的基礎,在很多領域都有廣泛的應用,比如人臉識别、智能視訊分析、交通場景識别、圖像檢索等等。

在這個過程中,如何提取圖像的特征至關重要。在深度學習算法之前,通常使用基于詞袋 (Bag of Words) 模型的物體分類方法。而基于深度學習的圖像分類方法,則可以取代手工設計或選擇圖像特征的工作。

智能桃子分揀機的團隊也想到了深度學習的方法,但所學專業是機械自動化和土木工程的他們,擅長控制和電路,對機器學習和模型訓練卻較為陌生,因而在模型訓練方面遇到了不少問題。

按照 PaddlePaddle 開源平台上的教程,他們将不同顔色的海洋球進行分類,進行訓練,但模型的準确率并不高,于是他們将問題回報到 GitHub 上,在 PaddlePaddle 社群值班人員的及時指導下,很快解決了問題,提高了準确率。

最終,團隊将 6400 張大桃照片按照紅、大、中、小等元素按照分檔建立圖檔資料集合,将圖檔資料集放入卷積神經網絡(CNN)中進行訓練,自動提取用于分級的影響要素并形成分類邏輯。實作對大桃的自動分列、判斷、分裝,準确率達到 90% 以上。

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

桃子資料集

制造的機器則包括軟體和硬體兩部分,軟體涉及資料集采集與算法訓練。硬體部分分為算法和下位機主要,包括傳感器和動力部分,下位機主要用于完成對 PC 資料和傳感器資料的接收,實作對硬體電路的控制工作。

具體來說,主要包含四個部分,傳送帶,推拉裝置,控制電路和一個電腦主機。傳送帶上裝有位置傳感器,用于監控桃子在運動過程中幾個關鍵時刻的位置。推拉裝置采用氣動的方式,由一個氣泵給五個氣缸供氣,利用電磁氣動閥控制氣源的通斷。控制電路包含一個主要晶片和電磁閥的驅動電路,供 24v2a 的電源。電腦主機采用一個小巧的 Mac mini 運作 PaddlePaddle 的分類算法。

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

機器全圖

力主開源,百度與開發者共同推進技術發展

作為百度的開源平台,PaddlePaddle 的前身是百度于 2013 年自主研發的深度學習平台,在内部已使用多年,曾為鳳巢等業務提供支援。

由于開源文化來自西方,中國的開源氛圍并不濃厚。對大多數人來說,開源社群對他們的作用就是免費提供技術的地方,他們使用技術卻不反哺開源社群,也不願意分享。即使有一些開源項目,但這些開源項目并不活躍。由于缺乏商業環境的支援,這些開源項目也往往無法持續下去,因而形成惡性循環。

作為商業公司的百度卻在積極推動開源文化,陸奇曾經在内部講話中說,開源代碼寫得好,不僅能解決大家的痛點,開源的代碼也會變得越來越強,開源代碼的生命力也必然會超過封閉體系的代碼。

2016 年 9 月的百度世界大會上,時任百度首席科學家吳恩達宣布在開源社群 GitHub 及百度大腦平台上對外開放這個深度學習平台,并命名為 PaddlePaddle。百度成為繼 Google、Facebook、IBM 之後,開源人工智能技術的又一個科技巨頭,同時也是國内首個開源深度學習平台的科技公司。

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

PaddlePaddle

在陸奇的主推下,百度傑出科學家徐偉在 2017 百度開發者大會上宣布百度不僅會開源代碼,還會開放大規模資料集、計算能力、應用模型庫。作為國内首個開源深度學習平台,百度在 PaddlePaddle 的研發中持完全開放的态度,試圖與開發者們共同推進技術的發展。

實際上,利用開源機器學習平台制作果蔬分揀器并非隻有這一個案例,去年,日本工程師 Makoto Koike 曾使用谷歌的開源工具 TensorFlow 和 7000 張黃瓜圖檔制作了一個黃瓜分揀器。

目前,如谷歌、Facebook 等科技巨頭都有開源的深度學習平台,而由于百度在搜尋、圖像識别、語音語義識别了解、情感分析、機器翻譯、使用者畫像推薦等多領域的業務和技術方向,相較而言,PaddlePaddle 則表現得更加全面,是一個相對全功能的深度學習架構。

除此之外,由于 PaddlePaddle 的定位是易于使用,因而相對 TensorFlow,PaddlePaddle 也更為易用,提供的每個任務都可迅速上手,且大部分任務可直接套用,隻需使用現成的算法 (VGG、ResNet、LSTM、GRU 等等),按照示例執行指令,替換資料、修改參數就能執行。

此外,PaddlePaddle 可多機多卡并行,同時支援 CPU 和 GPU,顯存占用空間小,速度比也 TensorFlow 等更快。

作為人工智能的主要技術,囿于技術門檻,資料量和計算能量等,并不是每個公司都有條件使用機器學習。百度資深科學家、PaddlePaddle 研發負責人徐偉就曾表示:「在 PaddlePaddle 的幫助下,深度學習模型的設計如同編寫僞代碼一樣容易,設計師隻需關注模型的高層結構,而無需擔心任何瑣碎的底層問題。未來,程式員可以快速應用深度學習模型來解決醫療、金融等實際問題,讓人工智能發揮出最大作用。」

在内部力推 PaddlePaddle 開源的陸奇則表示,人工智能時代的核心是資料和算法,中國走向人工智能,一定會面臨着挑戰。作為百度的核心平台,他希望團隊将 PaddlePaddle 發展成具有中國特色,尤其是在資料上最适合中國國情的深度學習平台。

「這是一個時代的演變過程,将來加入人工智能時代,喚醒萬物,資訊一定要傳遍所有的世界的所有的角落。我們要站在這樣的高度來看待。」陸奇說。

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

陸奇在百度 AI 開發者大會演講

而現在,這 4 位學生已将所有代碼和材料清單,上傳至 GitHub 進行開源和分享,請全世界關注農業和關注深度學習的人共同完善。

對 PaddlePaddle 平台而言,雖然智能桃子分揀器隻是其中一個案例,但百度通過人工智能回饋社會的決心卻明确無疑。

4個學生,1個暑假,百度深度學習開源平台PaddlePaddle誕生了智能桃子分揀器

繼續閱讀