,阿裡巴巴達摩院MIT資深算法專家。
數十款阿裡雲産品限時折扣中,
趕緊點選這裡,領劵開始雲上實踐吧!
本次直播視訊精彩回顧,戳這裡! 簡介本次分享主要圍繞機器學習和運籌優化兩個方面。它們在學術角度存在很大的重合,也有各自的側重點。為了更好地幫助大家了解,這裡借用心理學教授DANIEL KAHNEMAN的表達。
人有兩個系統,System1和System2,分别負責快思考和慢思考。所謂快思考,即普通人在1到2秒之内能做出的決定,反之,如果需要一定的專注和專業,則為慢思考。在過去的六七年中,業界逐漸取得了在機器學習技術上的突破。而在很多傳統行業中,關注的更多的是運籌學的内容。在複雜的生産管理和商業營運中,往往需要人在System1和System2之間進行反複的疊代,以取得更優的解。下面将圍繞機器學習和運籌優化分享三個具體的執行個體。
案例介紹第一個案例是智能農業。主要涉及養殖和種植。背後涉及的知識點是深度學習模型壓縮與加速。 第二個案例是計算資源優化。它是運籌學比較關注的問題。第三個案例是新零售。本文将從算法和架構的角度,提供一些新的視角。我們的最終目的是希望通過機器學習使感覺模型自動化,同時通過運籌優化使決策過程智能化。
智能農業下圖展示了深度學習模型壓縮與加速在應用集團内外的一些落地項目。
下面主要介紹在種植和養殖方面的實際應用。下圖展示了“天蓬計劃”這個項目是真實的部署在養殖場中的。從右側這張圖展示的是實時監控豬的數量。左側這張圖是用以确定豬的身份的,比如來源、成長曲線等一系列關鍵的參數資訊。
通過無人機技術,我們希望能準确地擷取農作物的生長狀态資訊。為承保、理賠提供參考資訊,為實時監管提供有利的幫助。
下圖展示的也是一個實時部署系統。在下圖中,我們識别出了玉米大多正處在開花期。不僅如此,還識别出了數量資訊。
下圖展示了在煙草種植行業中的應用。左邊的圖,準确的識别出了棵樹,為政府補貼和保險提供關鍵的資訊。右圖,煙草種植面積評估,對生産規劃有着很重要的參考價值。
相關算法這些應用的背後都需要強大的算法支援。在雲端,我們有自己的訓練平台,在移動端有嵌入式系統。但應用時還是存在一些問題亟待解決。
為此我們提出了Gauss作為解決方案。
在伺服器端,有Gauss訓練平台,集合了目前業界比較先進的算法進行模型的加速。并且,在過程中,我們也在自行開發新的技術,比如模型離散技術。在部署時也進行了優化,比如智能盒子。在之前提到的養豬執行個體中,就有智能盒子支援的攝像頭。
下圖列出了高效前向推理中的主要技術要點。
下面介紹有關計算資源優化的内容。由于我們内部管理了大量的資料中心,和海量的伺服器,其中有極端複雜的技術。我們的目标是通過資料和算法得到最優的政策。主要的應用有三個。第一,優化預測。即根據趨勢,在物體被配置設定之前,有針對性的找到可能的關注點。第二,優化配置。比如容器資源配置設定,不能多也不能少。第三,異常檢測。在智能運維中有比較重要的應用。
下面給大家詳細介紹一下資源排程的問題。它的基本模型非常簡單,但在實際應用上是不可行的。主要的問題在于實際應用中異常複雜的限制關系。
下圖給出了三個真實的計算資源優化執行個體。每張圖的左邊和右邊都展示了上線前和上線後的差別。
新零售下面介紹新零售方面的應用。關鍵點在于”新”。下面主要從算法架構的角度來講述對新零售的了解。一個非常成功的案例就是盒馬新零售。盒馬是一個線上線下合一的自營體系。每一個店面分為兩個部分。一部分是前台實體店面,另一個部分是倉儲。前台主要服務的是線下的客戶,倉儲主要服務的是線上的客戶。一個盒馬店面實際上隻有30%左右線下使用者,有超過70%的使用者是線上的。這種生态系統與傳統的電商,比如淘寶,不一樣。線上下的角度,它與菜鳥等,也不一樣。在算法的角度,線上,不僅要關注使用者的偏好,還要關注庫存,也就是說線上對線下的庫存起到導入的作用。線上下庫存的角度,做庫存和營運配送時也要考慮線上的作用。線上線下實際上是一個有機的整體,它跟菜鳥、淘寶這樣的重量級系統是不太一樣的。同時,這也造成了一系列的算法挑戰。
第一,線上部分,使用者行為偏好問題。我們可以從三個層次來了解這個問題。一,線下活躍但線上沉睡的客戶。第二,新使用者。第三,活躍使用者個性化。
第二個問題是,線上精準營銷的比對問題,如下圖。
第三,是線下配送問題。線上會源源不斷的産生訂單。訂單都會有各自的配送時間和地點。這個問題的解決方案就是合批集單。
關于線下集單優化問題,如下圖。
最後,從算法角度介紹一下新零售。除了之前提到的線上線下。還有一個問題就是營運。營運可以實時地擷取新聞、交通、天氣,并輸入到線上和線下以起到調控的作用。
最後回歸到人,技術最終是為了服務于人。希望能通過機器學習和運籌優化在更多行業起到助力的作用。
本文由雲栖志願小組馬JY整理