天天看點

拆解滴滴大腦 葉傑平談出行領域算法技術

zd至頂網cio與應用頻道 02月23日 北京消息:2月23日消息,滴滴研究院副院長葉傑平近日在上海一場内部分享會上詳細解讀了滴滴大腦,這是外部首次窺探到較為完整的滴滴算法世界,并且一直潛水的産品“九霄”也首次露出真容。

拆解滴滴大腦 葉傑平談出行領域算法技術

滴滴出行研究院副院長葉傑平

滴滴大腦由三部分組成

葉傑平将滴滴大腦這個智能系統分為三部分,分别是大資料、機器學習和雲計算。

拆解滴滴大腦 葉傑平談出行領域算法技術

其中大資料就像工業革命時代的煤一樣舉足輕重,人工智能需要資料進行訓練,縱觀應用級深度學習的成功案例,他們都獲得了海量資料,像谷歌和facebook這樣的公司都可以擷取大量資料,這種優勢讓他們可以創造更有效的新工具。

而機器學習是人工智能的核心,一套系統通過機器自我學習的方式來實作人工智能,算法則是機器學習的關鍵要素。滴滴搭建的核心算法模型,可以幫助實作更準确的預測能力、智能的調配能力,提高效率降低成本,達到最優運力排程。

雲計算提供強大、靈活的計算能力,滴滴的業務場景對計算要求和實時性都非常高,使用者輸入一個目的地,最佳合理排程都由滴滴大腦以毫秒級的速度來計算,例如通過滴滴雲計算搭建了大規模實時分單處理平台,可以實作多元度最佳訂單比對。滴滴平台已經有數萬台伺服器,未來兩年伺服器規模将達到數十萬台。

葉傑平揭秘的算法世界是滴滴大腦最為核心的技術之一,滴滴研究院解決的技術難題,包括供需預測、路徑規劃、智能派單等都離不開算法,此外在提高使用者乘車體驗上,也引入了人工智能,比如服務分和機器判責等功能背後都是通過複雜的機器學習算法技術來實作。

滴滴大腦每兩秒進行一次判斷,要考慮n步走法

打個比喻,每一次分單,就如同下棋,需要考慮之後n步的走法,也就是預測未來,滴滴大腦每2秒進行一次全局的判斷,在迅速的大量計算中,完成全局最優的智能派單,對于這些背後的技術,葉傑平在這次内部分享中作了詳細解讀:

1、供需預測

大資料的神奇之處就在于可以通過搜集到的資料,進行處理分析後,得到規律,然後利用這個規律來對未來進行預測。

拆解滴滴大腦 葉傑平談出行領域算法技術

最近比較有名的例子是一套名為mogia的人工智能系統成功預測出川普将成為美國總統,這套亮相于2004年的系統,也曾經對以往三次總統選舉進行過成功預測。去年,開發者設計的算法又一次準确預測出了最後關頭共和黨方面取得的後起勢頭。大資料還可以預測天氣、預測地震,甚至預測你會不會生病等,而在交通方面,大資料預測的能力就極為重要,可以預測什麼時間什麼地方會擁堵。

大資料預測的關鍵是足夠多的高品質的資料。目前滴滴在交通領域的資料量全球第一,每日峰值訂單超過2000萬單、每日處理資料超過2000tb,覆寫了交通路況、使用者叫車資訊、司機駕駛行為、車輛資料等多個次元,它所掌握的巨大的真實資料除了幫助預測路況外,還能對供需進行預測,供需預測越準确,越能更好的解決供需不平衡問題。

滴滴目前對15分鐘後供需預測的準确度已經達到了85%,基于這樣高的準确率,平台可以排程司機滿足未來的打車需求,有效降低未來該區域供需不平衡的機率。甚至可以暢想,有一天滴滴将能精準地知道,星期五夜晚,雨天或雪天,港麗酒店門口有多少乘客需求,附近有多少運力?

2、路徑規劃

路徑規劃和eta兩項地圖技術是實作智能派單的關鍵,也将直接影響到司乘雙方的使用體驗。

通過海量曆史資料,可以對未來路況做預測,實作a點到b點的路徑規劃,它是派單的核心,工程師圍繞最低的價格、最高的司機效率和最佳交通系統運作效率來做算法。

拆解滴滴大腦 葉傑平談出行領域算法技術

eta指預估任意起終點所需的行駛時間,要求精準性。滴滴是國内第一家把機器學習成功應用到eta的公司,這是解決“訂單高效比對”和“司機運力排程”的關鍵技術。目前滴滴eta可以預測每一單出行的時長以及預估在每一個路口前的等待時長。有了這項技術,可以在更合适的時間對運力進行更好的排程。

3、智能派單

用滴滴叫車,和搜尋的邏輯不同,網上的商品、資訊等資訊都是靜态停留在那裡,計算方式隻是将這個商品、資訊挖掘出來即可,而滴滴的計算則類似于動态打靶,車輛永遠在運動當中,要在衆多運動的車輛中,給乘客一個最優的選擇,不光是距離,時間也是。也就是實作平台效率和使用者體驗最大化。智能派單對訂單量和司機數進行預測,然後通過大規模分布式計算來實作上述的最優撮合。

為了實作這一目的,供需預測、動調調價、路徑規劃以及服務分的算法技術要一起發揮作用,他們最終為實作最優派單而服務,他們的算法都将結合到智能派單系統中,幫助在動态環境中撮合乘客與司機的交易。

據悉,目前高峰期滴滴平台每分鐘接收超過3萬乘客需求,每兩秒鐘作一次訂單比對,每一次發單背後,滴滴大腦運算次數達到百億次級别。

4、服務分和司乘判責

滴滴使用大資料技術來預估每個司機的服務分值,包括乘客打分、乘客評價以及取消率等因素,并利用算法模型來計算不同服務水準的司機對使用者産生的長期影響。

拆解滴滴大腦 葉傑平談出行領域算法技術

滴滴在2016年9月上線服務信用體系後,司機擁有個人專屬的服務信用檔案和服務分值,為乘客提供優質服務的車主可獲得更高的服務分,進而獲得更多的訂單和收入。目前服務分已與滴滴的智能派單系統結合,在距離、車型等條件類似的情況下,系統将優先派單給服務分較高的車主,幫助服務優良的車主獲得高的收入。上述服務信用體系就是利用人工智能建立算法模型來實作,該信用體系上線後,使用者投訴率和訂單取消率都顯著下降。

保證安全體驗,服務分是手段之一,提高司機服務品質,用大資料機器學習模型來計算司機目前服務分,通過交易引擎系統來保證服務分高的司機收入越高,司機就有動力來提高服務。

除了服務分外,滴滴還通過大資料和機器學習模型來進行司乘判責。服務分裡重要的幾項因素包括乘客取消訂單、投訴,以及文字評價等,需要系統來作智能判責,針對當次取消行為,判斷司機是否有責?乘客是否有責?去年12月15日全國上線了智能取消判責系統後,司機的滿意度得到顯著提高。

拆解滴滴大腦 葉傑平談出行領域算法技術

5、九霄

九霄是滴滴大資料孵化的出行領域智能決策的技術創新産品。能夠把錯綜複雜的時間、空間、業務次元的n次元出行領域資料,轉化成易于了解的2次中繼資料,搭建資料了解的橋梁;幫助營運、産品、bi、研發同學發現問題、分析問題、解決問題,産生切實的業務收益;提升業務決策效率和決策效益。

拆解滴滴大腦 葉傑平談出行領域算法技術

滴滴将出行領域的資料,進行整理、挖掘、智能聚合,在地圖空間和時間軸上進行合理的呈現,使使用者能夠直覺的感覺在什麼時間、什麼地點、各個業務線的什麼業務次元(乘客、訂單、運力、體驗等),發生了什麼,友善深入追蹤和探尋業務痛點和原因分析。

同時,利用機器學習、資料挖掘的方法幫助營運、産品、bi、研發同學發現/分析和解決實際問題,産生切實的業務收益。舉個例子,比如通過九霄對地圖上任意區域的供需平衡狀況、訂單滿足情況能夠一目了然,并且結合九霄的精細化分析能力,能夠進行細化到某個地理圍欄的供需政策,進行圍欄級别的運力排程政策配置;(在代駕場景上)基于機器學習進行供需預測,判斷哪些區域存在運力缺口,自動化排程司機調節供需平衡。

九霄通過科學可視化技術能力、算法能力和高性能架構能力,将資料變為知識,用知識武裝決策、改變出行。

資料正在迅速生産,算法和計算平台都需要越來越快的速度

葉傑平表示,算法世界猶如一個浩瀚的星空,沒有邊際。因為沒有一個算法是通用的,每個具體問題就需要一個算法,如何結合業務場景找到最合适的算法是一大挑戰。

“算法已經變得非常重要,随着每天資料量迅速增大,現有算法不分晝夜都處理不完,可以說現在算法的分析速度遠跟不上資料的産生速度,算法和計算平台需要越來越快的速度。”

目前滴滴在交通領域的資料量全球第一,每日峰值訂單超過2000萬單、每日處理資料超過2000tb,覆寫了交通路況、使用者叫車資訊、司機駕駛行為、車輛資料等多個次元,這些海量的資料資訊将被利用挖掘,産生巨大社會價值。

原文釋出時間為:2017年2月23日

本文來自雲栖社群合作夥伴至頂網,了解相關資訊可以關注至頂網。

繼續閱讀