encoder decoder模型_基于圖卷積路況預測的ETA深度模型

ETA：Estimated Time of Arrival，地圖服務中一個十分重要核心的基礎能力。高德百度的導航，美團的配送，滴滴的接送駕等等，可以說有地圖的地方就有ETA。

我了解到的，美團配送的ETA是樹模型（應該是xgb那一套），高德百度正在基于路況預測做，滴滴在KDD2018有兩篇ETA的論文（論文位址：https://www.kdd.org/kdd2018/accepted-papers/view/learning-to-estimate-the-travel-time），其中一篇我看過的是WDR模型——算是業内比較先進的模型了吧，是以深度模型應該算是剛剛起步吧。

PS：我其實是ETA的門外漢，沒有調研也沒有實踐經驗，也是偶然機會開始初步的思考這個問題。想到這個模型大概也有幾周了時間了，一直沒有寫出來，一方面是因為感覺不成熟，另一方面也有私心，想着說不定我自己有機會嘗試。由于，目前focus on強化學習的任務，是以就把這個想法寫出來，如果業内人士覺得不靠譜直接忽略我，覺得靠點譜可以嘗試，對于學生讀者來說如果感興趣并感覺靠譜的話，說不定做的效果好，一篇KDD也是有可能的哈哈。

路況預測

一個路網一般可以抽象為一個Graph，這個graph具有現實地理意義，每個邊表示一個link，路況指的是任意一個link的旅行時間。路況預測就是基于曆史路況資訊，預測接下來一段時間的路況。

關于路況預測，高速路網相對于城市路網簡單一些，沒有潮汐現象、紅綠燈以及重度擁堵這種情況，是以預測起來相對更加容易一些。對于路況預測，現在比較好的模型有基于圖卷積的DCRNNs，這是一個基于encoder-decoder的模型，encoder和decoder裡的基本元件是DCGRU，是使用擴散卷積改造的GRU。論文如下： Diffusion Convolutional Recurrent NeuralNetwork: Data-Driven Traffic Forecasting。也有基于graph attention networks的網絡，具體可以看我之前寫的Graph Neural Network Review的最後一節。

城市路網的路況預測相對複雜很多，上述的模型也有效，但是跟準确率相對于高速路網會低很多（我自己嘗試過）。我們姑且認為，目前路網預測的SOAT方法就是基于圖網絡的吧。

ETA

在路徑規劃的基礎上，ETA的任務就是預測多個link組成的一條路徑規劃的旅行時間。很明顯這是要基于目前路況的，但是目前路況是資訊是不夠的，我們還需要對未來的路況進行預測。比如一個路徑規劃有n個link，link_1的旅行時間是5min，那麼link_2的旅行時間就需要使用5min以後的路況資訊。

對于使用encoder-decoder架構的路況預測模型來說，ecoder向量包含了我們預測未來路況需要的所有資訊，是以感覺上，這個encoder向量對于ETA來說至關重要。

Two-task ETA

是以，我覺得一種可能的基礎網絡架構可能長這樣：

encoder decoder模型_基于圖卷積路況預測的ETA深度模型

左邊是路況預測網絡，使用encoder-decoder架構，Encoder和Decoder可以選擇Graph RNN的模型，例如DCRNNs或GAT-LSTM等；右邊是ETA Model，可以是任意的模型，例如xgb，RNN，它的輸入資訊是路況預測的Encoder向量。

是以這是一個典型的two-task的任務，loss函數需要考慮兩個，一個路況預測，一個是ETA。當然路況預測也可以是提前訓練好的一個模型。

幾個重要的問題

目前城市路網路況預測效果不是特别理想 。主要是城市路網路況天然方差就比較大，有潮汐現象、紅綠燈等複雜的影響因素。不過，聊勝于無應該也會有一定的效果，這方面需要更好預測的可以自己改進了，這就是另一個問題了。
基于RNN的ETA Model。 如果ETA Model使用xgb就沒什麼好說的，直接搞就行了。如果使用類似RNN的序列模組化，大概長這樣：

encoder decoder模型_基于圖卷積路況預測的ETA深度模型

對于每個link，都輸入路況預測的encoder向量，輸出該link的eta，并将該預測的eta作為下一個link的輸入。

一個路徑規劃，其包含的link數目肯定是不同的，可以參照NLP中的解決辦法，劃分一些桶，比如5，10，15等，對于link數目在0~5的都放在5這個桶内，對于link是4的，就在末尾加兩個padding mask，使其link數目是5。具體的可以去稍微看一下NLP怎麼處理句子長度對不齊的。

你可能需要Attention。 一個城市路網是非常非常大的，如果作為一個Graph訓練的話，那麼其Encoder資訊就是包含整個Graph的，當我們對于某一個具體的路徑規劃計算eta時，這些Encoder向量似乎包含的資訊太雜了，我想到兩個辦法：一種是可以借助Attention，對于每一個路徑的Eta動态計算其需要的Encoder，也就是在路況預測的時候加入Attention，我們的目的是對于一個具體ETA包含的link及其相關的link路況預測的更準，其他的可以不那麼準，這樣就使得我們的Encoder向量專注于某個具體的ETA；第二種方法是對城市就行劃分，一個城市可以包含多個Graph，對每一個相對較小的Graph就不太需要attention了。

PS：以上純屬YY哈哈哈，大家周末愉快~

encoder decoder模型_基于圖卷積路況預測的ETA深度模型

路況預測

ETA

Two-task ETA

繼續閱讀

encoder decoder模型_Pytorch學習記錄-卷積Seq2Seq（模型實作）

adobe media encoder_Variational Auto-Encoder（變分自編碼）

encoder decoder模型_Pytorch學習記錄-Transformer（資料預處理和模型結構）