天天看點

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

稀疏交通事故預測:以時空多尺度視角

本文以交通事故預測為應用背景,提出了一個基于多源時空資料的多步、多粒度稀疏事件預測模型。其中集中歸納總結并緩解了時空稀疏問題、短期狀态變化感覺與多步預測問題。

1 背景與介紹

  交通事故已成為最大的公共衛生威脅之一,據世界衛生組織(WHO)的全球狀況報告,全世界約有

125 萬人死于交通事故,WHO 已經将其列為人類第 9 大健康威脅。是以,實作城市交通事故的多尺度(多粒度)精确預測,可提高交通警察警力配置設定效率和公共資源配置設定的精準性與公平性,進而減少道路交通傷害、確定城市公共安全,提升全民幸福感和安全感。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖1 交通事故預測

  現有的交通事故預測任務大多分為長期預測和短期的預測:

【長期預測】:針對全州(全省)下一周中每日的事故總數進行預測,形成事故風險圖,但均為固定的空間尺度。

【短期預測】:1h的時間粒度,且均為單步預測,不能感覺到路網的短期變化。

  逐日事故風險預測對于實時智能交通系統作用甚微,是以本文着眼實時系統,研究短期交通事故預測。而對于短期預測,如能同時實作空間上多尺度(粒度)預測、時間上多步預測,将對不同層級的交通管理部門排程工作、以及不同出行需求的市民更有價值。在技術層面,目前的工作對零膨脹問題(大量資料的label為0,導緻神經網絡訓練過程中趨向于将所有值歸為0)、極度稀疏的多步時間序列預測任務仍然未研發出有效解決方案,且目前也尚未有工作融合稀疏的時空資料和多尺時空依賴關系來進行短期交通事故預測。

本文貢獻與創新點:

  • 這是第一項針對時空多粒度城市交通風險預測的工作,文中,我們将零星事件預測轉換為可學習的自适應排名任務。它為零星事件的時空多粒度預測提供了一種基于DNN的解決方案。
  • 根據時空資料中稀疏問題的起源,我們提出了兩種時空稀疏性挑戰。(1) 僞稀疏:資料本身存在然而卻因為外界原因未被感覺或探測; 和 (2)本質稀疏: 本身具有少量标簽且難以生成新的有效标簽的問題叫做本質稀疏問題。本文中,我們對應地分别提出了兩種方法來緩解上述問題,并基于對短期交通流和事故模式的觀察,提出了一種新的基于節點親和度度量和圖信号差分運算的時變差分圖卷積神經網絡(Differential-Time varying GCN, DT-GCN)來提取城市交通和事故在區域上的時變相關性,以信号運算和節點親和度度量視角推動圖卷積模型的進步和發展。
  • 我們設計了一種新穎的層次型序列學習結構,即以上下文引導的LSTM,在兩個空間尺度上并行地解碼多步風險特征圖,并将上下文資訊(包括天氣、時間)注入到解碼器中,以學習區域級别與上下文因素的互動影響,進而通過風險配置設定和風險聚合層來引導空間多粒度的事故風險學習。

2 問題定義

定義1: 建構無向的城市圖

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

. 其中

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,城市中有

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

個區域,其中第i個區域視作圖中第i個節點

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

, 而區域

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

和區域

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

的連通關系用邊

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

來刻畫。

定義2: 靜态特征

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

和動态特征

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

. 每一個節點

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

中都攜帶有本區域的動靜态特征。其中,在

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

時間段内的動态特征

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

由流量、速度和風險值表示,即

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,靜态特征由路網結構向量構成

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

問題:時空多尺度交通事故預測:給定靜态路網結構特征

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

和曆史的動态交通資訊

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

, 我們的任務是同時預測在未來

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

步空間上粗粒度和細粒度的交通事故風險,以及最可能發生事故風險的M個區域,即

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

, 和

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

, 其中

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

3 方法

3.1 模型概述

  如圖2所示,面向事故資料的稀疏特性和時空多粒度預測的挑戰,我們的模型分為三個階段集中解決這些問題。資料預處理階段,我們将路網資料劃分為層次性的結構,即每一個在路網中的網格都作為一個小節點,地理上相鄰的小節點又組成一個中等的矩形區域,是以模型在學習過程中可有效利用這兩個粒度的資訊進行協同預測。我們還提出了基于先驗知識的資料增強政策(Prior Knowledge-based Data Enhancement, PKDE)和基于時空協同感覺動态預測模型(ST co-sensing)來分别解決本質稀疏帶來的零膨脹問題和時空感覺中的僞稀疏挑戰。空間模組化階段分别抽取兩個空間尺度資訊,且在細粒度空間模組化中提出差分時變圖卷積網絡(DT-GCN)來捕獲空間的動态關聯、提升模型對短時流量變化的敏感性。在時間序列模組化階段,創新性地提出了基于上下文引導的LSTM解碼器,輸入兩個空間尺度的事故風險特征序列,通過風險配置設定和風險聚合層來關聯粗細粒度的事故資訊,進而傳遞兩者的互動影響。最後利用模型輸出的多粒度的風險資訊,進行聯合篩選事故高風險區域,得到最終結果。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖2 模型概述:RiskSeq

3.2 資料預處理

(1)城市的層次性劃分

  由于我們發現深度學習中,稀疏的資料往往很難學習,而越連續、豐富的資料的内在規律越容易被學習,是以我們按如圖3所示的方式劃分城市區域,小區域稱作小方形子區域,中等的方形被稱作中等矩形區域。中等矩形區域中的事故大多不為0,是以可緩解零膨脹問題。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖3 城市的層次性劃分方式

(2)緩解兩類稀疏挑戰

  本節中,我們正式提出兩種稀疏時空資料的概念。從稀疏問題産生的源頭和場景上,我們劃分為本質稀疏和僞稀疏,本質稀疏指的是本身具有少量标簽且難以生成新的有效标簽的問題,如交通事故、城市的各類事件、極端天氣等,該類資訊無法通過學習的方法增大資料量,隻能進行一定的資料變換,僞稀疏指的是資料本身存在然而卻因為外界原因未被感覺或探測,如處處存在的交通流量、速度資訊、天氣資訊,由于傳感器布置的昂貴代價而不能采集到所有區域,該類資料可以通過捕獲其時空模型進行資料增強和推斷。本質稀疏與僞稀疏示意圖如圖4所示。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖4 稀疏的事故分布(本質稀疏)與稀疏的交通流量采集裝置分布(僞稀疏)

  • 針對本質稀疏,我們提出了一種基于資料集先驗資訊的增強方法,核心思想是将資料離散化為一個負數,用這個負數替代訓練過程中風險值為0的區域label。負數值意味該區域未發生事故,對數化後可差别化不同區域的區域且保持各區域潛在風險排序不發生變化,而這個排序表示即使未發生事故,平時發生事故越多的區域,在一個未知的時刻其事故風險也相對越高。

    (1)統計每個區域的交通事故發生強度(每個區域在這個資料集上的事故總數占事故總數的百分比),并歸一化到(0,1)之間,得到區域

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

的事故強度

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

(2)利用對數函數在0~1區間上的資料離散化和非正的特性,将

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

用對數log 轉化成一個負數,并且使用一些限制的參數b1、b2來使其和正的risk風險值相一緻,如正的風險值在0-5之間,那麼負數值也在-5~0之間,如下式所示。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

事實上,将label進行替換的方式與設計loss具有相似的效果,因為替換後模型将按照現有的label來計算loss。

  • 針對僞稀疏,我們設計了一種基于ST-DFM的協同感覺政策。其思想是利用各種額外資訊,對缺失的動态資訊進行互相推斷,使得模型獲得的資訊最大化。即知曉了本區域與鄰近區域速度資訊,基于天氣、區域和時間戳和速度,進行流量資訊的推斷,對應地,可再訓練用于基于流量和額外資訊的速度推斷模型。選用Deep Factorization Machine,是由于各種額外資訊之間會産生明顯的互動影響,如同一天氣狀況在不同區域的影響是不同的。 一般而言,具有相似路網結構的區域,往往具有相似的交通模式,是以我們通過基于路網結構特征來建構區域間靜态親和度矩陣
TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,進而對于篩選交通模式相似的區域,

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

将由下式計算得到:

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

其中,

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

中的元素,JS表示一種度量靜态特征分布相似度的尺度,JS散度。

基于此,我們便可順利地篩選出鄰近區域,并挑選出具有動态交通資訊的區域加入到ST-DFM的特征中。

3.3 基于DT-GCN 的時空編碼器

  本節中,我們提出了差分時變圖卷積神經網絡來對交通流和事故的時空資訊進行編碼。

基于交通事故發生模型的兩點觀察:(1)交通事故和道路擁堵存在一定的互動影響和傳播關系。一方面,擁堵會造成車輛頻繁超車進而導緻交通事故,另一方面,發生交通事故後往往會堵塞道路,導緻車輛排隊,進而增加交通事故發生的風險,事故風險由目前的事故點/擁堵點不斷向擁堵方向傳播擴散。(2)相似的路網結構和相似的動态交通模式易産生事故共現。三叉路口、四岔路口等交通樞紐處的路況往往車流量較為集中,且存在變道轉彎頻繁的現象,易造成事故,當城市處于同一天氣下,這些地區的事故風險會同時增加,然而由于不同的地區交通模式不同,其事故風險的增加量各不相同,故需要一種方式去量化在不同條件下不同路段(區域)交通事故風險的變化。然而這種關聯可能并不是在歐氏關系上的相鄰或鄰近,而是存在地理空間遠距離、語義空間近距離的相似特性,即非歐氏關聯。

  基于以上兩點考慮,考慮到GCN可基于靈活設計的鄰接矩陣(親和度矩陣)來模組化非歐氏關系,我們提出了一GCN的變體差分時變圖卷積網絡(Differential Time-varying Graph neural Network, DT-GCN)并針對觀察特征與挑戰考慮了以下兩個因素:

(1)【時變圖網絡】如圖5所示,區域之間存在一定的相似性和關聯性因潮汐車流等原因産生的會随時間變化的不同關聯程度,如圖3所示。是以,我們考慮三個方面的特性: 靜态相似性

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,鄰近的時變動态資訊(流量速度等)

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,區域

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

的OD流量轉移資訊

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,是以,區域

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

在時間間隔

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

内的時變親和度

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

其中

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

為調和參數。

(2)【差分圖網絡】對于同一區域,相鄰時間間隔内交通基礎元素的數值變化對交通事故的影響(貢獻)。與正常交通預測問題(基礎元素)相比,事故或事件預測的任務與城市交通狀況的異常變化更為相關。 為此,我們引入了差分特征生成器來計算同一區域在相鄰時間間隔内的動态流量和速度的差分值。 通過将差分動态交通特征輸入到GCN中,可以對交通異常變化及其傳播特性與事故直接進行關聯性學習,可讓模型更敏感于路網交通狀态的短期變化,有利于短期多步風險預測。 給定

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,可以通過以下公式計算差分矢量

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

參與差分特征生成的

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

包括流量,速度,需要說明的是,因事故本身的差分無顯著的實體意義,此處事故風險不參與差分值生成。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖5 時變的區域關聯示意

通過結合其動态交通量特征和相應的差分矢量,我們生成一個統一的特征元組

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

  對于某一區域未來多步的風險預測,可分解為由長期的交通狀态、事故風險模式(季節性影響與周期性模式)與短期的瞬時變化(如近期趨勢和突發事件)的組合,我們利用這一特點在模型的輸入部分分别抽取最近連續

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

周(鄰近

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

周中每周與目前weekday一緻的對應的day interval)和

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

個鄰近的時間間隔來建構長期依賴與短期依賴,DT-GCN分别對這兩種時間依賴下的資料進行時空特征抽取。

圖6展示了DT-GCN的詳細結構。 我們将對應的聯合特征元組記為

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,将

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

傳入全連接配接網絡,并與時空資訊融合,再輸入GCN。 GCN遞歸地進行運算,

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角
TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖6 DT-GCN的實作細節

  這裡

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

表示

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

層圖卷積,

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

表示

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

層圖卷積核心的權重。 注意,在這裡,從一個時間角度來看,我們将所有標明時間間隔的

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

矩陣的平均值作為

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

。 我們在每2個GCN層之間使用批标準化,以避免梯度爆炸。 考慮到轉換後的資料集中的負值,我們選擇

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

作為激活函數。 此外,實時動态外部因素(即時間戳和氣象資料)被連續嵌入到固定長度的向量中,然後與每個GCN單元的輸出融合。 對于三個時間角度,我們将DTGN的輸出特征圖表示為

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

。同時,我們在GCN中引入2層殘差結構,以緩解随着GCN網絡層數增加所帶來的梯度消失問題。經過實驗,我們發現通過堆疊4-6層GCN可獲得較為不錯的效果。

  至此,我們獲得了長期依賴與短期瞬時變化組成的序列:

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,其中

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

表示長期依賴抽取的特征,剩下的上标為2~(h+1)均為瞬時變化資訊。

3.4 基于Context-Guided LSTM的時空解碼器 (CG-LSTM)

  首先我們選取了NYC中三個代表性區域,并将其雨天與非雨天的事故數進行了統計,如圖7所示。我們發現,第一、二兩個區域的交通事故數受天氣影響較大(敏感于天氣變化),而區域三受天氣影響較小,是以我們發現天氣等上下文資訊對于不同區域而言,其影響是空間異質的。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖7 不同區域在下雨與不下雨情形下的事故量統計

  此外,每一個時間步當中,應當包含時間戳資訊,因為不同的時間戳下所産生事故風險的大小也不盡相同,如高峰期所對應的時間戳的事故風險較大,尤其是在未來較長時間的多步預測中。

是以,基于以上觀察,本文設計了一個上下文引導的LSTM時間序列預測模型,巧妙地将每一個時間步的上下文資訊(時間戳和天氣等)引入到解碼器的LSTM中。

  另一方面,為實作空間多尺度預測并緩解零膨脹問題,使得網絡能夠順利訓練并獲得我們預想的結果,我們利用兩個并行的LSTM,C-LSTM和F-LSTM來同時學習空間粗粒度風險和細粒度風險在時間上的依賴關系。

具體地,由于粗粒度風險值更密集(細粒度風險更稀疏,零值更多)将更易被網絡所學習,我們将粗粒度學習作為中間媒介,粗粒度C-LSTM的隐層特征

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

可用下式計算:

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

而細粒度F-LSTM的隐層特征

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角
TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

  進一步地,我們設計了風險配置設定層将中間媒介層(C-LSTM)的資訊分别傳播到細粒度risk feature map,和一風險聚合層來聚合事故風險到全城級别(citywide-level),這樣我們就可以得到三個空間粒度的多步預測資訊。以更易學習的C-LSTM作為媒介和引導,可以使得我們的模型更容易學習、細粒度風險學習更準确。

風險配置設定層全連接配接網絡得到全城細粒度事故風險分布:

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

風險聚合層全連接配接網絡得到全城級别的事故總風險值:

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

最終輸出的隐層對齊的粗粒度風險分布:

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

  對于以上三個空間粒度,細粒度為每個節點的風險值(零值利用PKDE的計算值替代),粗粒度為對應節點細粒度風險值的和,全城的事故風險總值為目前時間間隔内事故發生總數,是以,損失函數如下:

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

至此,我們的模型得到了未來

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

步中三個空間粒度的預測資訊,為

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

個三元組,

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

模型總結: CG-LSTM從層次性的LSTM序列模組化和逐漸輸入上下文資訊引導中間粒度事故風險預測兩個層面拓展了LSTM模型,緩解了LSTM在中長期預測中存在的誤差增大、稀疏事件預測難的挑戰。

3.5 基于多粒度風險預測的高風險區域篩選

  為了選擇最可能發生的事故子區域,我們了設計一種自适應高風險區域選擇機制。 具體來說,風險聚合與配置設定網絡可學習多尺度空間風險分布的空間依賴、充分吸收層次相關性。 對于時間

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

内,我們将學習得到的總和風險

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

作為全市範圍的風險名額,并将高風險子區域個數的自适應門檻值設為

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

等于

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

,即從

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

中選擇風險最高的

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

個子區域作為一組最可能發生的事故子區域

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

。 可學習的

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

受時間、上下文因素、路網狀态等影響動态地進行調整(更敏感于上下文變化),可減少區域數量過度預測。

4 實驗

評估名額

   回歸視角采用MSE, 分類視角采用ranking後選取Top-K的方式。

模型橫向對比

如圖8所示,和其他baseline對比,我們的模型在NYC和SIP資料集上分别達到56.42%和71.27%的準确率。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖8 Baseline對比

多時間步預測對比

   将模型和具有多步預測能力的時空模型Baseline相比,如圖9所示,RiskSeq具有更高的準确率,且預測能力平穩。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖9 多時間步預測對比

模型縱向對比-消融實驗

(1)RS-OA: 将動态親和度矩陣替換成僅由路網結構特征計算的靜态親和度矩陣;

(2)RS-DG: 移除差分值生成器子產品;

(3) RS-RC: 移除DT-GCN中的殘差子產品;

(4)RS-CF: 在CG-LSTM中僅使用多個LSTM預測,而不将上下文資訊逐漸輸入LSTM的隐層中;

(5)RS-CGLSTM: 使用普通的LSTM代替CG-LSTM。

  實驗結果如圖10所示。

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖10 消融實驗

案例分析與探讨

TKDE|Foresee Urban Sparse Traffic Accidents: A Spatiotemporal Multi-Granularity Perspective稀疏交通事故預測:以時空多尺度視角

圖11 案例分析

5 讨論

RiskSeq的一般适用性 RiskSeq的核心思想是動态聚合鄰域圖信号以獲得更好的風險表示,并通過采用逐漸上下文注入和多尺度的時間序列學習來增強多步事故風險預測。除了對事故預測的良好表現,我們的工作還可能使時空預測中的其他下遊任務受益。犯罪和流行病與交通事故具有相似的性質,其偶爾發生并表現出時變的空間依賴和人員流動模式。是以可基于ST-DFM和城市協變量緩解資料不足,再通過PKDE緩解事件本質稀疏問題,進而得到适合RiskSeq訓練的資料。與人類活動有關的資料以及特定于任務的曆史記錄被輸入到DT-GCN中,以捕獲時變和異常情況,并使用CG-LSTM解碼器增強多步預測。

RiskSeq提供的新穎見解 針對兩個不可避免的稀疏場景,我們通過提出新穎的政策來解決本質稀疏和僞稀疏問題。我們将稀疏事件預測轉換為可通過DNN解決的可學習的回歸和排序任務,為研究人員從稀疏性起源的角度挖掘時空稀疏資料集中的潛在相關性提供新視角,鼓勵使用新穎的稀疏性劃分(例如網絡中的節點和邊緣稀疏)和一定的新操作、問題轉換方法來支出解決各種稀疏場景問題。這些相關研究最終可能會解決推薦系統、故障檢測和社會檢測等領域中具有稀疏挑戰的任務。

6 結論

  在本文中,我們提出了一個新穎的統一架構RiskSeq,該架構可以通過多種時空粒度來學習稀疏交通事故,進而滿足城市出現者和交通管理部門的多樣化需求。 首先,我們總結了兩種稀疏性挑戰,并相應地緩解了其導緻的零膨脹和稀疏感覺問題。受交通事故特點和事故相關的交通模式啟發,我們設計了DT-GCN,以通過捕獲城市交通的短期變化來增強時間敏感的圖表示。 為實作多尺度和多時間步預測,我們設計了CG-LSTM,我們可以動态地學習區域-上下文互動,并進一步減輕誤差累積。在兩個真實資料集上的實驗結果證明了我們所提出的包含DT-GCN和CG-LSTM內建結構的RiskSeq架構的優越性。