天天看點

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

這篇論文是阿裡研究院的一篇論文,主要内容是結合語義、雷射SLAM的一個前端裡程計部分,除了語義資訊與雷射SLAM的整合,論文還使用了基于物體的思想,隻保留了友善建圖定位的靜态四類物體:道路、建築物、交通信号燈和柱狀物。使用RangeNet++來擷取點雲的語義資訊,之後對每類物體都采用五個參數進行描述,在裡程計部分則使用論文提出的PSF幀,通過最小化四類物體的重投影誤差來得到幀間位姿變化,除此之外,論文還通過垂直平面的提取、速度幅度與運動朝向相結合的判斷政策等方法,針對于動态靜态物體的篩選做出了優化。

一、公式約定與總覽

作為一篇SLAM的文章,目标必然是獲得一個幀間位姿變化T,這篇文章使用的是3D點雲,是以屬于雷射SLAM的範疇,對于字母約定上,右下角标表示時間,右上角标則表示坐标系。此外,關于語義資訊的擷取,論文直接使用RangeNet++來獲得語義資訊,之後來提取物體并建構PSF幀,整個SLAM都是依賴于PSF幀所建立的。

二、PSF的提取

所謂PSF,本質上就是參數化的語義特征,或者說是對物體的參數化,我們可以利用語義将同類的點湊成整個物體,對這個物體添加描述性資訊,比如說中心點位置、半徑等,那麼在後續的SLAM過程中,就可以利用物體的描述性資訊來進行優化或者校正。

在這篇論文中,作者主要提出了四種PSF,也就是四類物體,對每個PSF都用五個參數進行描述,其中表達式參數(equation coefficient)根據物體類型的不同,有三維和六維兩種選擇。五類參數如下:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

在這部分中,輸入是帶有語義的點雲,輸出則是包含有很多PSF的PSF幀。下面對四類PSF分開介紹:

①道路 Road PSF

為了克服道路點近處密集遠處稀疏的問題,論文使用了不同分辨率的方形網格,近處的網格較小而遠處的網格較大,圖示如下:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

通過對點雲做2D投影(個人感覺是向地面投影),之後對不同網格内的點使用RANSAC進行離群點的剔除,進而獲得五個參數中的CS參數,對于道路而言,這個參數是三維的,公式如下:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中dπ表示的是原點到平面的标量距離,nπ是指向原點到平面的機關法向量。除此之外,權重用内點與全部點數量的比例來計算,最後兩個參數則需要使用外接矩形來實作,中心點和四個角點都用外接的矩形來計算。

②建築物 Building PSF

這一部分的實作與地面很類似,也是需要劃定網格然後做投影,但是差別在于,考慮到建築物在投影後并不一定是一條直線,比如牆角的點雲投影到地面,其形狀應該是一個直角,如果用RANSAC去剔除,結果隻會保留一條直角邊,這顯然是不合适的,針對這一點,論文的做法是首先将網格旋轉45°,之後對标記有建築物的點做投影,這裡對每個網格重複做RANSAC進行提取,隻不過提取之後并不結束,重複提取直到網格内點的數目少于一定數量,才認為提取完畢。

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

③交通信号 Traffic sign PSF

由于交通信号的點雲一般都是相對獨立的,是以可以直接使用歐氏聚類來進行二次分割,之後使用與建築物相同的提取方法進行提取。

④柱狀物 Pole-like PSF

柱狀物和交通信号很像,也是用歐氏聚類做處理,之後參數cs用如下的公式來記錄:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中Pp表示拟合線上最接近原點的點,Np是直線指向z方向的機關方向向量。其餘的參數都與道路是一樣的。

三、基于PSF的雷射裡程計

在裡程計的部分,論文主要做了兩個對LOAM的改進,一方面是濾除了一些不可靠的角點,另一方面是增加了語義一緻性的權重:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中Ns表示的是擁有相同标簽的地理特征的數目,權重w會随着語義一緻性差而降低。後面的部分個人看的也一知半解,大體感覺就是利用了類似重投影誤差的思想,結合了物體的參數做的裡程計。由于參數中的cs項次元不唯一,是以有兩種投影方法,對于三維的cs,投影方法為:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

這裡論文将單個PSF物體記為S,一個PSF幀記為Fs,将最近幾幀投影到世界坐标系下組成的子圖記為Qs,對于這種設定,我們可以根據記錄的幀間位姿變換T,将子圖裡的所有幀投影到世界坐标系下,對于某個幀,選擇其在世界坐标系下的最近的臨近點,利用這些臨近點,制作一個平均點:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

那麼這個點就是抽象的準确位置,以此就可以計算一個類似于重投影誤差的誤差:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

同理,使用六維cs的柱狀物的誤差函數計算方法可以寫為:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry
【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

同理可以寫出四類的PSF的誤差函數,對誤差函數求和,就可以得到總的誤差函數f:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

之後就變成一個優化問題,尋找一個T使得誤差函數最小。

四、動态與靜态物體的篩選

論文選擇了靜态物體去進行SLAM的過程,對靜态物體與動态物體的篩選也做了優化。論文提出的篩選包括四步:物體提取、關聯、速度估計和分類。

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

在速度估計這部分,論文使用的是另一篇文章的方法,但是該方法容易受到物體上表面的影響,是以作者改進了一下。首先是将點做二維投影,投影到極坐标上,個人感覺依然是向z軸方向上投影,投影到地面上後劃分為極坐标,對每個點,制作一個存放有其周圍點的子集:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

對這些點,統計其來自的雷達的線數。因為雷達以此scan是從上到下好幾線的,這裡個人了解就是在統計線的個數,因為不同的線上,如果豎直方向投影靠近,那說明是投影在了一個豎直的面上,如果有很多線的點都很接近,說明這個垂直的平面很大,也就是我們要的穩定的垂直平面。保留這些點,再利用原來的方法,就可以得到更加準确的估計。

此外,關于狀态的估計,普遍的方法有兩種:利用速度的規模和朝向的一緻性。論文将這兩種同時納入考慮,通過貝葉斯濾波進行整合:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中前項表示的是朝向的一緻性而後項則是速度規模,其中:

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry
【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry
【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry
【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

繼續閱讀