【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

2023-05-30 07:05:09

這篇論文是阿裡研究院的一篇論文，主要内容是結合語義、雷射SLAM的一個前端裡程計部分，除了語義資訊與雷射SLAM的整合，論文還使用了基于物體的思想，隻保留了友善建圖定位的靜态四類物體：道路、建築物、交通信号燈和柱狀物。使用RangeNet++來擷取點雲的語義資訊，之後對每類物體都采用五個參數進行描述，在裡程計部分則使用論文提出的PSF幀，通過最小化四類物體的重投影誤差來得到幀間位姿變化，除此之外，論文還通過垂直平面的提取、速度幅度與運動朝向相結合的判斷政策等方法，針對于動态靜态物體的篩選做出了優化。

一、公式約定與總覽

作為一篇SLAM的文章，目标必然是獲得一個幀間位姿變化T，這篇文章使用的是3D點雲，是以屬于雷射SLAM的範疇，對于字母約定上，右下角标表示時間，右上角标則表示坐标系。此外，關于語義資訊的擷取，論文直接使用RangeNet++來獲得語義資訊，之後來提取物體并建構PSF幀，整個SLAM都是依賴于PSF幀所建立的。

二、PSF的提取

所謂PSF，本質上就是參數化的語義特征，或者說是對物體的參數化，我們可以利用語義将同類的點湊成整個物體，對這個物體添加描述性資訊，比如說中心點位置、半徑等，那麼在後續的SLAM過程中，就可以利用物體的描述性資訊來進行優化或者校正。

在這篇論文中，作者主要提出了四種PSF，也就是四類物體，對每個PSF都用五個參數進行描述，其中表達式參數（equation coefficient）根據物體類型的不同，有三維和六維兩種選擇。五類參數如下：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

在這部分中，輸入是帶有語義的點雲，輸出則是包含有很多PSF的PSF幀。下面對四類PSF分開介紹：

①道路 Road PSF

為了克服道路點近處密集遠處稀疏的問題，論文使用了不同分辨率的方形網格，近處的網格較小而遠處的網格較大，圖示如下：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

通過對點雲做2D投影（個人感覺是向地面投影），之後對不同網格内的點使用RANSAC進行離群點的剔除，進而獲得五個參數中的CS參數，對于道路而言，這個參數是三維的，公式如下：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中dπ表示的是原點到平面的标量距離，nπ是指向原點到平面的機關法向量。除此之外，權重用内點與全部點數量的比例來計算，最後兩個參數則需要使用外接矩形來實作，中心點和四個角點都用外接的矩形來計算。

②建築物 Building PSF

這一部分的實作與地面很類似，也是需要劃定網格然後做投影，但是差別在于，考慮到建築物在投影後并不一定是一條直線，比如牆角的點雲投影到地面，其形狀應該是一個直角，如果用RANSAC去剔除，結果隻會保留一條直角邊，這顯然是不合适的，針對這一點，論文的做法是首先将網格旋轉45°，之後對标記有建築物的點做投影，這裡對每個網格重複做RANSAC進行提取，隻不過提取之後并不結束，重複提取直到網格内點的數目少于一定數量，才認為提取完畢。

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

③交通信号 Traffic sign PSF

由于交通信号的點雲一般都是相對獨立的，是以可以直接使用歐氏聚類來進行二次分割，之後使用與建築物相同的提取方法進行提取。

④柱狀物 Pole-like PSF

柱狀物和交通信号很像，也是用歐氏聚類做處理，之後參數cs用如下的公式來記錄：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中Pp表示拟合線上最接近原點的點，Np是直線指向z方向的機關方向向量。其餘的參數都與道路是一樣的。

三、基于PSF的雷射裡程計

在裡程計的部分，論文主要做了兩個對LOAM的改進，一方面是濾除了一些不可靠的角點，另一方面是增加了語義一緻性的權重：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中Ns表示的是擁有相同标簽的地理特征的數目，權重w會随着語義一緻性差而降低。後面的部分個人看的也一知半解，大體感覺就是利用了類似重投影誤差的思想，結合了物體的參數做的裡程計。由于參數中的cs項次元不唯一，是以有兩種投影方法，對于三維的cs，投影方法為：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

這裡論文将單個PSF物體記為S，一個PSF幀記為Fs，将最近幾幀投影到世界坐标系下組成的子圖記為Qs，對于這種設定，我們可以根據記錄的幀間位姿變換T，将子圖裡的所有幀投影到世界坐标系下，對于某個幀，選擇其在世界坐标系下的最近的臨近點，利用這些臨近點，制作一個平均點：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

那麼這個點就是抽象的準确位置，以此就可以計算一個類似于重投影誤差的誤差：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

同理，使用六維cs的柱狀物的誤差函數計算方法可以寫為：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

同理可以寫出四類的PSF的誤差函數，對誤差函數求和，就可以得到總的誤差函數f：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

之後就變成一個優化問題，尋找一個T使得誤差函數最小。

四、動态與靜态物體的篩選

論文選擇了靜态物體去進行SLAM的過程，對靜态物體與動态物體的篩選也做了優化。論文提出的篩選包括四步：物體提取、關聯、速度估計和分類。

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

在速度估計這部分，論文使用的是另一篇文章的方法，但是該方法容易受到物體上表面的影響，是以作者改進了一下。首先是将點做二維投影，投影到極坐标上，個人感覺依然是向z軸方向上投影，投影到地面上後劃分為極坐标，對每個點，制作一個存放有其周圍點的子集：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

對這些點，統計其來自的雷達的線數。因為雷達以此scan是從上到下好幾線的，這裡個人了解就是在統計線的個數，因為不同的線上，如果豎直方向投影靠近，那說明是投影在了一個豎直的面上，如果有很多線的點都很接近，說明這個垂直的平面很大，也就是我們要的穩定的垂直平面。保留這些點，再利用原來的方法，就可以得到更加準确的估計。

此外，關于狀态的估計，普遍的方法有兩種：利用速度的規模和朝向的一緻性。論文将這兩種同時納入考慮，通過貝葉斯濾波進行整合：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

其中前項表示的是朝向的一緻性而後項則是速度規模，其中：

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

【論文閱讀】PSF-LO: Parameterized Semantic Features Based Lidar Odometry

雷射SLAM 人工智能機器學習算法

上一篇: WPF管理平台（一）- 登入頁面管理平台登陸頁面知識點總結學習

下一篇: vs2019中建立cuda項目中總是報錯MSB3721最後的版本是vs2019+cuda10.1組合

繼續閱讀