【ipaper】Visual Odometry 和 Visual SLAM概述:第五部分

【ipaper】 An Overview to Visual Odometry and Visual SLAM: Applications to Mobile Robotics 第五部分

Localization

Stereo Vision Versus Monocular Vision

Stereo Visual Odometry

在雙目視覺中，在單個時間步長（

single time-step

）中通過三角測量重建3D資訊，同時觀察在空間上被已知基線距離分開的左右圖像的特征。在

Stereo VO

中，通過觀察兩個連續幀（

in both right and left images

）中的特征來估計運動。以下步驟概述了使用

3D to 2D

運動估計的

stereo VO

的常用過程：

1、在時間 I 中，提取并比對 right frame FR(I) 和 left frame FL(I) ，在3D中通過三角測量重構點（ reconstruct points ）。
2、将這些功能與下一幀 FR（I + 1）和 FL（I + 1）中的相應功能相比對。
3、 Estimate the transformation 這個轉換（ transformation ）給出了一個相機的圖像（左或者右邊）所觀察到的特征與将該轉換應用到了目前幀之後，前一幀重建的3D點之間的最小平方差（ SSD ）(見公式二)：

【ipaper】Visual Odometry 和 Visual SLAM概述:第五部分

公式二

4、使用 RANSAC 優化，僅基于内部點重新計算轉換。（參見“ Refining the Transformation Using ICP ”部分）
5、将獲得的變換與先前估計的全局變換連接配接起來。
6、在每一個疊代時間内，重複以上步驟。

Monocular Visual Odometry

對于通過三角測量在3D中重建特征點，需要在連續幀（時間分離幀）中觀察它們。在

monocular VO

中，需要在至少三個不同的幀中觀察特征點（觀察第一幀中的特征，重新觀察并在第二幀中三角形化為三維點，然後計算第三幀中的變換）。

monocular VO

的一個主要問題是尺度模糊問題。與雙目視覺系統不同，雙目視覺系統可以得到最開始的兩個幀的變換（旋轉和平移）而單目視覺中前兩個連續幀之間的變換并不能完全得到（比例未知），通常情況下将它設定為一個預定值。是以，重建的3D點以及對應的變換都是相對于前兩幀之間的初始預定義比例的。除非有關于3D結構或初始變換的附加資訊可用，否則無法獲得全局尺度。[89]講到，可以使用其他的傳感器（Imu，車輪編碼器，GPS）收集那些所需要的資訊。

monocular VO

和

stereo VO

的流程基本相似，但是

monocular VO

的特征點的三角測量發生在不同的時間（連續幀）

使用3D到2D運動估計的

monocular VO

的可能的過程在以下步驟中描述：

1、在 time step I 中提取第一幀 FI 的特征，并且指定描述符。
2、提取下一幀 FI+1 的特征，并且指定描述符。
4、比對兩個連續幀之間的特征，使用5點算法（ 5-point algorithm ）[86]估計前兩幀之間的變換（使用預定義比例），并使用此變換對相應點進行三角測量（3D點将達到假設的比例）。
4、提取接下來的 FI+2 幀的特征，将它與先前幀中提取的特征進行比對。
5、使用 RANSAC 優化比對并估計轉換，該轉換給出目前幀 FI + 2 中觀察到的特征與應用之後從前兩幀重建的重新投影3D點之間的最小平方差之和（SSD）（見方程2）。這個過程稱為透視N點（PnP）算法[74]。
6、使用估計的變換将 FI + 1 FI + 2 之間的比對到的特征對三角化為3D點。
7、設定 I = I + 1 ，每次疊代從步驟4開始重複。

Visual Odometry Based on Optical Flow Methods

光流計算用作局部圖像運動的

替代測量

(

surrogate measurement

)。通過分析圖像平面中的運動對象的投影時空模式來計算光流，并且其在像素處的值指定該像素在連續圖像中移動了多少。

光流測量物體和觀察者之間的相對運動[47]，并且可用于估計移動機器人或相機相對于其環境的運動。

光流的計算基于強度一緻性（

Intensity Coherence assumption

）的假設,該假設表明投影在兩個連續圖像上的點的圖像亮度是（最嚴格的假設）常數或（最弱假設）幾乎恒定[7]。這種假設産生了衆所周知的光流限制：

光流限制

其中 Vx 和 Vy 是 x 和 y 光流分量。已經提出了許多使用運動限制方程來解決光流問題的算法（參見[115]以獲得目前方法的清單）。

計算出每個像素的2D位移（u，v）後，可以完全恢複3D錄影機運動。Irani等人.[60]描述了用于糾正相機的6DOF運動參數的等式，其包括三個平移（Tx，Ty，Tz）和三個旋轉分量（Ωx，Ωy，Ωz）。他們的方法基于以下方程式：

公式六

其中 fc 是相機的焦距，（x，y）是3D點（X，Y，Z）的圖像坐标。

假設深度Z是已知的，則存在六個未知數，并且至少需要三個點來完全限制變換。但是在許多情況下會添加額外的限制，例如在平面上移動，這樣會減少 DOF 和所需要的最少點數。

參考文獻

[7].Bab-Hadiashar, A., Suter, D.: Robust optic flow computation. Int. J. Comput. Vis. 29(1), 59–77 (1998)

[47].Gibson, J.: The Senses Considered as Perceptual Systems. Houghton Mifflin Co, Boston (1966)

[74].Lepetit, V., Moreno-Noguer, F., Fua, P.: EPNP: an accurate O(n) solution to the PnP problem. Int. J. Comput. Vis. 81(2), 155–166 (2009)

[86].Nister, D.: An efficient solution to the five-point relative pose problem. In: Proceedings of 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol. 2, Part II, p. 195

[89].Nützi, G., Weiss, S., Scaramuzza, D., Siegwart, R.: Fusion of IMU and vision for absolute scale estimation in monocular slam. J. Intell. Robot. Syst. 61(1), 287–299 (2011)

[115].Xu, L., Jia, J., Matsushita, Y.: Motion detail preserving optical flow estimation. IEEE Trans. Pattern Anal. Mach. Intell. 34(9), 1744–1757 (2012)

[60]Irani, M., Rousso, B., Peleg, S.: Recovery of ego-motion using region alignment. IEEE Trans. Pattern Anal. Mach. Intell. 19(3), 268–272 (1997)

不足之處，敬請斧正; 若你覺得文章還不錯，請關注微信公衆号“SLAM 技術交流”繼續支援我們，筆芯：D。

【ipaper】Visual Odometry 和 Visual SLAM概述:第五部分

【ipaper】 An Overview to Visual Odometry and Visual SLAM: Applications to Mobile Robotics 第五部分

Stereo Vision Versus Monocular Vision

Stereo Visual Odometry

Monocular Visual Odometry

Visual Odometry Based on Optical Flow Methods

參考文獻

相關推薦

繼續閱讀

Codeforces 1417 D. Make Them Equal(思維+構造)

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希