天天看點

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

R-CNN閱讀重點

  • Introduction
    • R-CNN Detection System
    • Network
    • Module design
    • Bounding-box regression
    • Different object proposal transformations
    • Visualizing learned features
  • Innovation
  • Results
    • Test on VOC2007
    • Test on VOC2010
    • Test on ILSVRC2013
    • Error analysis

R-CNN原論文位址 https://arxiv.org/pdf/1311.2524.pdf

Introduction

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

R-CNN在自下而上的候選區域上應用大型卷積神經網絡,以此來定位和分割目标。當标記的訓練資料稀缺時,R-CNN先對一個輔助任務進行有監督的預訓練,再進行域特定微調,并作非極大值抑制處理,論文裡在ISLVRC2012上監督預訓練,再在Pascal VOC上微調,這麼做使性能有比較好的提升。

R-CNN Detection System

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

rcnn的檢測流程如上圖所示,(1)先輸入一張圖檔,(2)通過選擇性搜尋(将圖檔劃分成多個子區域,然後通過顔色,紋理等進行合并疊代。)方法選取約2000個候選區域,然後将每個候選區域都縮放到227*227的次元,(3)再輸入到卷積神經網絡中,得到一個固定長度的特征向量(4096維),(4)之後在将得到的2000個4096維特征向量輸入到特定類的線性支援向量機(有21個,Pascal VOC有20個類别+背景)進行打分,并作非極大值抑制處理。

Network

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

R-CNN的網絡結構沿用AlexNet的結構,但在微調之後去掉了最後一個全連接配接層。

Module design

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

R-CNN子產品設計包括候選區域生成、特征提取、特定類的線性支援向量機。

Bounding-box regression

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

在經過誤差分析之後,為了減少定位錯誤,訓練了一個邊界框回歸器,提取pool5的特征預測一個新的邊界框。

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

回歸器訓練的輸入:一組(P, Q)訓練對,P是指候選區域的框,Q是指真實框,Q-hat是指新預測的邊界框。

回歸器的學習目标是P映射到Q的轉換,用d*将轉換參數化,d*是指從P映射到Q-hat的轉換。

回歸器的損失函數如圖右上所示,計算的是t*和d*差的平方,t*其中t*是指從P映射到Q的轉換。

Different object proposal transformations

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

關于縮放,論文中提了幾種方法,首先是論文中使用的暴力縮放(D),先給圖檔(A)填充一些padding,然後直接縮放到227*227,使得沒加padding縮放的邊界到加padding縮放的邊界是16個像素點,這種方法是各向異性縮放。還有各向相向縮放,先将圖檔填充成正方形再縮放到227*227,這又分為用圖檔資訊填充(B)和用灰階填充(C)。

Visualizing learned features

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

論文中提出了一種将學到的特征可視化的方法,pool5的次元是6*6*256,在輸入的227*227的候選區域上對應256個195*195的感受野。

特征可視化步驟:

(1)在pool5中取一個特定的6*6單元,

(2)計算每個候選區域到這個單元的激活值,

(3)按激活值從大到小的順序排序,并作非極大值抑制處理。

如上圖所示的示例結果,論文作者也由此得出了前5層卷基層提取的是基礎特征,後2層全連接配接層提取的是一些特定的特征。

Innovation

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

首先,cnn參數在所有類别中共享。

其次,cnn計算的特征向量是低維的,比之前的算法低2個數量級。

Results

Test on VOC2007

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

前3行是微調之前的結果,之後的4行是微調之後的結果,微調之前全連接配接層的存在并不是很必要,微調之後全連接配接層的必要性就顯露出來了。

Test on VOC2010

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

加了邊界框回歸後,精度提升了3、4個百分點。

Test on ILSVRC2013

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

R-CNN的檢測精度在當時處于領先的位置。

Error analysis

目标檢測論文精讀(2)- R-CNNIntroductionInnovationResults

Loc:定位錯誤

Sim:相似類别混淆

Oth:不相似類别混淆

BG:背景誤檢

第一行是對animals的錯誤分析,第二行是對furniture的錯誤分析。微調之後不相似類别混淆和背景誤檢率明顯降低,加了邊界框之後定位錯誤則大幅減少,但是相似類别混淆也有所增加。

注:本頁面絕大多數圖檔來自原論文,小部分圖檔來自網絡部落格,引用本博文請注明出處。

繼續閱讀