Light-Head R-CNN學習筆記

2023-03-02 06:47:51

Light-Head R-CNN學習筆記

在這篇文章裡，作者主要分析了：

為什麼two-stage detector會慢，主要慢在哪？

如何在解決速度慢同時保證精度？

文中，作者把 two-stage 拆解成 body 跟 head:

body: 生成proposal(RoI)的過程, 即: ROI warping.

head: 基于proposal的recognition過程, 即: RCNN subnet.

作者認為，目前的算法，為了追求best accurcy，一般都會把head設計的非常heavy，是以即使我們把前面的base model變小，還是無法明顯提升檢測速度。

下面的Figure1為我們展示了Faster R-CNN，R-FCN，Light-Head RCNN在結構上的對比圖。

Light-Head R-CNN學習筆記

我們知道，由于Faster RCNN經過ROI Pooling之後需要對每個候選框進行檢測，這是特别耗時的，特别是圖檔中目标很多時。針對這種情況，R-FCN将所有的權重共享，并引入了Position Sensitive Score Map來解決CNN的位置不敏感性，是以在R-FCN中将Score Map的通道設計為P^2(C+1)個，因為對于COCO資料集來說就需要3969個通道，這樣就極大的增加了運算的複雜度，基于這一點Light-Head RCNN的出發點就是是否可以将這個特征圖變薄？但一旦将特征圖變薄，那麼R-FCN裡面的vote方式産生預測結果就不能用了，是以需要增加全連接配接層做輸出映射。

相對于Faster RCNN來講，Light-Head RCNN的檢測頭部分是做了輕量化的，從上圖可以看到Light-Head RCNN中的Region Proposal的通道數變小了，隻有490層，并且隻有一個全連接配接層，參數量大幅減少了。

（這裡這個490是怎麼來的，一臉懵逼，還有怎麼縮減成490的？還是一臉懵逼）

另外論文還在BackBone的最後一層卷積中加入了可分離卷積，以減少該層卷積的運算複雜度，同時實作兩路卷積以增加不同的感受野。

Light-Head R-CNN學習筆記

Inception 3中将大小為k_k的卷積核，用1_k和k*1的兩層卷積來代替。使用這種卷積替換之後，可以在計算結果一緻的前提下減少計算量。減少的計算量，大緻為原來的k/2，文中作者将k取15，是以這裡大大減少了計算了。當然，計算複雜度還跟 C_mid 和 C_out 有關。

下面是精度和速度比較圖：

Light-Head R-CNN學習筆記

Light-Head R-CNN學習筆記

Light-Head R-CNN學習筆記

繼續閱讀

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普