天天看點

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

作者:曉飛的算法工程筆記

作為與FCOS和FSAF同期的Anchor-free論文,FoveaBox在整體結構上也是基于DenseBox加FPN的政策,主要差别在于FoveaBox隻使用目标中心區域進行預測且回歸預測的是歸一化後的偏移值,還有根據目标尺寸選擇FPN的多層進行訓練,大家可以學習下

來源:曉飛的算法工程筆記 公衆号

論文: FoveaBox: Beyound Anchor-Based Object Detection

  • 論文位址:http://arxiv.org/abs/1904.03797
  • 論文代碼:http://github.com/taokong/FoveaBox

Introduction

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  論文認為anchor的使用不一定是最優的搜尋目标的方式,且受人眼視網膜中央凹(fovea)的啟發:視覺區域的中部有最高的視覺敏銳度,是以提出了anchor-free目标檢測方法FoveaBox。

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  FoveaBox聯合預測每個有效位置為目标中心的可能性及其對應目标的尺寸,輸出類别置信度以及用以轉化目标區域的尺寸資訊。如果大家看過很多Anchor-free的檢測方案,可能覺得論文的實作方案很常見,的确,其實這篇文章也是Anchor-free井噴初期的作品,整體思路很純粹,也是很多大佬都想到的思路,在閱讀時需要關注以下細節:

  • 以目标的中心區域進行分類預測與回歸預測
  • 将回歸預測的是歸一化後的偏移值
  • 訓練時可指定FPN多層同時訓練
  • 提出特征對齊子產品,使用回歸的輸出來調整分類的輸入特征

FoveaBox

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

Object Occurrence Possibility

  給定GT目标框,将其映射到特征金字塔層:

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  為特征層相對于輸入的stride,正樣本區域為大緻為映射框的縮小版本:

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  為人為設定縮放因子。在訓練階段,正樣本區域内的特征點标記為對應的目标類别,其餘的區域為負樣本區域,特征金字塔每層的輸出為,為類别總數。

Scale Assignment

  網絡的目标是預測目标的邊界,直接預測是不穩定的,因為目标尺寸的跨度很大。為此,論文将目标尺寸歸為多個區間,對應特征金字塔各層,各層負責特定尺寸範圍的預測。給予特征金字塔到基礎尺寸,則層負責的目标尺寸範圍為:

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  為人工設定的參數,用于控制特征金字塔每層的回歸尺寸範圍,不在該層尺寸範圍内的訓練目标則忽略。目标可能落到多個層的尺寸範圍内,這時使用多層進行訓練,多層訓練有以下好處:

  • 鄰接的特征金字塔層通常有類似的語義資訊,可同時進行優化。
  • 大幅增加每層的訓練樣本數,使得訓練過程更穩定。

Box Prediction

  在預測目标尺寸時,FoveaBox直接計算正樣本區域到目标邊界的歸一化的偏移值:

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  公式4先将特征金字塔層的像素映射回輸入圖檔,再進行偏移值的計算,訓練采用L1損失函數。

Network Architecture

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  網絡結構如圖4所示,主幹網絡采用特征金字塔的形式,每層接一個預測Head,包含分類分支和回歸分支。論文采用較簡單的Head結構,使用更複雜的Head可以獲得更好的性能。

Feature Alignment

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  論文提出了特征對齊的trick,主要是對預測Head進行改造,結構如圖7所示,

Experiment

FoveaBox:另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

  與SOTA方法進行對比。

Conclusion

  作為與FCOS和FSAF同期的Anchor-free論文,FoveaBox在整體結構上也是基于DenseBox加FPN的政策,主要差别在于FoveaBox隻使用目标中心區域進行預測且回歸預測的是歸一化後的偏移值,還有根據目标尺寸選擇FPN的多層進行訓練。由于FoveaBox的整體實作方案太純粹了,與其它Anchor-free方法很像,是以一直投稿到現在才中了,作者也是相當不容易。

如果本文對你有幫助,麻煩點個贊或在看呗~

更多内容請關注 微信公衆号【曉飛的算法工程筆記】

work-life balance.

繼續閱讀