作為與FCOS和FSAF同期的Anchor-free論文，FoveaBox在整體結構上也是基于DenseBox加FPN的政策，主要差别在于FoveaBox隻使用目标中心區域進行預測且回歸預測的是歸一化後的偏移值，還有根據目标尺寸選擇FPN的多層進行訓練，大家可以學習下

來源：曉飛的算法工程筆記公衆号

論文: FoveaBox: Beyound Anchor-Based Object Detection

論文位址：http://arxiv.org/abs/1904.03797
論文代碼：http://github.com/taokong/FoveaBox

Introduction

FoveaBox：另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

論文認為anchor的使用不一定是最優的搜尋目标的方式，且受人眼視網膜中央凹(fovea)的啟發：視覺區域的中部有最高的視覺敏銳度，是以提出了anchor-free目标檢測方法FoveaBox。

FoveaBox聯合預測每個有效位置為目标中心的可能性及其對應目标的尺寸，輸出類别置信度以及用以轉化目标區域的尺寸資訊。如果大家看過很多Anchor-free的檢測方案，可能覺得論文的實作方案很常見，的确，其實這篇文章也是Anchor-free井噴初期的作品，整體思路很純粹，也是很多大佬都想到的思路，在閱讀時需要關注以下細節：

以目标的中心區域進行分類預測與回歸預測
将回歸預測的是歸一化後的偏移值
訓練時可指定FPN多層同時訓練
提出特征對齊子產品，使用回歸的輸出來調整分類的輸入特征

FoveaBox

Object Occurrence Possibility

給定GT目标框，将其映射到特征金字塔層：

為特征層相對于輸入的stride，正樣本區域為大緻為映射框的縮小版本：

為人為設定縮放因子。在訓練階段，正樣本區域内的特征點标記為對應的目标類别，其餘的區域為負樣本區域，特征金字塔每層的輸出為，為類别總數。

Scale Assignment

網絡的目标是預測目标的邊界，直接預測是不穩定的，因為目标尺寸的跨度很大。為此，論文将目标尺寸歸為多個區間，對應特征金字塔各層，各層負責特定尺寸範圍的預測。給予特征金字塔到基礎尺寸，則層負責的目标尺寸範圍為：

為人工設定的參數，用于控制特征金字塔每層的回歸尺寸範圍，不在該層尺寸範圍内的訓練目标則忽略。目标可能落到多個層的尺寸範圍内，這時使用多層進行訓練，多層訓練有以下好處：

鄰接的特征金字塔層通常有類似的語義資訊，可同時進行優化。
大幅增加每層的訓練樣本數，使得訓練過程更穩定。

Box Prediction

在預測目标尺寸時，FoveaBox直接計算正樣本區域到目标邊界的歸一化的偏移值：

公式4先将特征金字塔層的像素映射回輸入圖檔，再進行偏移值的計算，訓練采用L1損失函數。

Network Architecture

網絡結構如圖4所示，主幹網絡采用特征金字塔的形式，每層接一個預測Head，包含分類分支和回歸分支。論文采用較簡單的Head結構，使用更複雜的Head可以獲得更好的性能。

Feature Alignment

論文提出了特征對齊的trick，主要是對預測Head進行改造，結構如圖7所示，

Experiment

與SOTA方法進行對比。

Conclusion

作為與FCOS和FSAF同期的Anchor-free論文，FoveaBox在整體結構上也是基于DenseBox加FPN的政策，主要差别在于FoveaBox隻使用目标中心區域進行預測且回歸預測的是歸一化後的偏移值，還有根據目标尺寸選擇FPN的多層進行訓練。由于FoveaBox的整體實作方案太純粹了，與其它Anchor-free方法很像，是以一直投稿到現在才中了，作者也是相當不容易。

如果本文對你有幫助，麻煩點個贊或在看呗～

更多内容請關注微信公衆号【曉飛的算法工程筆記】

work-life balance.

FoveaBox：另一種DenseBox+FPN的Anchor-free方案 | IEEE TIP 2020

Introduction

FoveaBox

Object Occurrence Possibility

Scale Assignment

Box Prediction

Network Architecture

Feature Alignment

Experiment

Conclusion

繼續閱讀

從推廣高頻PWM調光螢幕适配，到類自然光助眠顯示，#榮耀#在螢幕護眼上的努力不僅積極，而且還富有成效的将其從#榮耀手機#

ieee 802.1q - 虛拟橋接區域網路

下載下傳IEEE文獻

IEEE會議論文批量下載下傳的方法IEEE會議論文批量下載下傳的方法

用Latex寫IEEE格式的論文時如何取消頁碼

刺眼，眼睛易酸痛，甚至會加深近視——這些問題可能你用的手機螢幕就有。那什麼樣的螢幕不傷眼呢？小破站百大UP主先看評測進行

3840Hz超高頻調光真的必要嗎？B站百大UP主先看評測對榮耀90系列進行了硬核實測。他先是對上百段紅外影像畫面和海量

浮點數的二進制表示(IEEE 754标準)

期刊會議排名、資訊檢索網站推薦、IEEE Latex模闆下載下傳（更新中...）一.拿到一個期刊或論文，不知道他的影響因子、分區類型等等資訊，可以使用以下幾個網站搜尋一下。二.一些會議期刊搜尋

“數字孿生驅動的機器人手機裝配”研究工作發表于IEEE彙刊

控制MAC層資料發送過程遇到的問題

象形圖解國小英語單詞。象形圖解國小英語單詞。每天學習英語一點，eeeeeeeeeeeeeeeeeeeeeeeeeeee下

建構之法——現代軟體工程

#程式設計新聞#其他語言可能很酷，但吃飯還是要靠SQL和Java這些年新語言、新技術層出不窮，讓人眼花缭亂。不過真正市場上需

如何下載下傳IEEE論文

tf.layers.dense()的用法