關于感受野的總結

感受野是卷積神經網絡裡面最重要的概念之一，為了更好地了解卷積神經網絡結構，甚至自己設計卷積神經網絡，對于感受野的了解必不可少。

一、定義

感受野被定義為卷積神經網絡特征所能看到輸入圖像的區域，換句話說特征輸出受感受野區域内的像素點的影響。

比如下圖（該圖為了友善，将二維簡化為一維），這個三層的神經卷積神經網絡，每一層卷積核的

，那麼最上層特征所對應的感受野就為如圖所示的7x7。

感受野示例[1]

二、計算方式

其中

表示特征感受野大小，

表示層數，

表示輸入層，

。

第一層特征，感受野為3

第1層感受野[1]

第二層特征，感受野為5

第2層感受野[1]

第三層特征，感受野為7

第3層感受野[1]

如果有dilated conv的話，計算公式為

三、更上一層樓

上文所述的是理論感受野，而特征的有效感受野（實際起作用的感受野）實際上是遠小于理論感受野的，如下圖所示。具體數學分析比較複雜，不再贅述，感興趣的話可以參考論文[2]。

有效感受野示例[2]

下面我從直覺上解釋一下有效感受野背後的原因。以一個兩層

，

的網絡為例，該網絡的理論感受野為5，計算流程可以參加下圖。其中

為輸入，

為卷積權重，

為經過卷積後的輸出特征。

很容易可以發現，

隻影響第一層feature map中的

；而

會影響第一層feature map中的所有特征，即

第一層的輸出全部會影響第二層的

于是

隻能通過

來影響

能通過

。顯而易見，雖然

和

都位于第二層特征感受野内，但是二者對最後的特征

的影響卻大不相同，輸入中越靠感受野中間的元素對特征的貢獻越大。

兩層3x3 conv計算流程圖

四、應用

分類

Xudong Cao寫過一篇叫《A practical theory for designing very deep convolutional neural networks》的technical report，裡面講設計基于深度卷積神經網絡的圖像分類器時，為了保證得到不錯的效果，需要滿足兩個條件：

Firstly, for each convolutional layer, its capacity of learning more complex patterns should be guaranteed; Secondly, the receptive field of the top most layer should be no larger than the image region.

其中第二個條件就是對卷積神經網絡最高層網絡特征感受野大小的限制。

目标檢測

現在流行的目标檢測網絡大部分都是基于anchor的，比如SSD系列，v2以後的yolo，還有faster rcnn系列。

基于anchor的目标檢測網絡會預設一組大小不同的anchor，比如32x32、64x64、128x128、256x256，這麼多anchor，我們應該放置在哪幾層比較合适呢？這個時候感受野的大小是一個重要的考慮因素。

放置anchor層的特征感受野應該跟anchor大小相比對，感受野比anchor大太多不好，小太多也不好。如果感受野比anchor小很多，就好比隻給你一隻腳，讓你說出這是什麼鳥一樣。如果感受野比anchor大很多，則好比給你一張世界地圖，讓你指出故宮在哪兒一樣。

《S3FD: Single Shot Scale-invariant Face Detector》這篇人臉檢測器論文就是依據感受野來設計anchor的大小的一個例子，文中的原話是

we design anchor scales based on the effective receptive field

《FaceBoxes: A CPU Real-time Face Detector with High Accuracy》這篇論文在設計多尺度anchor的時候，依據同樣是感受野，文章的一個貢獻為

We introduce the Multiple Scale Convolutional Layers

(MSCL) to handle various scales of face via enriching

receptive fields and discretizing anchors over layers

引用：

[1]

convolutional nerual networks

[2]Understanding the Effective Receptive Field in Deep Convolutional Neural Networks

關于感受野的總結

繼續閱讀

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希