天天看點

感受野與有效感受野

感受野

感受野(receptive field, RF),卷積神經網絡每一層輸出的特征圖(feature map)上的特征點在原始圖像上映射的區域大小,即特征點能“看”到的範圍。越高(深)層的特征點描述的原圖資訊越全面,越能表述語義資訊。

感受野與有效感受野

感受野計算

感受野計算公式:

感受野與有效感受野

其中,L 表示感受野大小,f 表示卷積核(kernel size),s 表示卷積步長(stride)。起始卷積層(F0),感受野大小等于其kernel size。

對于上圖,計算上圖感受野:

F0層: L0 = f = 3;

F1層: L1 = 3 + (3-1) * 1 = 5;

特别的,目前特征層(feature map)感受野與之前層相關,與目前層卷積核大小相關,與步長(stride),填充(padding)無關。理論感受野尺寸可以大于網絡輸入尺寸。

增加感受野

1)增加網絡層數。特别的,增加網絡層數時,對于 f!=1 的網絡層數即使feature map大小沒有改變,感受野也會增加。

2)增加池化層。成倍的增加感受野。

3)更大的卷積核。通常為了保持feature map的尺寸,更大的卷積核需要相應的padding作為補充。例如,卷積核(k=3,s=2,p=0)與(k=7,s=2,p=3)能夠獲得相同尺寸的feature map,但後者的感受野要大于前者。

有效感受野

感受野與有效感受野

有效感受野(effective receptive field, ERF),在卷積計算時,實際有效的感受野區域。在F0特征層中,特征點6可以描述其他所有特征點的部分資訊,即圖中交疊部分,特征點6代表的資訊更“有效”。即越靠近感受野中心的區域越有效。在網絡訓練時,有效感受野對參數的影響更大。

感受野與有效感受野

一般而言,特征點有效感受野要小于實際感受野。其有效性,類高斯分布向邊緣遞減,且不同的激活函數對有效感受野影響不同[1]。

總結

神經網絡中,感受野可以描述特征點的最大資訊量,有效感受野則可以描述資訊的有效性。充分了解感受野與有效感受野的概念,在設計網絡時,可以依據此計算網絡層數,卷積核大小,卷積步長。甚至根據任務不同,自動生成backbone。

引用:

[1] Luo W , Li Y , Urtasun R , et al. Understanding the Effective Receptive Field in Deep Convolutional Neural Networks[J]. 2017.

繼續閱讀