天天看點

對比:空洞卷積與轉置卷積(吉米王)

又是在地鐵上,人到中年很無奈,每天貌似隻有在地鐵上的時間是屬于我的…,有沒有同道中人…

今天簡單聊聊空洞卷積和轉置卷積的差別:

  • 空洞卷積,也有人譯作擴張卷積,其實是一樣的。

與普通的卷積相比,增加了一個擴張率(dilation rate)參數,主要用來表示擴張的大小。

擴張卷積與普通卷積的相同點在于,卷積核的大小是一樣的,在神經網絡中參數數量不變,差別在于擴張卷積具有更大的感受野。

  • 什麼是感受野?

其實本質上可以了解為:卷積核的邊界寬度;

感受野公式:

對比:空洞卷積與轉置卷積(吉米王)

dilation : 擴張率

kernel : 卷積核大小

F:擴張卷積的感受野

百科找了張圖:(擴張卷積其實本質上擴張的還是卷積核,而不是圖像)

對比:空洞卷積與轉置卷積(吉米王)

解釋說明:a圖中紅點所在的綠色區域表示的是初始卷積核的位置和大小;

b圖中為擴張率為2的時候,卷積核的變化情況,紅點位置标示原卷積核資料,其餘綠色區域用0填充;

c圖中,為擴張率為4時,也就是4倍的擴張率,卷積核的變化情況,紅點位置标示原卷積核資料,其餘綠色區域用0填充;

  • 轉置卷積,在我們招聘講師面試的過程中,也聽别人叫過反卷積
  • 反卷積是一種特殊的正向卷積
  • 通俗的講,就是在原圖像上輸入補0+卷積。先按照一定的比例通過補0來擴大輸入圖像的尺寸,再進行正向卷積即可。

關鍵點:轉置卷積,改變的是原圖像大大小,而空洞卷積改變的是卷積核的感受野的大小(卷積核);這塊還需要大家好好分析一下;

卷積輸出公式:(比較常見的一個公式)

對比:空洞卷積與轉置卷積(吉米王)

備注:還有一種特殊情況記不太清了,等有時間我查下資料補上。

參數說明:

n:特征圖的寬或者高

k:卷積核的尺寸

p:padding的數值,一般指單側填充幾個單元

stride:顧名思義卷積核的步長

到百科上找了個圖檔:(相當于對原圖像進行放大,空白處用0填充,實際上我們可以通過一定的參數設定,利用轉置卷積實作上采樣的等同效果)

對比:空洞卷積與轉置卷積(吉米王)

經典應用場景:

  • 轉置卷積用來增大特征圖的分辨率的。
  • 或者叫上采樣,意思是一樣的,印象中以前在某些經典的算法底層就在使用
# 反卷積上采樣
x = Conv2DTranspose(filters, kernel_size=(2,2), strides=(2,2),padding="same")(input_tensor)
           
  • 常見的上采樣的API還有UpSampling2D等
    對比:空洞卷積與轉置卷積(吉米王)
就這樣吧,下地鐵了…,本來還想寫點什麼,沒時間了,又是半篇文章。生活縱有千萬個不如意,我亦勇往直前…

繼續閱讀