轉置卷積和孔洞卷積（擴張卷積）

2023-03-08 00:34:45

連結：https://pan.baidu.com/s/15NsS8WtYQiahM6p_z_YBNQ

提取碼：3q96

本文對A guide to convolution arithmetic for deep 的第四章部分翻譯，純屬個人學習的。

這一篇是講空洞卷積的：https://www.zhihu.com/question/54149221

膨脹卷積：https://blog.csdn.net/zhangjunhit/article/details/70157920

前面大部分都講的是卷積操作，包括卷積核、步長、pad，（pad表示一個次元左右各補充幾個0，總共是2*pad的補充）

這幾個怎麼影響輸出的size的，公式：

i是原尺寸，p是補充的pad，k是卷積核的長，s是步長，are you ok？哈哈

轉置卷積和孔洞卷積（擴張卷積）

圖解：

轉置卷積和孔洞卷積（擴張卷積）

下面這個才是重點

轉置卷積和孔洞卷積（擴張卷積）

基本意思就是，有一個輸入4*4的圖檔，暫定為一個通道，然後flattened拉平成一行，shape是（16，）用X表示，然後将3*3的卷積核表達成一個稀疏矩陣C，其中的值沒有變化。原矩陣：

[[w00,w01,w02],

[w10,w11,w12],

[w20,w21,w22]

]

稀疏矩陣C：

轉置卷積和孔洞卷積（擴張卷積）

然後是CX=result，再reshape成2*2，注意圖2.1。這樣結果與正常卷積是一樣的。

在反向傳播時用的就是CT（C的轉置），很容易得到。

轉置卷積——也稱為分階躍卷積或反卷積-通過交換卷積的正向和反向傳遞來實作。一種方法是注意到核函數定義了卷積，但是

它是直接卷積還是轉置卷積是由如何計算向前和向後傳遞。

For instance, although the kernel w defines a convolution whose forward and backward passes are computed by multiplying with C and CT respectively, it also defines a transposed convolution whose forward and backward passes are computed by multiplying with CT and (CT ) T = C respectively.

例如，雖然核w定義了一個卷積，它的前向傳播和反向傳播通過C或者CT乘計算,還定義了一個轉置卷積，它的前向和反向傳播是用CT和(CT)T的乘計算。

Finally note that it is always possible to emulate a transposed convolution with a direct convolution.The disadvantage is that it usually involves adding many columns and rows of zeros to the input, resulting in a much less efficient implementation

最後請注意，總是可以通過用直接卷積模拟一個轉置卷積。缺點是，它通常需要在輸入中添加許多列和行0，導緻實作效率大大降低.(也就說作者不贊成正向卷積操作，轉置卷積操作高效)

直接卷積模拟轉置卷積：C.T × result = X （大家可以推推次元），

對于X[0] =

轉置卷積和孔洞卷積（擴張卷積）

*result[0] + 0*result[1] + 0*result[2] + 0*result[3]

轉置卷積和孔洞卷積（擴張卷積）

轉置卷積也稱為分階躍卷積或反卷積（ fractionally strided convolutions or deconvolutions），其工作原理是交換卷積的正反向傳遞。一種方法是注意到核函數定義了卷積，但是它是直接卷積還是轉置卷積是由計算正向和反向傳遞的方式決定的。

考慮對給定輸入的用轉置卷積的最簡單的方法是：

把輸入想象成直接卷積的結果-特征圖。是以，轉置卷積可以被認為是允許恢複此初始特征映射的形狀的操作。

下面的圖表示：

一種可以認為對2*2的恢複成了4*4的，先填充pad=2，然後用3*3卷積核，得到4*4的特征圖；

一種認為對4*4的做了轉置卷積操作，得到2*2特征圖。（高效）

轉置卷積和孔洞卷積（擴張卷積）

最後這幾個，我還沒看懂，暫時放圖上來

轉置卷積和孔洞卷積（擴張卷積）

5.1 孔卷積

膨脹卷積通過在核心元素之間插入空格使核心膨脹。膨脹率由一個額外的超參數d來控制。實作可能不同，但通常在核心元素之間插入d-1空格，使d = 1對應于一個正則卷積。

擴充卷積用于在不增加核心大小的情況下廉價地增加輸出單元的感受野，當多個擴充卷積一個接一個疊加時，這種方法尤其有效。具體例子見Oord等人(2016)，其中提出的WaveNet模型實作了原始音頻的自回歸生成模型，該模型使用擴充卷積在過去音頻幀的大上下文中設定新的音頻幀。

為了了解膨脹率d與輸出大小o之間的關系，考慮d對有效核心大小的影響是很有用的。大小為k的核被因子d膨脹後具有有效大小：

轉置卷積和孔洞卷積（擴張卷積）

形成膨脹卷積的關系如下：

轉置卷積和孔洞卷積（擴張卷積）

轉置卷積和孔洞卷積（擴張卷積）

5.1 孔卷積

繼續閱讀

微調模型來完成熱狗識别的圖像分類任務

Meta-Transformer，一個多模态模型，其具有一個模态共享編碼器，無需配對資料，可以在12個不同模态上完成16

pytorch 圖像分類(3)1.DenseNet2.SENet3.DarkNet4.CSPDenseNet5CSPDarkNet

【21】使用預訓練的目标檢測與語義分割網絡1. 使用訓練好的目标檢測網絡2. 使用訓練好的語義分割網絡

【項目實戰課】基于Pytorch的EnlightenGAN自然圖像增強實戰

Transformer模型最開始是使用在NLP自然語言處理的模型，但是注意力機制越來越火🔥，且注意力機制跟人進行學習的方

[深度學習]AlexNet和VGG論文筆記AlexNetVGGNetAlexNet 和 VGGNet的對比

卷積神經網絡基礎知識四（VGG）一.簡單介紹二.基礎理論部分三.網絡實戰（Pytorch）參考

圖像分類---利用pytorch搭建AlexNet網絡模型訓練自己的資料集（貓狗分類）1 資料準備 2 利用pytorch搭建AlexNet網絡模型 3 訓練網絡模型代碼4 測試代碼

計算機視覺和機器學習應用中的多邊形标注介紹

Tensorflow卷積網絡實作對CIFAR圖像的分類CIFAR資料集簡介下載下傳資料集導入資料集顯示資料集資訊資料預處理定義共享參數定義網絡結構構模組化型定義準确率定義傳回下一個epoch的函數訓練模型損失（準确率）可視化

TensorFlow與Inception-v3Inception-v3資料集代碼

opencv學習筆記六十一：Googlenet模型實作圖像分類

圖像分類綜述—A survey on Semi-, Self- and Unsupervsed Techniques in Imag

基于PyTorch的卷積神經網絡圖像分類——貓狗大戰（二）：使用Pytorch定義網絡模型1. 需要用到的庫2. 模型定義3. 測試

基于PyTorch的卷積神經網絡圖像分類——貓狗大戰（一）：使用Pytorch定義DataLoader1. 需要用到的庫2. 資料擴充定義3. 自定義Dataset4. 測試