卷積神經網絡的網絡結構——Inception V4

《Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning》

2016，Google，Inception V4，Inception ResNet V1、V2

Inception結構有着良好的性能，且計算量低。Residual connection不同于傳統網絡結構，且在2015 ILSVRC取得冠軍，它的性能和Inception-v3接近。作者嘗試将Inception結構和Residual connection結合，同時也設計了不用Residual connection版本的Inception-v4。通過對三個殘差和一個Inception-v4進行組合，在top-5錯誤率上達到了 3.08%。

1.相關工作：

卷積網絡在圖像識别領域已經十分流行，經典網絡有AlexNet、VGGNet、GoogLeNet等。Residual connection的提出是用于訓練更深的網絡，但是作者發現不使用Residual connection也可以訓練更深的網絡。Residual connection并不是必要條件，隻是使用了Residual connection會加快訓練速度。

Inception結構最初由GoogLeNet引入，GoogLeNet叫做Inception-v1；之後引入了BatchNormalization，叫做Inception-v2；随後引入分解，叫做Inception-v3。

2.網絡架構：

Inception-v4網絡，對于Inception塊的每個網格大小進行了統一。

下圖是Inception-v4的結構：所有圖中沒有标記“V”的卷積使用same的填充原則，即其輸出網格與輸入的尺寸正好比對。使用“V”标記的卷積使用valid的填充原則，意即每個單元輸入塊全部包含在前幾層中，同時輸出激活圖（output activation map）的網格尺寸也相應會減少。

卷積神經網絡的網絡結構——Inception V4

Stem子產品為：

卷積神經網絡的網絡結構——Inception V4

Inception-v4網絡35×35網格的架構（對應圖中Inception-A塊）：

卷積神經網絡的網絡結構——Inception V4

Inception-v4網絡17×17網格塊的架構（對應圖中Inception-B塊）：

卷積神經網絡的網絡結構——Inception V4

Inception-v4網絡的8×8網格子產品的架構（對應圖中Inception-C塊）：

卷積神經網絡的網絡結構——Inception V4

不同的Inception子產品的連接配接，減小了feature map，卻增加了filter bank。

35x35變為17x17子產品，即Reduction-A ：

卷積神經網絡的網絡結構——Inception V4

17x17變為8x8子產品，即Reduction-B ：

卷積神經網絡的網絡結構——Inception V4

Inception-ResNet

我們嘗試了殘差Inception的幾個版本。這裡對其中的兩個進行具體細節展示。第一個是“Inception-ResNet-v1”，計算代價跟Inception-v3大緻相同，第二個“Inception-ResNet-v2”的計算代價跟Inception-v4網絡基本相同。

Inception-ResNet的兩個版本，結構基本相同，隻是細節不同。整體結構為：

卷積神經網絡的網絡結構——Inception V4

Inception-ResNet-v1和Inception-ResNet-v2對應的stem子產品為：

注：Inception-ResNet-v2和Inception-v4使用相同的Stem子產品

Inception-ResNet-v1的Stem子產品：

卷積神經網絡的網絡結構——Inception V4

Inception-ResNet-v1和Inception-ResNet-v2對應的Inception-resnet-A子產品為：

卷積神經網絡的網絡結構——Inception V4

Inception-ResNet-v1和Inception-ResNet-v2對應的Inception-resnet-B子產品為：

卷積神經網絡的網絡結構——Inception V4

Inception-ResNet-v1和Inception-ResNet-v2對應的Inception-resnet-C子產品為：

卷積神經網絡的網絡結構——Inception V4

注：Inception-ResNet-v1和Inception-ResNet-v2對應的3535to1717的reduction子產品同Inception v4一樣。

Inception-ResNet-v1和Inception-ResNet-v2對應的17x17變為8x8子產品，即Reduction-B：

卷積神經網絡的網絡結構——Inception V4

Inception-ResNet的stem子產品和Reduction-B子產品也略微不同。Inception-ResNet-v1和Inception-ResNet-v2主要在于Reduction-A結構不同：

卷積神經網絡的網絡結構——Inception V4

其中k,l,m,n表示filter bank size。

3.對殘差子產品的縮放

我們發現，如果濾波器數量超過1000，殘差網絡開始出現不穩定，同時網絡會在訓練過程早期便會出現“死亡”，意即經過成千上萬次疊代，在平均池化（average pooling）之前的層開始隻生成0。通過降低學習率，或增加額外的batch-normalizatioin都無法避免這種狀況。

我們發現，在将殘差子產品添加到activation激活層之前，對其進行放縮能夠穩定訓練。通常來說，我們将殘差放縮因子定在0.1到0.3。

注：He在訓練Residual Net時也發現這個問題，提出了“two phase”訓練。首先“warm up”，使用較小的學習率。接着再使用較大的學習率。

卷積神經網絡的網絡結構——Inception V4

縮放子產品僅僅适用于最後的線性激活。

4.實驗結果

在驗證集上各種結構的單個模型以及單次裁剪的top-1和top-5錯誤率。

卷積神經網絡的網絡結構——Inception V4

5.結論

本文詳細呈現了三種新的網絡結構：

（1）Inception-ResNet-v1：混合Inception版本，它的計算效率同Inception-v3；

（2）Inception-ResNet-v2：更加昂貴的混合Inception版本，同明顯改善了識别性能；

（3）Inception-v4：沒有殘差連結的純淨Inception變種，性能如同Inception-ResNet-v2我們研究了引入殘差連接配接如何顯著的提高inception網絡的訓練速度。而且僅僅憑借增加的模型尺寸，我們的最新的模型（帶和不帶殘差連接配接）都優于我們以前的網絡。

注：博衆家之所長，叢集英之荟萃。

卷積神經網絡的網絡結構——Inception V4

卷積神經網絡的網絡結構——Inception V4

1.相關工作：

2.網絡架構：

Inception-ResNet

3.對殘差子產品的縮放

4.實驗結果

5.結論

繼續閱讀

深度學習與圍棋：為AlphaGo訓練深度神經網絡13.1.1　AlphaGo的網絡架構13.1.2　AlphaGo棋盤編碼器13.1.3　訓練AlphaGo風格的政策網絡

蚪俠-遠端泛目錄[泛域名+泛目錄+泛内頁]-[代碼+漢字]幹擾-字型繁簡切換-蜘蛛欺騙-主動推送_鏡像版-V25版

深度學習的一些小記錄裡面有一部分是摘錄

自學記錄《深度學習500問》之深度學習基礎

問答機器人代碼封裝和對外提供接口代碼封裝和對外提供接口

數學模組化智能優化算法之神經網絡案例附Matlab代碼

突破！雙一流大學，首篇Nature！

PALM病理性近視預測 2021-07-04飛槳正常賽：PALM病理性近視預測 6月第3名方案一、賽題介紹

圖形處理單元(GPU)的演進

CogView: Mastering Text-to-Image Generation via Transformers翻譯摘要1.介紹2.方法3.Finetuning

深度學習之卷積01 卷積02 填充Padding03 步幅Stride04 卷積核的選擇05 多通道卷積參考

HDU 1402 A * B Problem Plus

通俗了解查準率(precision)和查全率(recall)

人工智能如何有效地運用于自然語言處理

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案