天天看點

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

作者:計算機視覺研究院

關注并星标

從此不迷路

計算機視覺研究院

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)
YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

公衆号ID|計算機視覺研究院

學習群|掃碼在首頁擷取加入方式

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

論文位址:YOLOCS: Object Detection based on Dense Channel Compression for Feature Spatial Solidification (arxiv.org)

計算機視覺研究院專欄

Column of Computer Vision Institute

通過壓縮特征圖的空間分辨率,提高了對象檢測的準确性和速度。本文的主要貢獻在于引入了一種新的特征空間固化方法,能夠有效地降低特征圖的時空複雜度,提高對象檢測的效率和準确性。

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

01

總 述

在今天分享中,研究者檢查了在特征純化和梯度反向傳播過程中信道特征和卷積核之間的關聯,重點是網絡内的前向和反向傳播。是以,研究者提出了一種稱為密集通道壓縮的特征空間固化方法。根據該方法的核心概念,引入了兩個用于骨幹網絡和頭部網絡的創新子產品:用于特征空間固化結構的密集通道壓縮(DCFS)和非對稱多級壓縮解耦頭部(ADH)。當內建到YOLOv5模型中時,這兩個子產品表現出非凡的性能,進而産生了一個被稱為YOLOCS的改進模型。

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)
YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

在MSCOCO資料集上評估,大、中、小YOLOCS模型的AP分别為50.1%、47.6%和42.5%。在保持與YOLOv5模型的推理速度顯著相似的情況下,大、中、小YOLOCS模型分别以1.1%、2.3%和5.2%的優勢超過YOLOv5的AP。

02

背 景

近年來,目标檢測技術在計算機視覺領域受到了廣泛關注。其中,基于單發多框算法的目标檢測技術(Single Shot Multi Box Detector,SSD)和基于卷積神經網絡的目标檢測技術(Convolutional Neural Networks,CNN)是兩種最常用的目标檢測技術。然而,由于單發多框算法的精度較低,而基于卷積神經網絡的目标檢測技術的計算複雜度較高,是以,尋找一種高效且精度較高的目标檢測技術成為了目前研究的熱點之一。

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

Dense Channel Compression(DCC)是一種新型的卷積神經網絡壓縮技術,它通過對卷積神經網絡中的特征圖進行空間固化,進而實作對網絡參數的壓縮和加速。然而,DCC技術在目标檢測領域的應用尚未得到充分的研究。

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

是以,提出了一種基于Dense Channel Compression的目标檢測技術,命名為YOLOCS(YOLO with Dense Channel Compression)。YOLOCS技術将DCC技術與YOLO(You Only Look Once)算法相結合,實作了對目标檢測的高效且精度較高的處理。具體來說,YOLOCS技術通過DCC技術對特征圖進行空間固化,進而實作對目标位置的精确定位;同時,YOLOCS技術利用YOLO算法的單發多框算法特點,實作對目标類别分類的快速計算。

03

新架構

  • Dense Channel Compression for Feature Spatial Solidification Structure (DCFS)
YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

在提出的方法中(上圖(c))中,研究者不僅解決了網絡寬度和深度之間的平衡問題,還通過3×3卷積壓縮了來自不同深度層的特征,在輸出和融合特征之前将通道數量減少了一半。這種方法使研究者能夠在更大程度上細化來自不同層的特征輸出,進而在融合階段增強特征的多樣性和有效性。

此外,來自每一層的壓縮特征都帶有更大的卷積核權重(3×3),進而有效地擴充了輸出特征的感受野。将這種方法稱為特征空間固化的密集通道壓縮。用于特征空間固化的密集通道壓縮背後的基本原理依賴于利用較大的卷積核來促進通道壓縮。該技術具有兩個關鍵優點:首先,它擴充了前向傳播過程中特征感覺的感受域,進而確定了區域相關的特征細節被納入,以最大限度地減少整個壓縮階段的特征損失。其次,誤差反向傳播過程中誤差細節的增強允許更準确的權重調整。

為了進一步闡明這兩個優點,使用具有兩種不同核類型(1×1和3×3)的卷積來壓縮兩個通道,如下圖:

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

DCFS的網絡結構如下圖所示。采用三層瓶頸結構,在網絡前向傳播的過程中逐漸壓縮信道。半通道3×3卷積應用于所有分支,然後是批處理歸一化(BN)和激活函數層。随後,使用1×1卷積層來壓縮輸出特征通道,以比對輸入特征通道。

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)
  • Asymmetric Multi-level Channel Compression Decoupled Head (ADH)

為了解決YOLOX模型中的解耦頭問題,研究者進行了一系列的研究和實驗。研究結果揭示了解耦頭部結構的利用與相關損失函數之間的邏輯相關性。具體而言,對于不同的任務,應根據損失計算的複雜性調整解耦頭的結構。此外,當将解耦的頭部結構應用于各種任務時,由于最終輸出次元的差異,将前一層的特征通道(如下圖)直接壓縮為任務通道可能會導緻顯著的特征損失。這反過來又會對模型的整體性能産生不利影響。

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

此外,當考慮提出的用于特征空間固化的密集通道壓縮方法時,直接減少最終層中的通道數量以比對輸出通道可能會導緻前向傳播過程中的特征丢失,進而降低網絡性能。同時,在反向傳播的背景下,這種結構可能會導緻次優誤差反向傳播,阻礙梯度穩定性的實作。為了應對這些挑戰,引入了一種新的解耦頭,稱為非對稱多級通道壓縮解耦頭(如下圖(b))。

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

具體而言,研究者深化了專用于目标評分任務的網絡路徑,并使用3個卷積來擴充該任務的感受野和參數數量。同時,沿着通道次元壓縮每個卷積層的特征。該方法不僅有效地減輕了與目标評分任務相關的訓練難度,提高了模型性能,而且大大減少了解耦頭部子產品的參數和GFLOP,進而顯著提高了推理速度。此外,使用1卷積層來分離分類和邊界框任務。這是因為對于比對的正樣本,與兩個任務相關聯的損失相對較小,是以避免了過度擴充。這種方法大大降低了解耦頭中的參數和GFLOP,最終提高了推理速度。

04

實驗可視化

Ablation Experiment on MS-COCO val2017

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

Comparison of YOLOCS, YOLOX and YOLOv5- r6.1[7] in terms of AP on MS-COCO 2017 test-dev

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)
YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

© THE END

轉載請聯系本公衆号獲得授權

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

計算機視覺研究院學習群等你加入!

ABOUT

計算機視覺研究院

計算機視覺研究院主要涉及深度學習領域,主要緻力于目标檢測、目标跟蹤、圖像分割等研究方向。研究院始終分享最新論文算法架構,平台着重”研究“和“實踐”。後期會針對相應領域分享實踐過程,讓大家真正體會擺脫理論的真實場景,培養愛動手程式設計愛動腦思考的習慣!

YoloCS:有效降低特征圖空間複雜度(附論文下載下傳)

繼續閱讀