arXiv 2021

Jing Zhang, Yunqiu Lv, Mochu Xiang, Aixuan Li, Yuchao Dai, Yiran Zhong

論文位址

一、簡介

探索深度資訊對僞裝物體檢測的貢獻，提出了一個深度資訊引導的僞裝對象檢測網絡。

我們引入深度品質評估子產品來評估僞裝對象檢測的深度品質，并隻使用高品質的深度更新網絡的模态互動部分。

在測試過程中，我們的深度品質評估子產品可以自動識别深度品質。

二、方法

2.1 簡介

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

我們首先使用現有的單目深度估計方法生成深度圖，然後引入深度品質評估子產品，根據RGB COD 和RGB-D COD模型的預測結果有效地識别高品質的深度圖，并相應地更新網絡參數。

該架構一共有三個部分：1）RGB COD model；2）RGB-D COD model；3）深度品質評估子產品。

2.2 初始深度生成

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

使用現有最先進的單目深度估計方法（MiDaS，Monodepth2，FrozenPeople）為我們的訓練和測試資料集生成深度圖。其中MiDaS在不同場景中提供了可靠的結果，Monodepth2主要針對自動駕駛，FrozenPeople主要針對人類。如圖Figure3所示，MiDaS的效果更好，是以在實驗中采用了MiDaS來生成深度圖。

2.3 RGB COD model

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

Encoder使用ResNet-50，生成四個featuers。Prediction旨在将較高較低的特征與較大的接受域相結合，以進行僞裝對象檢測。

ASPP是多孔空間金字塔池化子產品，RCA是殘差通道注意子產品，Triple Conv是3個3×3的卷積。

2.4 RGB-D COD model

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

RGB-D COD model的Encoder和COD Prediction部分與RGB COD model完全相同。

Mode Exploring：

Mode Exploring 旨在有效融合RGB特征和深度特征以進行多模态學習。

首先對每個階段的特征（一共有4個階段）使用3×3卷積層進行通道縮減，然後對每個階段的RGB特征和深度特征進行拼接操作，接着使用RCA進行判别特征提取，最後使用3×3的卷積獲得多級融合特征。

Estimated Depth：

使用U-Net結構，逐漸的将進階資訊與低級資訊融合。具體公式如下：

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

Cat表示拼接操作，ELU是ELU激活函數，Up2表示上采樣兩倍。

參數：

RGB COD解碼器與RGB-D COD解碼器共享權重。

我們認為高品質和低品質的深度圖都可以用來更新深度編碼器和深度解碼器，因為深度評估子產品中的平滑度損失可以推動網絡生成相對有效的深度特征。但是，“模式探索”子產品對深度品質非常敏感。然後我們隻用高品質的深度圖更新它。

2.5 深度圖品質評估

由于域間隙，從單目深度估計方法生成的深度圖可能不是很準确，直接使用低品質的深度圖訓練可能不會提高模型的性能，因為網絡會過度拟合不太準确的深度圖，導緻泛化能力差。對此，我們首先對其生成的深度圖進行品質評估，然後僅使用高品質的深度圖進行多模态資訊探索。

深度品質評估子產品由4個級聯卷積層（3×3，步長為2）和一個全連接配接層組成，以産生一個在[0，1]範圍内表示深度品質的标量。四個卷積層的通道大小分别為C,2∗C,4∗C,C。在所有卷積層之後使用批量歸一化和 LeakyReLU。最後一個全連接配接層用于将通道大小為 C 的特征圖映射到表示深度品質的二維特征向量（{1，0}表示好，{0，1}表示壞）。

由于我們沒有關于深度品質的先驗知識，我們引入了一種性能引導的深度品質監督生成技術。RGB-D COD model生成的map比RGB COD model生成的map精度更高則表示更高品質的深度圖。

2.6 目标函數

整體損失：

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

平滑度損失将深度限制為與我們的地面真實僞裝圖共享相似的結構，其定義為：

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

深度估計損失：

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

流程僞代碼：

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

三、實驗

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

Depth-Guided Camouflaged Object Detection閱讀筆記一、簡介二、方法三、實驗

一、簡介

二、方法

2.1 簡介

2.2 初始深度生成

2.3 RGB COD model

2.4 RGB-D COD model

2.5 深度圖品質評估

2.6 目标函數

三、實驗

繼續閱讀

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普