從此不迷路
計算機視覺研究院
公衆号ID|ComputerVisionGzq
論文位址:https://arxiv.org/pdf/2201.03243v1.pdf
計算機視覺研究院專欄
作者:Edison_G
一種改進且高效的基于深度學習的自主系統,該系統可以高精度地檢測和跟蹤非常小的無人機。
整體的介紹都比較基礎簡單,初學者可以簡單了解!
一、前言
如今,無人機等被廣泛用于各種用途,例如從航空圖像中捕獲和目标檢測等。這些小型ariel車輛輕松進入公衆可能會造成嚴重的安全威脅。例如,關鍵地點可能會被混入公共場所的間諜使用無人機監控。
Study in hand提出了一種改進且高效的基于深度學習的自主系統,該系統可以高精度地檢測和跟蹤非常小的無人機。所提出的系統由一個定制的深度學習模型“Tiny YOLOv3”組成,這是一種非常快速的目标檢測模型“You Look Only Once”(YOLO)被建構并用于檢測。目标檢測算法将有效地檢測無人機。與之前的YOLO版本相比,所提出的架構顯示出明顯更好的性能。在資源使用和時間複雜度方面得到了改進。
二、背景
随着世界在融合最新技術的同時不斷進步,安全系統也在快速發展,以利用創新的力量來應對可能出現的任何安全威脅。在過去的幾年裡,無人機的使用量急劇增加,包括對公衆的可及性,這進一步增加了其使用量。随着無人機使用量的增加,安全威脅也随之增加。我們已經看到了一些無人機飛越不同建築物的事件,包括一些需要安全的敏感區域。
無人機還提出了許多威脅,包括無人機被用作毒品走私工具、入侵無人機導緻它們爆炸或使用它們竊取敏感資訊,無人機還被用于進行非法監視,造成安全和隐私威脅。這些事件對安全和隐私構成了巨大威脅。是以,解決這些安全問題的方法是檢測和跟蹤這些無人機,以便采取反制技術來阻止這些無人機,以確定安全和隐私。
此外,大多數安全或防禦系統都具有檢測可能發生的威脅程度的能力,但是,很少有人能夠深入分析威脅。随着機器學習和人工智能的進步,通過減少人為幹預使此類系統變得智能化,有效的目标檢測可以幫助提高安全系統的效率并執行更好的分析。
三、新架構分析
前期主要介紹了深度學習的一些基礎知識:
Image matrix convolution operation with multiplies filter matrix
Convolution with 3 x3 filter using Stride 2
ReLU operation
Max-Pooling
Fully Connected Layer
如上展示,盡管Tiny YOLOv3比YOLOv3快得多,但它因為它在2個尺度上執行檢測,并沒有提供更好的準确度。
為了更好地實作準确性,研究者引入了一個修改後的Tiny YOLOv3架構。該架構總共包括31層:16個卷積層,3個檢測層,其餘是用最大池化和ReLU層。以前的YOLOV3微型架構由總共24層組成,其中包括13個卷積層、3個檢測層。
研究者修改了Tiny YOLOv3架構,通過使用前幾層的ReLU層提取特征,将在三個尺度上進行檢測。這意味着3個yolo層将負責檢測對象。錨框用于計算預測邊界框的寬度和高度。通常,YOLOv3為每個單元使用3個錨點,這些錨點預測三個邊界框,總共9個錨點框。對于研究者的自定義目标檢測器,總共使用了6個錨框。
預測特征圖将分别為3個尺度上的13x13、26x26和52x52。随着網絡向前傳播圖像,在第一個yolo層,得到一個13x13的輸出特征圖。在放置第一個yolo層之後,對下一層進行了兩倍的采樣,然後将具有相似大小的前一層的特征圖連接配接起來。對于第二個yolo層,得到26x26的輸出特征圖,在第三個yolo層,得到一個52x52的特征圖。這種架構比原始的yolov3架構更簡潔、更小,後者在3個尺度上進行檢測。此外,研究者的小而輕的架構可以檢測具有高置信度分數的小物體。
四、實驗
Results Evaluated