我認為這裡的重要部分是連結如何将對象檢測視為與标準資訊檢索問題相同,對于該問題至少存在一個關于平均精度的出色描述。
某些對象檢測算法的輸出是一組建議的邊界框,并且每個邊界框都有一個置信度和分類分數(每類一個分數)。 現在讓我們忽略分類分數,并使用置信度作為門檻值二進制分類的輸入。 直覺上,平均精度是門檻值/截止值的所有選擇的總和。 可是等等; 為了計算精度,我們需要知道一個盒子是否正确!
這是令人困惑/困難的地方; 與典型的資訊檢索問題相反,我們實際上在這裡有一個額外的分類級别。 也就是說,我們無法在框之間進行精确比對,是以我們需要對邊界框是否正确進行分類。 解決的方法是對包裝盒尺寸進行寫死分類。 我們會檢查它是否與任何基本事實充分重疊以被視為“正确”。 這部分的門檻值是根據常識選擇的。 您正在處理的資料集可能會定義“正确”邊界框的門檻值。 大多數資料集隻是将其設定為0.5 IoU,然後将其設定為該值(我建議進行一些手動IoU計算([不難],以體會0.5 IoU的嚴格程度)。
現在,我們已經定義了“正确”的含義,我們可以使用與資訊檢索相同的過程。
要查找平均平均精度(mAP),您隻需根據與這些框相關的最大分類得分對建議的框進行分層,然後對各個類别的平均精度(AP)進行平均(取平均值)即可。
TLDR; 在确定邊界框預測是否為“正确”(分類的額外級别)與評估框的置信度向您告知“正确”邊界框預測(完全類似于資訊檢索的情況)和以下方面的典型描述之間進行區分: 行動計劃将是有道理的。
值得注意的是,Precision / Recall曲線下的Area與平均精度相同,并且我們實際上是使用梯形或右手定則來近似該面積以近似積分。