1.Mars資料集
目前,基于視訊的reid最大的資料集,應該就是2016年鄭良老師開源的Mars(Motion Analysis and Re-identification Set)資料集。資料集的位址為
http://www.liangzheng.com.cn/Project/project_mars.html
最近官方下載下傳連結好像失效了,我補一個網盤連結連結: https://pan.baidu.com/s/1XKBdY8437O79FnjWvkjusw
提取碼: ymc5
2.下載下傳完的Mars資料集
整個Mars資料的大小大概有6.3G,有兩個名稱為bbox_train和 bbox_test的檔案夾。
同時你還應該下載下傳一個關于資料集資訊的info檔案夾。info檔案夾不包括在原始資料集中,下載下傳位址為https://github.com/liangzheng06/MARS-evaluation/tree/master/info。完整版的Mars資料集包含的檔案夾如下圖所示。
進一步地,讓我們來看看這三個檔案夾中的内容。
3.bbox_train檔案夾
bbox_train檔案夾中,有625個子檔案夾(代表着625個行人id),共包含了8298個小段軌迹(tracklets),總共包含509,914張圖檔。
4.bbox_test檔案夾
bbox_test檔案夾中共有636個子檔案夾(代表着636個行人id),共包含了12180個小段軌迹(tracklets),總共包含681,089張圖檔。在實驗中這個檔案夾被劃分為圖庫集(gallery)+ 查詢集(query)。在info檔案夾中會解釋這件事。
名稱為00-1子檔案夾表示無用的圖檔集,他們對應的行人id被設為**-1**,一般在算法中直接無視pid = -1的圖檔。
而名稱0000子檔案夾中,他們對應的行人id被設為0,表示幹擾因素,對檢索準确性産生負面影響。
5.info檔案夾
info檔案夾中包含了5個子檔案,包含了整個資料集的資訊,目的是友善使用資料集。
1. train_name.txt檔案
這個txt檔案裡,按照順序存放bbox_train檔案夾裡所有圖檔的名稱,一共有509,914行。
既然在這裡出現了圖檔名稱,就順帶解釋下圖檔的命名規則。以圖檔名稱
0065 C1 T0002 F0016.jpg為例。
0065表示的行人的id,也就是 bbox_train檔案夾中對應的 0065子檔案夾名;
C1表示攝像頭的id,說明這張圖檔是在第1個攝像頭下拍攝的(一共有6個攝像頭);
T0002表示關于這個行人視訊段中的第2個小段視訊(tracklet);
F0016表示在這張圖檔是在這個小段視訊(tracklet)中的第16幀。在每個小段視訊(tracklet)中,幀數從 F0001開始。
2. test_name.txt檔案
同樣地,在這個txt檔案中,按照順序存放bbox_test檔案夾裡所有圖檔的名稱,一共有681,089行。
3. tracks_train_info.mat檔案
.mat格式的檔案是matlab儲存的檔案,用matlab打開後可以看到是一個8298 * 4的矩陣。
矩陣每一行代表着一個tracklet;
第一列和第二列代表着圖檔的序号,這個序号與 train_name.txt檔案中的行号一一對應;
第三列是行人的id,也就是 bbox_train檔案夾中對應的 子檔案夾名;
第4列是對應的攝像頭id(一共有6個攝像頭)。
4. tracks_test_info.mat檔案
這個檔案用matlab打開後可以看到是一個12180 * 4的矩陣。
矩陣每一行代表着一個tracklet;
第一列和第二列代表着圖檔的序号,這個序号與 test_name.txt 檔案中的行号一一對應;
第三列是行人的id,也就是 bbox_test檔案夾中對應的 子檔案夾名;;
第4列是對應的攝像頭id(一共有6個攝像頭)。
5. query_IDX.mat檔案
這個檔案用matlab打開後可以看到是一個1 * 1980的矩陣,可以看到每一列是對應上面 tracks_test_info.mat檔案中的第幾行。
比如1978列中的值為12177,對應的是 tracks_test_info.mat檔案中的第12177行。
而12177行中,可以看到其id=1496。不難發現同樣id=1496的行還有12166, 12167等。其實這說明在 名稱為1496子檔案夾中,有多個小段視訊(tracklet)。
值得注意的是, 并不是所有查詢集的id,圖庫都有對應的相同id行人的行。在1980個查詢id中,有效的id(在圖庫中存在相同id的行)數 = 1840。
也就是說,有些檔案夾裡隻有1個tracklet。
結語
Mars資料集就介紹到這,若有問題,歡迎大家與我交流,我的郵箱為[email protected]。github就先不放了。。下次再說。
接下來會介紹如何基于Mars資料集,實作video_based person-ReId。然後會介紹一些目前自己見到的一些用在reid上的一些注意力機制等。