天天看點

Open Images V4 下載下傳自己需要的類别(資料集擷取)

注釋檔案如下:

 Class Names:    

           class-descriptions-boxable.csv      資料集内部使用的類名到人類可了解名稱的對應

 Boxes:

          train-annotations-bbox.csv              訓練圖像中對象執行個體的邊框注釋

          validation-annotations-bbox.csv     驗證圖像中對象執行個體的邊框注釋

          test-annotations-bbox.csv                測試圖像中對象執行個體的邊框注釋

下載下傳位址:

wget https://storage.googleapis.com/openimages/2018_04/class-descriptions-boxable.csv

wget https://storage.googleapis.com/openimages/2018_04/train/train-annotations-bbox.csv

wget https://storage.googleapis.com/openimages/2018_04/validation/validation-annotations-bbox.csv

wget https://storage.googleapis.com/openimages/2018_04/test/test-annotations-bbox.csv

采用的是裡面的工具箱的方法(https://github.com/EscVM/OIDv4_ToolKit),實操起來順利!

python main.py -h

修改了classes.txt中的類别,在文本中輸入了自己需要的種類,最後通過指令

python main.py downloader  --classes ./OpenImageV4/OIDv4_ToolKit/classes.txt  --type_csv validation
python main.py downloader  --classes ./OpenImageV4/OIDv4_ToolKit/classes.txt  --type_csv train
python main.py downloader  --classes ./OpenImageV4/OIDv4_ToolKit/classes.txt  --type_csv test

#也可以用--type_csv all 直接下載下傳所有的圖檔集合      

就可以分别下載下傳物體檢測任務下的驗證集、訓練集和測試集合了。

實際訓練中其實沒必要用到這麼多圖檔,這時在指令中加上--limit 30(30可以換成自己需要的圖檔數量)