天天看点

Open Images V4 下载自己需要的类别(数据集获取)

注释文件如下:

 Class Names:    

           class-descriptions-boxable.csv      数据集内部使用的类名到人类可理解名称的对应

 Boxes:

          train-annotations-bbox.csv              训练图像中对象实例的边框注释

          validation-annotations-bbox.csv     验证图像中对象实例的边框注释

          test-annotations-bbox.csv                测试图像中对象实例的边框注释

下载地址:

wget https://storage.googleapis.com/openimages/2018_04/class-descriptions-boxable.csv

wget https://storage.googleapis.com/openimages/2018_04/train/train-annotations-bbox.csv

wget https://storage.googleapis.com/openimages/2018_04/validation/validation-annotations-bbox.csv

wget https://storage.googleapis.com/openimages/2018_04/test/test-annotations-bbox.csv

采用的是里面的工具箱的方法(https://github.com/EscVM/OIDv4_ToolKit),实操起来顺利!

python main.py -h

修改了classes.txt中的类别,在文本中输入了自己需要的种类,最后通过指令

python main.py downloader  --classes ./OpenImageV4/OIDv4_ToolKit/classes.txt  --type_csv validation
python main.py downloader  --classes ./OpenImageV4/OIDv4_ToolKit/classes.txt  --type_csv train
python main.py downloader  --classes ./OpenImageV4/OIDv4_ToolKit/classes.txt  --type_csv test

#也可以用--type_csv all 直接下载所有的图片集合      

就可以分别下载物体检测任务下的验证集、训练集和测试集合了。

实际训练中其实没必要用到这么多图片,这时在指令中加上--limit 30(30可以换成自己需要的图片数量)