天天看點

深度學習常用資料集資源(計算機視覺領域)

目錄

1、MNIST

2、ImageNet

4、COCO

5、PASCAL VOC

6、FDDB

深度學習領域的入門資料集,目前主流的深度學習架構幾乎都将MNIST資料集的處理入門第一教程。MNIST是一個手寫數字資料庫,它有60000個訓練樣本集和10000個測試樣本集,每個樣本圖像的寬高為28*28,數字放在一個歸一化的、固定尺寸的圖檔的中心。

資料集大小:~12MB

下載下傳位址:

http://yann.lecun.com/exdb/mnist/index.html

2、ImageNet  

深度學習常用資料集資源(計算機視覺領域)

Imagenet資料集是目前深度學習圖像領域應用得非常多的一個領域,關于圖像分類、定位、檢測等研究工作大多基于此資料集展開。Imagenet資料集文檔詳細,有專門的團隊維護,使用非常友善,在計算機視覺領域研究論文中應用非常廣,幾乎成為了目前深度學習圖像領域算法性能檢驗的“标準”資料集。

Imagenet資料集有1400多萬幅圖檔,涵蓋2萬多個類别;其中有超過百萬的圖檔有明确的類别标注和圖像中物體位置的标注。

資料集大小:~1TB

http://www.image-net.org/about-stats

CIFAR-10包含10個類别,50,000個訓練圖像,彩色圖像大小:32x32,10,000個測試圖像。CIFAR-100則是包含100個類,每類有600張圖檔,其中500張用于訓練,100張用于測試;這100個類分組成20個超類。圖像類别均有明确标注。CIFAR對于圖像分類算法測試來說是一個非常不錯的中小規模資料集,雖然用得人比以前少了很多,但仍然能用它做有趣的合理性測試。

資料集大小:~170MB

http://www.cs.toronto.edu/~kriz/cifar.html

4、COCO  

深度學習常用資料集資源(計算機視覺領域)

COCO資料集由微軟贊助,其對于圖像的标注資訊不僅有類别、位置資訊,還有對圖像的語義文本描述,COCO資料集的開源使得近兩三年來圖像分割語義了解取得了巨大的進展,也幾乎成為了圖像語義了解算法性能評價的“标準”資料集。

資料集大小:~40GB

http://mscoco.org/
深度學習常用資料集資源(計算機視覺領域)

PASCAL VOC圖檔集包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、機車、火車);室内(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。PASCAL VOC挑戰賽是視覺對象的分類識别和檢測的一個基準測試,提供了檢測算法和學習性能的标準圖像注釋資料集和标準的評估系統。

資料集大小:~2GB

http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html
深度學習常用資料集資源(計算機視覺領域)

FDDB是全世界最具權威的人臉檢測評測平台之一,包含2845張圖檔,共有5171個人臉作為測試集。測試集範圍包括:不同姿勢、不同分辨率、旋轉和遮擋等圖檔,同時包括灰階圖和彩色圖,标準的人臉标注區域為橢圓形。該資料集的圖檔來自于美聯社和路透社新聞報道圖檔,并删除了重複圖檔。

資料集大小:~550MB

http://vis-www.cs.umass.edu/fddb/