天天看點

sklearn學習過程中mnist資料集的導入問題

先說主要問題:

案例中的原始方法,如下是行不通。不知道是網絡上資料集改位置了還是怎麼的

from sklearn.datasets import fetch_mldata
mnist = fetch_mldata('MNIST original')
           

具體解決方法:

首先在github上手動下載下傳資料集檔案

https://github.com/amplab/datascience-sp14/raw/master/lab7/mldata/mnist-original.mat

from sklearn.datasets import fetch_mldata

mnist = fetch_mldata('MNIST original',data_home='/home/jie/下載下傳/')
           

該段代碼中需要注意一下:

1、下載下傳下來的資料集名稱是mnist-original.mat,但是并不是說在fetch_mldata函數中就要通過這個名字獲得資料集,而是依然必須保證是'MNIST original'的名字。

2、‘/home/jie/下載下傳/’是資料集檔案的下載下傳位址,但是并不是填寫上就萬事大吉了,而是還需要在該目錄下建立一個“mldata”的檔案夾,将資料集檔案放入該檔案夾中,然後運作上段代碼,擷取資料集合成功。