先說主要問題:
案例中的原始方法,如下是行不通。不知道是網絡上資料集改位置了還是怎麼的
from sklearn.datasets import fetch_mldata
mnist = fetch_mldata('MNIST original')
具體解決方法:
首先在github上手動下載下傳資料集檔案
https://github.com/amplab/datascience-sp14/raw/master/lab7/mldata/mnist-original.mat
from sklearn.datasets import fetch_mldata
mnist = fetch_mldata('MNIST original',data_home='/home/jie/下載下傳/')
該段代碼中需要注意一下:
1、下載下傳下來的資料集名稱是mnist-original.mat,但是并不是說在fetch_mldata函數中就要通過這個名字獲得資料集,而是依然必須保證是'MNIST original'的名字。
2、‘/home/jie/下載下傳/’是資料集檔案的下載下傳位址,但是并不是填寫上就萬事大吉了,而是還需要在該目錄下建立一個“mldata”的檔案夾,将資料集檔案放入該檔案夾中,然後運作上段代碼,擷取資料集合成功。