天天看點

DC學院爬蟲學習筆記(五):使用pandas儲存豆瓣短評資料儲存資料的方法:使用pandas儲存資料實戰

open函數儲存

pandas包儲存(本節課重點講授)

csv子產品儲存

numpy包儲存

使用with open()建立對象

寫入資料

可以使用以下方法得到目前工作目錄或者修改目前工作目錄

DC學院爬蟲學習筆記(五):使用pandas儲存豆瓣短評資料儲存資料的方法:使用pandas儲存資料實戰

numpy: (Numerical Python的簡稱),是高性能科學計算和資料分析的基礎包

pandas:基于Numpy建立的Python包,含有使資料分析工作變得更加簡單的進階資料結構和操作工具

matplotlib:是一個用于建立出版品質圖表的繪圖包(主要是2D方面)

常見的導入方法:

導入相關的庫

将爬取到的資料儲存為DataFrame對象(DataFrame 是一個表格或者類似二維數組的結構,它的各行表示一個執行個體,各清單示一個變量)

to_excel() 執行個體方法:用于将DataFrame儲存到Excel

read_excel() 方法:從excel檔案中讀取資料

将資料儲存為DataFrame對象

儲存資料到csv檔案

爬取《小王子》豆瓣短評的資料,并把資料儲存為本地的excel表格

爬取《小王子》豆瓣短評前5頁的短評資料