作者 | 黃偉呢
來源 | 資料分析與統計學之美
我覺得很有必要講述這個文章,進行資料處理的第一步就是Python資料讀取。但是你可能沒想到,在進行資料讀取的同時,我們其實可以配合相關參數做很多事兒,這對于後續的資料處理都是極其有幫助。
read_excel函數和read_csv函數,在參數上面有很多相同點,是以我就以read_excel函數為例,進行詳細的說明。
1)sheet_name參數
- 含義:選擇要讀取的sheet表;
- sheet_name=0表示預設讀取第一個sheet表,等同于sheet_name=“sheet名稱”;
- sheet_name=[“sheet名”,0]會傳回一個字典,然後可以利用鍵擷取每一個sheet表中的資料;
- sheet_name=None也會傳回一個字典,但是會傳回全部的sheet表;
① sheet_name=0和sheet_name="Sheet1"
# 下面這兩個讀取方式等同。
#df2 = pd.read_excel("readexcel.xlsx