上文我們聊過了在pandas中的對象建立,其中最常用的對象就是dataframe,今天我們來聊聊怎麼樣其中的資料。
pandas提供了豐富的檢視資料的手段:
- head:檢視最前面的幾行
- tail:檢視最後面的幾行
- index:檢視index
- columns:檢視列名
- describe:檢視dataframe的幾個統計量,包括總數、均值、标準差、最小值、最大值、25%分位數、50%分位數和75%分位數
- T:轉置後的dataframe
- sort_index:使用index進行排序
- sort_values:對其中的值進行排序
下面以上文中的建立的兩個dataframe來示範各方法的具體用法
- df
- df2
head
使用head檢視資料時,預設展示前5行,同時可以使用參數指定需要展示的行數。
tail
使用tail檢視資料時,預設展示最後5行,同時可以使用參數指定需要展示的行數。
index
index是dataframe的一個屬性,可以直接使用
df.index
進行屬性檢視
columns
同樣,列名columns也是其屬性,可以直接使用
df.columns
檢視
describe
使用decribe方法檢視dataframe的常用統計量,使用該方法會預設忽略非數字類型的列,比如在df2中使用,會忽略B,E,F列
T轉置
在做矩陣計算時,經常會要用到轉置,可以友善地使用T來實作,熟悉資料庫的也可以将其了解為行列轉換。
sort_index
可以使用index對dataframe進行排序,可以使用參數名額排序的index和方式,常用的參數為axis、ascending和inplace
- axis:指定通過行或列的index進行排序,值為0時使用行index,值為1時使用columns
- ascending:指定排序的方式,False從大到小排序,True從小到大排序
- inplace:排序後是否替代原dataframe,True為替換,False不替換,預設為False,使用該參數後方法不傳回值
sort_values
除了使用index進行排序,也可以對具體的值進行排序,常用的參數有by、axis、ascending和inplace
- by:值排序所用的列名或index名,可以輸入清單。
- axis:指定通過行或列進行排序,0表示行,1表示列。需要注意的是如果by使用的是列名,axis隻能為0;若by使用的是行index,axis隻能為1。
- ascending與inplace的含義與sort_index相同。