天天看點

Pandas之二檢視資料

上文我們聊過了在pandas中的對象建立,其中最常用的對象就是dataframe,今天我們來聊聊怎麼樣其中的資料。

pandas提供了豐富的檢視資料的手段:

  • head:檢視最前面的幾行
  • tail:檢視最後面的幾行
  • index:檢視index
  • columns:檢視列名
  • describe:檢視dataframe的幾個統計量,包括總數、均值、标準差、最小值、最大值、25%分位數、50%分位數和75%分位數
  • T:轉置後的dataframe
  • sort_index:使用index進行排序
  • sort_values:對其中的值進行排序

下面以上文中的建立的兩個dataframe來示範各方法的具體用法

  • df
Pandas之二檢視資料
  • df2
Pandas之二檢視資料

head

使用head檢視資料時,預設展示前5行,同時可以使用參數指定需要展示的行數。

Pandas之二檢視資料

tail

使用tail檢視資料時,預設展示最後5行,同時可以使用參數指定需要展示的行數。

Pandas之二檢視資料

index

index是dataframe的一個屬性,可以直接使用

df.index

進行屬性檢視

Pandas之二檢視資料

columns

同樣,列名columns也是其屬性,可以直接使用

df.columns

檢視

Pandas之二檢視資料

describe

使用decribe方法檢視dataframe的常用統計量,使用該方法會預設忽略非數字類型的列,比如在df2中使用,會忽略B,E,F列

Pandas之二檢視資料

T轉置

在做矩陣計算時,經常會要用到轉置,可以友善地使用T來實作,熟悉資料庫的也可以将其了解為行列轉換。

Pandas之二檢視資料

sort_index

可以使用index對dataframe進行排序,可以使用參數名額排序的index和方式,常用的參數為axis、ascending和inplace

  • axis:指定通過行或列的index進行排序,值為0時使用行index,值為1時使用columns
  • ascending:指定排序的方式,False從大到小排序,True從小到大排序
  • inplace:排序後是否替代原dataframe,True為替換,False不替換,預設為False,使用該參數後方法不傳回值
Pandas之二檢視資料

sort_values

除了使用index進行排序,也可以對具體的值進行排序,常用的參數有by、axis、ascending和inplace

  • by:值排序所用的列名或index名,可以輸入清單。
  • axis:指定通過行或列進行排序,0表示行,1表示列。需要注意的是如果by使用的是列名,axis隻能為0;若by使用的是行index,axis隻能為1。
  • ascending與inplace的含義與sort_index相同。
Pandas之二檢視資料