天天看點

Pandas資料分析練習10練習10-删除資料

練習10-删除資料

探索Iris紙鸢花資料

目錄

步驟1 導入必要的庫

步驟2 資料集位址

步驟3 将資料集存成變量iris

步驟4 建立資料框的列名稱

步驟5 資料框中有缺失值嗎?

步驟6 将列petal_length的第10到19行設定為缺失值

步驟7 将缺失值全部替換為1.0

步驟8 删除列class

步驟9 将資料框前三行設定為缺失值

步驟10 删除有缺失值的行

步驟11 重新設定索引

代碼截圖

步驟1 導入必要的庫

運作以下代碼

#導入必要的庫
import pandas as pd
import numpy as np
           

步驟2 資料集位址

運作以下代碼

#從目标位址導入資料集
path10 ='D:/hailong/hailong_download/pandas_exercise/exercise_data/iris.csv'   # iris.csv
           

步驟3 将資料集存成變量iris

運作以下代碼

#将資料集存成變量iris
iris = pd.read_csv(path10)
iris.head()
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

步驟4 建立資料框的列名稱

運作以下代碼

#建立資料框的列名稱
iris = pd.read_csv(path10,names = ['sepal_length','sepal_width','petal_length','petal_width','class'])
iris.head()
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

步驟5 資料框中有缺失值嗎?

運作以下代碼

#資料框中有缺失值嗎?
pd.isnull(iris).sum()
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

步驟6 将列petal_length的第10到19行設定為缺失值

運作以下代碼

#将列petal_length的第10到19行設定為缺失值
iris.iloc[10:20,2:3] = np.nan
iris.head(20)
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

步驟7 将缺失值全部替換為1.0

運作以下代碼

#将缺失值全部替換為1.0
iris.petal_length.fillna(1,inplace = True)
iris
           

輸出結果:

Pandas資料分析練習10練習10-删除資料
Pandas資料分析練習10練習10-删除資料

步驟8 删除列class

運作以下代碼

#删除列class
del iris['class']
iris.head()
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

步驟9 将資料框前三行設定為缺失值

運作以下代碼

#将資料框前三行設定為缺失值
iris.iloc[0:3,:] = np.nan
iris.head()
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

步驟10 删除有缺失值的行

運作以下代碼

#删除有缺失值的行
iris = iris.dropna(how = 'any')
iris.head()
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

步驟11 重新設定索引

運作以下代碼

#重新設定索引
iris = iris.reset_index(drop = True)
iris.head()
           

輸出結果:

Pandas資料分析練習10練習10-删除資料

代碼截圖

Pandas資料分析練習10練習10-删除資料
Pandas資料分析練習10練習10-删除資料
Pandas資料分析練習10練習10-删除資料
Pandas資料分析練習10練習10-删除資料
Pandas資料分析練習10練習10-删除資料
Pandas資料分析練習10練習10-删除資料