練習10-删除資料
探索Iris紙鸢花資料
目錄
步驟1 導入必要的庫
步驟2 資料集位址
步驟3 将資料集存成變量iris
步驟4 建立資料框的列名稱
步驟5 資料框中有缺失值嗎?
步驟6 将列petal_length的第10到19行設定為缺失值
步驟7 将缺失值全部替換為1.0
步驟8 删除列class
步驟9 将資料框前三行設定為缺失值
步驟10 删除有缺失值的行
步驟11 重新設定索引
代碼截圖
步驟1 導入必要的庫
運作以下代碼
#導入必要的庫
import pandas as pd
import numpy as np
步驟2 資料集位址
運作以下代碼
#從目标位址導入資料集
path10 ='D:/hailong/hailong_download/pandas_exercise/exercise_data/iris.csv' # iris.csv
步驟3 将資料集存成變量iris
運作以下代碼
#将資料集存成變量iris
iris = pd.read_csv(path10)
iris.head()
輸出結果:
步驟4 建立資料框的列名稱
運作以下代碼
#建立資料框的列名稱
iris = pd.read_csv(path10,names = ['sepal_length','sepal_width','petal_length','petal_width','class'])
iris.head()
輸出結果:
步驟5 資料框中有缺失值嗎?
運作以下代碼
#資料框中有缺失值嗎?
pd.isnull(iris).sum()
輸出結果:
步驟6 将列petal_length的第10到19行設定為缺失值
運作以下代碼
#将列petal_length的第10到19行設定為缺失值
iris.iloc[10:20,2:3] = np.nan
iris.head(20)
輸出結果:
步驟7 将缺失值全部替換為1.0
運作以下代碼
#将缺失值全部替換為1.0
iris.petal_length.fillna(1,inplace = True)
iris
輸出結果:
步驟8 删除列class
運作以下代碼
#删除列class
del iris['class']
iris.head()
輸出結果:
步驟9 将資料框前三行設定為缺失值
運作以下代碼
#将資料框前三行設定為缺失值
iris.iloc[0:3,:] = np.nan
iris.head()
輸出結果:
步驟10 删除有缺失值的行
運作以下代碼
#删除有缺失值的行
iris = iris.dropna(how = 'any')
iris.head()
輸出結果:
步驟11 重新設定索引
運作以下代碼
#重新設定索引
iris = iris.reset_index(drop = True)
iris.head()
輸出結果: