练习10-删除数据
探索Iris纸鸢花数据
目录
步骤1 导入必要的库
步骤2 数据集地址
步骤3 将数据集存成变量iris
步骤4 创建数据框的列名称
步骤5 数据框中有缺失值吗?
步骤6 将列petal_length的第10到19行设置为缺失值
步骤7 将缺失值全部替换为1.0
步骤8 删除列class
步骤9 将数据框前三行设置为缺失值
步骤10 删除有缺失值的行
步骤11 重新设置索引
代码截图
步骤1 导入必要的库
运行以下代码
#导入必要的库
import pandas as pd
import numpy as np
步骤2 数据集地址
运行以下代码
#从目标地址导入数据集
path10 ='D:/hailong/hailong_download/pandas_exercise/exercise_data/iris.csv' # iris.csv
步骤3 将数据集存成变量iris
运行以下代码
#将数据集存成变量iris
iris = pd.read_csv(path10)
iris.head()
输出结果:
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicmbw5SMwImMkVDMwgDM5IGNhBzNwMGZmZDO5cTYxEjMjFzN18CX0JXZ252bj91Ztl2Lc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
步骤4 创建数据框的列名称
运行以下代码
#创建数据框的列名称
iris = pd.read_csv(path10,names = ['sepal_length','sepal_width','petal_length','petal_width','class'])
iris.head()
输出结果:
步骤5 数据框中有缺失值吗?
运行以下代码
#数据框中有缺失值吗?
pd.isnull(iris).sum()
输出结果:
步骤6 将列petal_length的第10到19行设置为缺失值
运行以下代码
#将列petal_length的第10到19行设置为缺失值
iris.iloc[10:20,2:3] = np.nan
iris.head(20)
输出结果:
步骤7 将缺失值全部替换为1.0
运行以下代码
#将缺失值全部替换为1.0
iris.petal_length.fillna(1,inplace = True)
iris
输出结果:
步骤8 删除列class
运行以下代码
#删除列class
del iris['class']
iris.head()
输出结果:
步骤9 将数据框前三行设置为缺失值
运行以下代码
#将数据框前三行设置为缺失值
iris.iloc[0:3,:] = np.nan
iris.head()
输出结果:
步骤10 删除有缺失值的行
运行以下代码
#删除有缺失值的行
iris = iris.dropna(how = 'any')
iris.head()
输出结果:
步骤11 重新设置索引
运行以下代码
#重新设置索引
iris = iris.reset_index(drop = True)
iris.head()
输出结果: