天天看点

Pandas数据分析练习10练习10-删除数据

练习10-删除数据

探索Iris纸鸢花数据

目录

步骤1 导入必要的库

步骤2 数据集地址

步骤3 将数据集存成变量iris

步骤4 创建数据框的列名称

步骤5 数据框中有缺失值吗?

步骤6 将列petal_length的第10到19行设置为缺失值

步骤7 将缺失值全部替换为1.0

步骤8 删除列class

步骤9 将数据框前三行设置为缺失值

步骤10 删除有缺失值的行

步骤11 重新设置索引

代码截图

步骤1 导入必要的库

运行以下代码

#导入必要的库
import pandas as pd
import numpy as np
           

步骤2 数据集地址

运行以下代码

#从目标地址导入数据集
path10 ='D:/hailong/hailong_download/pandas_exercise/exercise_data/iris.csv'   # iris.csv
           

步骤3 将数据集存成变量iris

运行以下代码

#将数据集存成变量iris
iris = pd.read_csv(path10)
iris.head()
           

输出结果:

Pandas数据分析练习10练习10-删除数据

步骤4 创建数据框的列名称

运行以下代码

#创建数据框的列名称
iris = pd.read_csv(path10,names = ['sepal_length','sepal_width','petal_length','petal_width','class'])
iris.head()
           

输出结果:

Pandas数据分析练习10练习10-删除数据

步骤5 数据框中有缺失值吗?

运行以下代码

#数据框中有缺失值吗?
pd.isnull(iris).sum()
           

输出结果:

Pandas数据分析练习10练习10-删除数据

步骤6 将列petal_length的第10到19行设置为缺失值

运行以下代码

#将列petal_length的第10到19行设置为缺失值
iris.iloc[10:20,2:3] = np.nan
iris.head(20)
           

输出结果:

Pandas数据分析练习10练习10-删除数据

步骤7 将缺失值全部替换为1.0

运行以下代码

#将缺失值全部替换为1.0
iris.petal_length.fillna(1,inplace = True)
iris
           

输出结果:

Pandas数据分析练习10练习10-删除数据
Pandas数据分析练习10练习10-删除数据

步骤8 删除列class

运行以下代码

#删除列class
del iris['class']
iris.head()
           

输出结果:

Pandas数据分析练习10练习10-删除数据

步骤9 将数据框前三行设置为缺失值

运行以下代码

#将数据框前三行设置为缺失值
iris.iloc[0:3,:] = np.nan
iris.head()
           

输出结果:

Pandas数据分析练习10练习10-删除数据

步骤10 删除有缺失值的行

运行以下代码

#删除有缺失值的行
iris = iris.dropna(how = 'any')
iris.head()
           

输出结果:

Pandas数据分析练习10练习10-删除数据

步骤11 重新设置索引

运行以下代码

#重新设置索引
iris = iris.reset_index(drop = True)
iris.head()
           

输出结果:

Pandas数据分析练习10练习10-删除数据

代码截图

Pandas数据分析练习10练习10-删除数据
Pandas数据分析练习10练习10-删除数据
Pandas数据分析练习10练习10-删除数据
Pandas数据分析练习10练习10-删除数据
Pandas数据分析练习10练习10-删除数据
Pandas数据分析练习10练习10-删除数据