python读取csv文件并添加索引
文章目录
- python读取csv文件并添加索引
- 前言
- 实现过程
- 总结
前言
对于csv文件进行处理一个重要的步骤是为数据添加索引,方便后续的数据操作
实现过程
这里我们使用pandas库中的read_csv()函数,在读取csv数据的同时可以对其添加行索引和列索引。
import pandas as pd
obj=pd.read_csv('testdata.csv')
print(obj)
read_csv()不对属性进行设置的缺省状态下,对于csv文件进行读取操作后,即使原来的数据存在索引,也会自动添加数字的行索引和列索引。
当设置 header=None 时,则认为csv文件没有列索引,为其添加相应范围的索引,range(1,1200)指建立索引号从1开始最大到1199的列索引,当数据长度超过范围时,索引沿列数据的右侧对齐。
当设置 header=0 时,则认为csv文件数据第一行是列索引,将用新的列索引替换旧的列索引。
当设置 index_col=0 时,则是csv文件数据的指定数据中的第一列是行索引,usecols指选中数据的对应列数,[1,2,3]指第2列到第4列。
用usecols选择前n行数据进行后续处理,n为正整型。
这样我们就完成了对csv文件添加索引的功能。
总结
csv文件的格式一致性会为后续的处理提供很大的方便。完成数据预处理后就可以进行分析了。