我们工作常常要在 Python 中导出 CSV 文件,这些输出的 CSV文件,有些时候遇到特殊字符什么的就会变成乱码,如何处理呢?我们可以试试Pandas,Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能,而DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典,上一个简单的代码:
import pandas as pdlist = [ { 'name': '张三', 'age': 29, 'address': '北京~~)))**' }, { 'name': '李四', 'age': 18, 'address': '上海!#[email protected]#[email protected]#' }, { 'name': '王五', 'age': 60, 'address': '深圳*%##%@[email protected]#[email protected]' }]df = pd.DataFrame(list)df.to_csv('test.csv', index=False, encoding='utf-8-sig')
查看结果:
读取操作:
with open('test.csv',encoding='utf-8-sig') as f: reader=csv.DictReader(f) for row in reader: print(row)
输出如下:
{'name': '张三', 'age': '29', 'address': '北京~~)))**'}{'name': '李四❤', 'age': '18', 'address': '上海!#[email protected]#[email protected]#'}{'name': '王五', 'age': '60', 'address': '深圳*%##%@[email protected]#[email protected]'}
码字不易,喜欢就点个?~