天天看点

csv文件乱码

问题描述:

生成的csv文件,设置为UTF-8格式,在windows上用EXCEL打开的话会乱码,在linux上用vim或者cat打开查看正常;设置为GBK格式的话,在windows上用EXCEL打开正常,但在linux上乱码

解决方法:

在csv文件头部的最前面加bom

BOM(Byte Order Mark),是 UTF编码方案里用于标识编码的标准标记,在 UTF-16里本来是 FF FE,变成 UTF-8就成了 EF BB BF。这个标记是可选的,因为 UTF8字节没有顺序,所以它可以被用来检测一个字节流是否是 UTF-8编码的。微软做这种检测,但有些软件不做这种检测,而把它当作正常字符处理。

代码如下:

File file = new File(ospFileName);

OutputStream stream = new FileOutputStream(file);

stream.write(newbyte[] { (byte) 0xEF, (byte) 0xBB, (byte) 0xBF });

CsvWriter ospWriter = new CsvWriter(stream, ',', Charset.forName("UTF-8"));

String[] ospHead = new String[]{"No","Comment","server","method","param-exp","response","trace-id"};

ospWriter.writeRecord(ospHead);

这样的话,在windows上用EXCEL打开就不会是乱码,linux上也显示正常;

虽千万人,吾往矣!