天天看点

解决windows的zip压缩包在linux下解压后中文乱码问题

最近项目上碰到在windows上压缩了一些图片,图片文件名称都是中文的,scp到linux下用unzip解压后文件名

全是乱码,找了半天解决方案,下面这个亲测可行,特记录一下,与大家分享:

原因:

由于zip在压缩时并没有指定编码格式,Windows下生成的zip文件中的编码是GBK/GB2312等,而Linux下的默认编码是UTF8因此,

导致这些zip文件在Linux下解压时出现中文乱码问题。

解决方案:

使用7z解压。

安装7zip和convmv

# fedora
$ su -c 'yum install 7zip convmv'
# ubuntu
$ sudo apt-get install 7zip convmv
           

执行一下命令解压缩

# 使用7z解压缩
$ LANG=C 7za x your-zip-file.zip
# 递归转码,从GBK转为UTF-8
$ convmv -f GBK -t utf8 --notest -r .
           

还有一个更加便捷的方法:

解决的方法是 加上CP936选项,这里的CP936,有些人可能不明白,其实最早的GBK编码,就是IBM定制的MBCS字符集,汉子编码正好在整个字符集中的936页,因此好多地方其实都是用CP936来代表GBK

unzip -O CP936 xxx.zip
           

更多参考: https://blog.csdn.net/IndexMan/article/details/8018847

https://www.cnblogs.com/louyihang-loves-baiyan/p/4864301.html

继续阅读