最近项目上碰到在windows上压缩了一些图片,图片文件名称都是中文的,scp到linux下用unzip解压后文件名
全是乱码,找了半天解决方案,下面这个亲测可行,特记录一下,与大家分享:
原因:
由于zip在压缩时并没有指定编码格式,Windows下生成的zip文件中的编码是GBK/GB2312等,而Linux下的默认编码是UTF8因此,
导致这些zip文件在Linux下解压时出现中文乱码问题。
解决方案:
使用7z解压。
安装7zip和convmv
# fedora
$ su -c 'yum install 7zip convmv'
# ubuntu
$ sudo apt-get install 7zip convmv
执行一下命令解压缩
# 使用7z解压缩
$ LANG=C 7za x your-zip-file.zip
# 递归转码,从GBK转为UTF-8
$ convmv -f GBK -t utf8 --notest -r .
还有一个更加便捷的方法:
解决的方法是 加上CP936选项,这里的CP936,有些人可能不明白,其实最早的GBK编码,就是IBM定制的MBCS字符集,汉子编码正好在整个字符集中的936页,因此好多地方其实都是用CP936来代表GBK
unzip -O CP936 xxx.zip
更多参考: https://blog.csdn.net/IndexMan/article/details/8018847
https://www.cnblogs.com/louyihang-loves-baiyan/p/4864301.html