解决windows的zip压缩包在linux下解压后中文乱码问题

2023-03-24 16:20:56

最近项目上碰到在windows上压缩了一些图片，图片文件名称都是中文的，scp到linux下用unzip解压后文件名

全是乱码，找了半天解决方案，下面这个亲测可行，特记录一下，与大家分享：

原因：

由于zip在压缩时并没有指定编码格式，Windows下生成的zip文件中的编码是GBK/GB2312等，而Linux下的默认编码是UTF8因此，

导致这些zip文件在Linux下解压时出现中文乱码问题。

解决方案：

使用7z解压。

安装7zip和convmv

# fedora
$ su -c 'yum install 7zip convmv'
# ubuntu
$ sudo apt-get install 7zip convmv

执行一下命令解压缩

# 使用7z解压缩
$ LANG=C 7za x your-zip-file.zip
# 递归转码，从GBK转为UTF-8
$ convmv -f GBK -t utf8 --notest -r .

还有一个更加便捷的方法：

解决的方法是加上CP936选项，这里的CP936,有些人可能不明白，其实最早的GBK编码，就是IBM定制的MBCS字符集，汉子编码正好在整个字符集中的936页，因此好多地方其实都是用CP936来代表GBK

unzip -O CP936 xxx.zip

更多参考： https://blog.csdn.net/IndexMan/article/details/8018847

https://www.cnblogs.com/louyihang-loves-baiyan/p/4864301.html

继续阅读