解决python3中解压zip文件是文件名乱码的问题

脚本专栏 2024/11/15 佚名

3 1 2

在zip标准中，对文件名的 encoding 用的不是 unicode，而可能是各种软件根据系统的默认字符集来采用（此为猜测），因此zipfile中根据文件 flag 检测的时候，只支持 cp437 和 utf-8。

具体就是查找 zipfile.py 源代码找到下面的代码：

1: if flags & 0x800:
2: # UTF-8 file names extension
3: filename = filename.decode('utf-8')
4: else:
5: # Historical ZIP filename encoding
6: filename = filename.decode('cp437')

可见编码被正确识别为utf8时的情况外，都会被识别并decode为cp437编码，但如果实际是gbk等其他编码时就变为乱码了。所以解决的方法在于被decode为cp437后重新再手动转为正确的编码。

具体代码如下：

#修改代码
if flags & 0x800:
 # UTF-8 file names extension
 filename = filename.decode('utf-8')
else:
 # Historical ZIP filename encoding
 filename = filename.decode('cp437')
 #修改
 filename = filename.encode("cp437").decode('gbk')

后面一处同样如此修改

if zinfo.flag_bits & 0x800:
 # UTF-8 filename
 fname_str = fname.decode("utf-8")
else:
 fname_str = fname.decode("cp437")
 #修改
 fname_str = fname_str.encode("cp437").decode('gbk')

亲测有效！

以上这篇解决python3中解压zip文件是文件名乱码的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

python3,解压zip,乱码

华山资源网 Design By www.eoogi.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

华山资源网 Design By www.eoogi.com

评论“解决python3中解压zip文件是文件名乱码的问题”

暂无评论...

www.eoogi.com 华山资源网

120,135影音资源

344,641技术资源

22,817软件资源

435,032站长资源

更新日志

2024年11月15日

解决python3中解压zip文件是文件名乱码的问题

python爬取各类文档方法归类汇总

关于Python正则表达式 findall函数问题详解

评论“解决python3中解压zip文件是文件名乱码的问题”

更新日志

友情链接