# 压缩包中乱码文件名修复 **Repository Path**: zh_mingyang/mojibakefix ## Basic Information - **Project Name**: 压缩包中乱码文件名修复 - **Description**: 修复由于某些原因(CP437解码了GBK编码过的文件名)导致压缩包中文件名乱码(制表符等)的问题 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-03-28 - **Last Updated**: 2025-03-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 压缩包中乱码文件名修复 #### 介绍 修复由于某些原因(CP437解码了GBK编码过的文件名)导致压缩包中文件名乱码(制表符等)的问题 通常是由于使用不同区域语言的电脑系统或者在该系统下使用特殊的压缩解压工具导致解压后的文件名为乱码(制表符等),再次压缩后乱码遗留问题,本脚本可以修复该问题。 #### 实现原理 经过测试,发现文件名乱码的原因是由于解压缩时使用了CP437解码了GBK编码的文件,从而导致乱码产生,因此可以通过修改文件名的编码方式来解决该问题。对乱码文件名文件进行CP437编码转换,然后再进行GBK解码,即可解决该问题。 文件中包含3中方式: 1. 直接调用fix_encoding将乱码字符串恢复成正常字符串 2. 调用zip_fix_encoding对指定的zip文件或者指定文件夹中包含的所有zip文件中的文件名进行修复 3. 调用folder_fix_encoding对指定的文件夹中包含的所有文件名进行修复 #### 安装教程 ***注意:需要安装不高于python3.9版本*** ```sh pip install -r requirements.txt ``` #### 使用说明 1. 可以通过设置intermediate_encoding来修改编码方式,默认为CP437 2. 可以通过设置original_encoding来修改解码方式,默认为gb18030 3. 可以通过设置original_encoding_autodetect=True来实现自动检测解码方式,默认为False #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)