# WeChat_Article **Repository Path**: gty169/WeChat_Article ## Basic Information - **Project Name**: WeChat_Article - **Description**: 爬取微信公众号文章 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 94 - **Created**: 2026-04-01 - **Last Updated**: 2026-04-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # WeChat_Article 微信公众号文章爬取工具 > Bilibili 视频演示:https://www.bilibili.com/video/BV1vN411D7Y3/ ![界面预览](https://user-images.githubusercontent.com/31002981/217465357-d0737b23-55ec-47d3-b12c-ee8973a04291.png) ## 简介 本项目用于爬取微信公众号文章。通过微信公众号平台搜索其他公众号文章的方式,实现爬取指定公众号所有文章的功能。 ## 功能特性 - 📝 下载文章文字内容到 TXT - 🖼️ 下载文章图片 - 🌐 保存 HTML 文件,并将图片链接指向本地 - 📅 按时间范围筛选下载 - 🔍 按关键词搜索下载 - ⏩ 断点续传功能 - 📥 下载 PDF 格式 - 🔐 支持 Cookie 登录和浏览器自动登录 - ⚡ 多线程优化下载速度 ## 环境要求 - Python 3.9 - Chrome 浏览器 ## 安装步骤 ### 1. 创建虚拟环境 ```bash conda create -n wechat python=3.9 -y ``` ### 2. 激活虚拟环境 ```bash conda activate wechat ``` ### 3. 安装依赖库 ```bash pip install -r requirements.txt ``` > **macOS 用户注意**:安装 PyQt5 可能会报错,可以尝试: > ```bash > brew install pyqt@5 > cp -r /opt/homebrew/Cellar/pyqt@5/5.15.7_2/lib/python3.9/site-packages/* /Users/songxf/miniconda3/envs/wechat/lib/python3.9/site-packages/ > ``` ### 4. 运行程序 ```bash python main.py ``` ## 使用方法 1. 下载 [Chrome.rar](https://sxf1024.lanzouo.com/iJ2Rp0mwy50j) 并解压为 **Chrome** 2. 点击页面右上角绿色 "**Code**" 按钮,再点 "**Download Zip**" 按钮,解压为 **default** 3. 将解压的 **Chrome** 放到解压的 **default** 里 4. 进入 **default** 目录,运行 **main.exe** 或 **main.py** 5. 填入信息,点击 "**启动**" 即可 > **注意**:除非要断点续传,否则删除目录下 `conf.ini` 和 `url.json` 再启动!!! ## 程序原理 通过 Selenium 登录获取 token 和 cookie,再自动爬取和下载文章。 **使用前提**: - 申请一个免费的微信公众号,个人订阅号即可:https://mp.weixin.qq.com ## 打包为 EXE ```bash pyinstaller -F -w -i icon.ico main.py ``` 生成的 EXE 文件在 `dist` 目录下。 ## 注意事项 - 爬取间隔太快,容易遇到 "**访问频繁**" 或 "**freq_control**",这时候可以删除 **cookie.json**,再重新运行软件,换个微信号继续运行 ## 更新记录 | 版本 | 更新内容 | |------|----------| | 1 | 下载文章文字内容到 TXT | | 2 | 下载文章图片 | | 3 | 保存 HTML 文件,并将图片链接指向本地 | | 4 | 添加按时间范围下载 | | 5 | 添加 Cookie 登陆,不成功才 Selenium 浏览器登陆 | | 6 | 增加记住密码功能 | | 7 | 修复一些问题,如 requests 卡死 | | 8 | 添加按关键词下载 | | 9 | 多线程优化下载速度 | | 10 | 增加断点续传功能 | | 11 | 拟增加备用公众号功能(暂未完成) | | 12 | 下载 PDF 格式 | | 13 | 不需要再手动下载 Chrome,启动时会自动下载 | ## 相关项目 - [web 版](https://github.com/wechat-article/wechat-article-exporter) - [QT6 版](https://github.com/wooodypan/WeChat_Article) ## 赞助 感谢[IPWO爬虫专用住宅代理](https://www.ipwo.net/?ref=gittejinghong)对本项目提供支持 ## 打赏 如果这个项目帮助到了你,欢迎请我喝杯阔落 👏🏻 ![打赏二维码](yf.png) ## 欢迎关注 微信公众号:xfxuezhang --- [![Star History](https://api.star-history.com/svg?repos=1061700625/WeChat_Article&type=Date)](https://star-history.com/#1061700625/WeChat_Article&Date)