# small-exercise-projects **Repository Path**: zyb666zyb/small-exercise-projects ## Basic Information - **Project Name**: small-exercise-projects - **Description**: 网络爬虫项目,非常适合爬虫入门和新手练习的项目,收集了多个不同场景下的爬虫示例,包括电影信息抓取、图片爬取等。 - **Primary Language**: Python - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-02-28 - **Last Updated**: 2025-05-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # small-exercise-projects 一些小的python练习项目 ## 介绍 这是我总结的一些Python练习项目!这个仓库包含了一系列的小项目,帮助我练习和提高Python编程技能。每个项目都设计成可以独立运行。 (Here are some Python practice projects that I've compiled! This repository contains a series of small projects that helped me practice and improve my Python programming skills. Each project is designed to be run independently.) ### 持续更新说明 这个仓库会不断更新,我会持续添加新的Python练习项目,优化现有项目的代码,修复可能存在的问题,以不断提升项目的质量和功能。同时,也会根据实际情况调整项目的结构和文档说明,以提供更好的使用体验。如果你对这个仓库感兴趣,不妨持续关注,期待更多精彩内容! ### 项目列表 - **[12306购票](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/12306%E8%87%AA%E5%8A%A8%E8%B4%AD%E7%A5%A8)**:这个12306购票程序只能够进行简单的购票,并不能进行抢票 - **[批量解压](https://gitee.com/zyb666zyb/small-exercise-projects/blob/main/batch_zip_extractor.py)**:可以批量解压大量压缩文件,可以自己指定解压路径 - **[jpg转icon](https://gitee.com/zyb666zyb/small-exercise-projects/blob/main/jpg_icon.py)**:将jpg,png图片转换为icon的图标 - **[邮件发送](https://gitee.com/zyb666zyb/small-exercise-projects/blob/main/sendEmail.py)**:向指定联系人发送邮件 - **[王者官网](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/wangzheImage)**:获取王者官网的所有英雄图片和皮肤图片 - **[腾讯招聘网](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/TxWork)**:获取腾讯招聘官网的招聘信息并存入CSV文件 - **[蜻蜓FM网](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/qingtingFM)**:获取蜻蜓FM网排行榜信息并存入CSV文件 - **[芒果TV](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/mangguoTV)**:获取芒果TV电影名称,地址,演员列表并存入CSV文件 - **[豆瓣](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/douban)**:获取豆瓣网电影排行榜top250信息并存入CSV文件 - **[b站视频](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/b站视频url)**:获取b站视频的url - **[百度图片](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/baiduImage)**:获取百度二次元大全图片(不一定要二次元)并下载到指定地方 - **[爱奇艺](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/aiqiyiMovie)**:获取爱奇艺电影排行榜的名称,评分,封面图片及其url,电影url并存入CSV文件,同时下载封面到指定位置 - **[33搜帧](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/33搜帧)**:通过JS扣代码,获取33搜帧加密参数sign - **[36kr](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/36kr)**:通过JS逆向,获取36kr的pageCallback加密参数,并获取新闻 - **[etihad.com](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/etihad.com)**:使用补环境获取加密参数 - **[ouyeel.com](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/ouyeel.com)**:使用补环境获取加密参数并获取数据 - **[七麦数据](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/七麦数据)**:通过JS扣代码,获取加密参数来爬取七麦中的相关数据 - **[企查查](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/企查查)**:通过JS扣代码技术,获取加密参数并爬取商业快讯的数据信息 - **[全国建筑市场监管服务平台](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/全国建筑市场监管服务平台)**:使用JS扣代码获取平台发布的信息 - **[宝武资源(qiye.obei.com.cn)](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/宝武资源(qiye.obei.com.cn))**:爬取宝武资源数据信息 - **[广东省公共资源交易平台](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/广东省公共资源交易平台)**:爬取广东省公告资源交易平台的公告新闻信息 - **[微博](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/微博)**:获取微博评论 - **[拼多多跨境卖家中心登录](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/拼多多跨境卖家中心登录)**:JS逆向获取加密后的登录信息 - **[携程酒店](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/携程酒店)**:根据自己填写的日期来获取所有酒店信息 - **[新浪财经](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/新浪财经)**:批量获取新闻内容,发布时间 - **[易久批](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/易久批)**:通过补环境生成X-Sign,X-Sign-Nonce,X-Sign-Timestamp三个加密参数 - **[百度贴吧](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/百度贴吧)**:通过关键字获取相关文章 - **[简约壁纸](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/简约壁纸)**:批量下载壁纸并把壁纸转换为3840x2160大小 - **[维普期刊官网](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/维普期刊官网)**:瑞树相关的逆向,通过补环境获取加密参数并爬取期刊的信息 - **[苏宁登录](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/苏宁登录)**:通过JS逆向获取加密后的登录信息 - **[图形化界面关键词搜索框架](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/图形化界面关键词搜索框架)**:可以与其他爬虫代码融合,制作一个在GUI界面通过关键词批量获取数据 - **[搜狐证券](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/搜狐证券.py)**:批量获取config配置文件(可以自己创建或者去掉这部分)里股票的信息(开盘价,收盘价,最高价,最低价等信息) - **[搜狐证券分时数据](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/搜狐证券分时数据.py)**:批量获取指定股票近几年每天的分时数据 - **[新浪财经股票数据](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/新浪财经股票数据.py)**:和上面的搜狐证券一样,用来获取股票的信息 - **[百度股市通每日行情](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/百度股市通每日行情.py)**:可以在收盘后获取指定股票的今日行情信息,只需要修改ab_sr参数(在开发者模式中调试获取)即可 - **[同花顺新闻](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/同花顺.py)**:批量爬取同花顺快讯的新闻 - **[财联社新闻](https://gitee.com/zyb666zyb/small-exercise-projects/tree/main/财联社.py)**:批量获取财联社电报页面的新闻 **克隆仓库**:如果需要,使用Git克隆这个仓库到你的本地计算机。 ```bash git clone https://gitee.com/zyb666zyb/small-exercise-projects.git ``` ### 免责声明(!!!) 本仓库中的爬虫代码仅用于学习和技术研究目的,旨在探索网页数据抓取的相关技术和方法。 请勿将本代码用于任何非法、未经授权或违反网站使用条款的活动。使用本代码所产生的任何法律责任和后果,均由使用者自行承担,与代码作者无关。 作者不保证代码的准确性、完整性和适用性,对于因使用本代码而导致的任何损失,作者不承担任何责任。 ### 问题反馈说明 若在使用本爬虫代码过程中遇到无法正常运行的情况,例如无法获取数据、出现报错信息等,请您通过创建 Issue 进行反馈。