# web_mining **Repository Path**: LINLIYU/web_mining ## Basic Information - **Project Name**: web_mining - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-07-19 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 项目名称: 网站运营经理岗位数据收集 ## 数据加值主张宣言 本项目挖掘以为网站运营经理关键词,在猎聘网上查找对应行业,并获取信息绘制成excel表格,为人们就业网站运营经理时提供便捷。 * 关键词:网站运营经理 * 手机的数据:学历、经验、薪水、时间、职称、公司地点、公司名称、链结、公司URL、所属行业 * 网站解析方式:Xpath ## Query参数设计 keyword:网站运营经理 industries:行业 curPage:页码 ## 思路方法及具体执行 1. 获取行业数据选择器链接 2. 解析url 3. 建构 参数模板 4. 建构字典_industries 5. 获取多页数据 ## 心得总结及感谢 心得总结:通过本次课程,发现web挖掘如果能够找到诀窍会发现其实爬虫的过程很有趣,特别是把数据成功获得后。以及感谢猎聘网提供的平台让我来爬取数据。