# web_mining

**Repository Path**: LINLIYU/web_mining

## Basic Information

- **Project Name**: web_mining
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2020-07-19
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

## 项目名称： 网站运营经理岗位数据收集

## 数据加值主张宣言

本项目挖掘以为网站运营经理关键词，在猎聘网上查找对应行业，并获取信息绘制成excel表格，为人们就业网站运营经理时提供便捷。

* 关键词：网站运营经理

* 手机的数据：学历、经验、薪水、时间、职称、公司地点、公司名称、链结、公司URL、所属行业

* 网站解析方式：Xpath

## Query参数设计

keyword：网站运营经理

industries：行业

curPage：页码

## 思路方法及具体执行

1.  获取行业数据选择器链接
2.  解析url
3.  建构 参数模板
4.  建构字典_industries
5.  获取多页数据 

## 心得总结及感谢

心得总结：通过本次课程，发现web挖掘如果能够找到诀窍会发现其实爬虫的过程很有趣，特别是把数据成功获得后。以及感谢猎聘网提供的平台让我来爬取数据。