# 数据库-数据分析职业需求分析报告 **Repository Path**: adam-lu/DB1 ## Basic Information - **Project Name**: 数据库-数据分析职业需求分析报告 - **Description**: 某线下培训机构预开展数据分析方向课程,需对数据分析岗位的市场需求、就业情况和岗位技能做深入调研 现爬虫组已采集了与数据分析相关的招聘信息,由数据分析组完成分析报告,为企业战略规划提供有力依据。 - **Primary Language**: SQL - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 1 - **Created**: 2021-04-12 - **Last Updated**: 2023-04-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 数据库-数据分析职业需求分析 ### 介绍 某线下培训机构预开展数据分析方向课程,需对数据分析岗位的市场需求、就业情况和岗位技能做 深入调研 现爬虫组已采集了与数据分析相关的招聘信息,由数据分析组完成分析报告,为企业战略规划提供 有力依据。 数据分析岗位的各项结果指标应与已有学科进行相对比,例如对比数据分析、游戏、运维三个行业的招聘需求量、薪资分布等 #### 限定就业地区 由于此培训机构学员入口和出口绝大多数来自一线城市,本次也仅针对北京、上海、广州、深圳这 四个一线城市的数据进行分析 #### 数据来源 此次招聘数据来源于来自51job,采集日期:2020-09-15 ### 使用工具 Excel2016、Mysql8.0、Navicat、Premium15 ### 涉及业务数据及字典 数据库:data_analysis_recruitment 涉及表:data,game,operator,skill_table 数据源:data.csv,game.csv,operator.csv,skill_table.csv ### 问题确认与目标拆解 ![image-20210412162901544](C:\Users\Jack\AppData\Roaming\Typora\typora-user-images\image-20210412162901544.png) ### 问题解决思路 #### 清洗数据 1. 缺失数据处理(例如:某行数据没有工作名称) 2. 重复数据处理(例如:同一个公司发布多个相同岗位) 3. 限定招聘地区 4. 过滤周边岗位 #### 市场需求量 1. 按城市与岗位进行分组 2. 统计岗位招聘量 #### 就业企业类型分布 1. 对企业类型进行分组 2. 统计每个企业类型的招聘数量与在总招聘量中的占比 #### 岗位薪资 1. 薪资字段规范化(1-2万/月->薪资最小值:10000,薪资最大值:20000,薪资平均值: 15000) 2. 按工作年限进行分组,计算每组的薪资均值(即:avg(薪资平均值)) 3. 按企业类型进行分组,计算每组的薪资均值 #### 岗位核心技能 1. 建立待评估的岗位技能表 2. 计算各个待评估技能在招聘需求中出现的次数 3. 得到出现次数最高的前30个技能,记为岗位的核心技能 ### 分析过程及结果 见文件夹《分析过程及结果》