数据分析岗位研究报告目录
收集数据:八爪鱼抓取
数据清洗:Python;Excle
数据整理:Excle
可视化:Excle图表
壹 / 哪些公司在招聘?
1、公司名称
在4000多条信息中,共有1764个公司在招聘,版面有限,不能将这些公司全部放上来,所以选取了招聘数量最多的前20名。
前三名就占了几乎四分之一。排除前三名后,再看一下整体情况及前20名的公司。
2、公司性质
可以看出,股份制和民营企业需求最大
3、公司规模
公司规模按照人数来划分,从图形来看,基本上满足正态分布。
不过也可以看得出来,大部分公司人数都是蛮多的。可以想象,小规模的公司,需求都不会太高
贰 / 哪些地方需求高?
可以看出,北京作为排头兵,领先不止一点点,其次就是长三角和珠三角,在招聘需求上,一线城市的缺口还是很多的。
各省薪资待遇可以看出,不管是需求还是薪资,北京、长三角、珠三角一直霸占三强宝座。
当然,内陆的需求主要集中在省会城市,比如,西安、成都、郑州、合肥、济南,这些在地图上的数据都很明显。
叁 / 招聘要求高不高?
这一方面的维度不好把握,所以主要从学历要求和工作经验来进行分析。
学历要求
简单统计一下数量之后,发现要求并不是很高。其中有个类别是空白,这个可以当做不限来看待。因此,招聘需求主要集中在大专、不限和本科。
工作经验
工作经验中,有些数据是这样的:1-3年,3-5年,因此,为了统一口径,所有类似的数据都在处理数据时进行了取最小值。所以,工作经验指代的是,最低的工作经验要求。
肆 / 薪资待遇好不好?
本部分内容比较多,从以下几个方面进行分析:
1. 简述2. 公司3. 地点4. 要求
简述
因源数据都是薪资区间,形式诸如:1000元以下,4001-6000元。因此,新增了三列,分别放置:最低薪资,最高薪资,及平均薪资。
以下主要按照平均薪资作为衡量指标。
首先看看平均薪资的几个指标:
最小值:500
25%分位数:5000
中位数:7000
均值:8373
75%分位数:9000
最大值:125000
缺失值为面试
可以看出,5001-10000元的区间最多,2114个,几乎占了一半;其次就是0-5000,有点惨的感觉。而且随着薪资的上涨,数量越来越少,到最后,就少得可怜了。
尤其从10000开始,似乎是断崖式的坠落,15000以上,只有193个。
1.公司规模
离群值影响太大,图表无法完全展示信息,因此,将异常值定为离群值,进行剔除。
先看中位数,规模在10000人以上的公司,反而给的最少,20人以下的公司反而给的最多。
再看四分位距,大部分在5000以内,而且多数分布在5000至10000这个区间内。
2. 要求
同样,此处还是分为学历和工作经验。
除去不限和空白的数据,博士学历的几项指标都比较高,其次就是硕士。
当然也可以看得到,本科和大专的部分离群值也比较高,甚至高过博士和硕士的最大值,说明学历并不完全是衡量薪资水平的标准,只能说随着学历的上升,薪资也有一定的提高。
报告人:高跃坤
2018.3.29
网友评论