注:本文来自实验楼学员米竹314159 的作业。他针对杭州招聘市场数据分析岗位的分析结果,很让人出乎意外。
清醒的结构:绪论/数据获取/数据预处理/数据分析/总结。
动情的绪论
米竹同学写道:数据分析是我比较心仪的发展方向。利用数据来定性且定量地解决(解释和预测)问题,酷极。且数据分析广泛地存在于各行各业中,加之行业的业务理解,简直就是万金油,妙极......
2018年互联网行业面临着又一轮的寒冬,大小公司裁员、缩招......本人打算在杭州发展,且杭州作为互联网大市,能提供一定的数据支持,进行爬取分析,管中窥豹,大致了解当下的数据分析岗(与数据分析相关的岗位)现状,为将来的就业做好初步的规划。
戳我查看完整代码思路>>
理智的数据爬取
本次项目采集智联招聘杭州站的招聘信息,主要分为公司基本信息、职位基本信息、职位要求信息这三部分。注意:智联招聘最多只展示12页(90*12条)信息。
通过对招聘信息绘制词云图,进行可视化分析,对公司、职位的基本信息和职位的要求信息进行描述性分析,最后通过关联规则,发现了招聘者对于求职者软件能力要求之间的相关关系。
戳我查看完整代码思路>>
干净利落的数据预处理和清洗
为了让数据适合分析,还需要:
1. 将薪资水平 salary 拆分为 “最低薪资”和“最高薪资”,再由二者计算“平均薪资水平”;
2. 从职位详细描述 jobDetail 数据中提取出“软件能力要求”变量;
3. 将 jobDetail 数据中提取出所有内容写入txt文件中(生成词云图)
为了避免不必要的数据浪费,决定对数据集进行拆分,分为位置数据、文本数据、其他数据。
戳我查看完整代码思路>>
犀利的数据分析
职位描述词云图
可以直观的看到,在数据分析岗的职位详细描述信息中,“经验”、“能力”、“负责”等词被提到较多,这符合现实认知,说明企业对于应聘者首先考察的是其“经验”如何、“能力”高低、“负责”与否。
戳我查看完整代码思路>>
极具参考价值的结论
1. 公司规模为100-499人的中小型企业对于数据分析人才的需求量最大;
- 民营企业提供较多的数据分析岗;
3. 相对而言,择选滨江区、余杭区进行就业,对于数据分析师发展会有更好的发展;
4. 数据分析岗几乎都是全职的,其薪资仍比较可观;
- 学历要求最多的是中等学历的大专,工作经验要求最多的是1-3年;
6. 学历一般与薪资水平正相关,工作经验也是;
7. 本科生薪水的离散程度最大;
- Excel是公司对数据分析求职者最普遍最基本的要求,公司也很看重SQL,Python\R作为加分项;
9. 要求求职者会Python的公司一般也倾向于要求求职者会SQL。
米竹同学最后中肯地讲到:寻找机会增加自己的实践经验(一定程度上比学历更重要),可以好乐,但是要无荒,需要努力提升自己的专业水平与业务理解。
至于软件,Excel和SQL是必须的,Python、R择其一,要达到掌握及以上的程度。都说互联网寒冬,谈及色变,但换个角度想想,又何尝不是机遇呢?
你们一定难以相信,这么专业的一篇数据分析实操案例,是一个刚入门数据分析挖掘没几周的同学写的。
米竹314159,是实验楼《数据分析与挖掘》第二期的学员。其实,最让人敬佩的并不是他的代码,而是他的学习的态度。他一边在分析“寒冬下的数据分析岗位”,一边说“冬天来了,春天还会远吗?”
“人的一切痛苦,本质上,都是对自己无能的愤怒”。除了米竹同学,其实还有很多优秀的同学的作品,后面我们也会陆续分享出来。
对于数据分析与挖掘感兴趣的同学,也可以了解一下《数据分析与挖掘实战》这门课,目前已经开到第四期。课程适合零基础或者有一点专业基础的同学都可以。
内心独白:因为每期招收名额限额,基本在实验楼站内就满员。这一期扩大了一点名额,所以....今天这篇,一来是给大家分享这篇精彩的作业,二来就是.....很不好意思地给楼+课程《数据分析与挖掘实战》做个推广,谢谢你们。
扫码添加小姐姐微信咨询/报名
网友评论