之前,某家公司被讨论的沸沸扬扬:
上一个被如此讨论的还是某个带颜色的自行车。
不知道大家有没有听过一个段子,入职3天,公司倒闭了,由此,我想到了一个话题:如果可以提前知道什么样的公司会被淘汰,哪些因素会使员工离职,是不是能起到一些帮助?
这也就是我们所说的人力数据分析,只不过扩大到了另一个层面。
我们通过收集到相关的数据,然后做出可视化,就可以得到结果了。
一、数据来源
根据各大数据网站的项目或者数据集,还有一些专业的统计网站,有些是现成的,也有些是需要通过python来处理的,最后就可以获取到这些数据了。
二、数据处理
通常,清理数据需要大量的工作,并且可能是一个非常繁琐的过程。
这个数据集的获取过程是靠谱的,相对而言很干净,不含缺失值。但是,我仍然需要检查数据集,以确保所有其他内容都是可读的,并且观察值与特征名称适当地匹配。
三、数据可视化
这就到了比较关键的一步了。
一般来说,做可视化需要学习Numpy,pandas,matplotlib几个包的使用,而且过程还是比较复杂的:
于是,BI工具做可视化就出现了,像FineBI一样简单地做可视化,这才是上手快速简单的那个:
接下来就是用FineBI对整个数据进行分析了,首先设立分析目标:
整体概况:分析每年被淘汰的公司总数、不同省市的情况、背后的原因等
特定分析:抽取发达地区北、上、广作进一步的分析,主要淘汰的行业;公司类型,得出了以下5个分析的结论:
1、各年份被淘汰的公司总数对比
从FineBI的可视化图表中,很容易就看出了趋势的变化:
公司倒闭得最多得年份竟然是2017年...但如果数据统计到2020年的话,20年倒闭的数据肯定会更多。
2、被淘汰公司的主要原因
由FineBI做出来的饼图如下:
所以在找工作之前,也需要好好考虑一下这些该有的措施。
3、被淘汰公司的寿命
这里借用一下网上现有的分析,我是用开源工具写代码做的,不是说finebi做不了,我是想让大家对比一下可视化的效果。
顺便再来看看每个月被淘汰的公司的数量:
总体来看2015年-2017年期间被淘汰的公司集中在7月、8月以及12月倒闭,其中15年的倒闭高峰出现在7月、16年的倒闭高峰出现在8月,17年是倒闭最为严重的年份其中7月、8月小高峰,主要高峰出现在12月,而18年和19年只出现了一个高峰分别出现在12月和9月。为何会受这种影响,如果数据集没有问题那么需要结合当年的经济状况及政策来看。
网友评论