PS:本文首发于公众号「软件测试艺术」,回复“软件测试教程”获取:麦子学院、传智播客、小强软件测试全套学习教程!
上篇文章中讲解了怎么抓取拉勾网站上全国软件测试招聘信息,一共抓取了450条招聘信息,通过筛选去掉招聘描述空白的部分,还剩余425条完整的招聘信息。本文主要讲解:
1、将txt中的数据读取到excel中进行分析
2、通过对招聘职位描述中的信息使用jieba和wordcloud库将招聘信息可视化
数据读取和清洗
首先,我们来看下怎么将txt数据读取到excel,主要运用到python的openpyxl库操作excel,首先写入头部信息,然后将txt的数据按照头部信息读取到列表中,其中对读入的数据需要进行预处理和清洗,去掉一些无关的信息,然后使用for循环写入即可,具体见下图:
读取数据已经处理之后的样式如下:
数据分析
针对读取的数据,首先我们可以直接在excel上进行分析,毕竟数据量不大也比较简单,如果使用python分析的话可以使用pyecharts库,该库的图标非常丰富。
招聘地区分布
首先针对招聘地区做分析,我们会发现软件测试基本的岗位都在北上广,这也印证了我们一定要去大城市(北上广深),职位多,薪水高。
薪水分布
工资因为有区间,因此不好计算,就以计算平均值为准,然后分别算出7K以下,7K-10K、10K-15K、15K-20K,20K-25K、25K以上的分布,从分布来看,软件测试的平均薪水在10K-15K之间,在行业内趋于高水平。
工作年限要求
通过对招聘年限进行分析,发现3-5年工作经验的测试人员最吃香,其次就是1-3年工作经验,这也告诉我们在工作的前几年一定要多多学习测试相关的技能提高自己。
教育程度
通过招聘信息了解到大部分公司招聘都倾向于本科教育程度,其次是大专。
数据可视化-云图
通过对招聘要求描述分析,发现对性能测试、测试用例、测试方案、测试流程、测试执行、测试报告、接口测试、Python、Java、Linux等硬技能,同时也非常看重学习能力、责任心等软技能,且企业都倾向于计算机相关的专业。当然这仅仅列出的是通用技能。
源码下载地址:https://github.com/devospy/lagou_zhaopin
关注微信公众号「软件测试艺术」,回复“软件测试教程”可以获取:麦子学院、传智播客、小强软件测试全套学习教程!
网友评论