python3 对拉勾数据进行可视化分析

python3 对拉勾数据进行可视化分析

作者: 9ba4bd5525b9 | 来源:发表于2019-04-21 15:13 被阅读163次

Python3 对拉勾数据进行可视化分析！
python3 对拉勾数据进行可视化分析
python3 对拉勾数据进行可视化分析
爬虫:爬取分析拉勾网数据分析职位信息
商业数据分析&作业1
数据分析学习笔记（2）——爬取拉勾网数据分析师岗位
谁说小白不能做项目？Python大咖手把手教你采集拉勾网！
大数据时代数据可视化的概念研究
几种常见的数据可视化分析图表
2018-12-20

上回说到我们如何如何把拉勾的数据抓取下来的，既然获取了数据，就别放着不动，把它拿出来分析一下，看看这些数据里面都包含了什么信息。

一、前期准备

由于上次抓的数据里面包含有 ID 这样的信息，我们需要将它去掉，并且查看描述性统计，确认是否存在异常值或者缺失值。

结果中的 unique 表示的是在该属性列下面存在的不同值个数，以学历要求为例子，它包含【本科、大专、硕士、不限】这4个不同的值，top 则表示数量最多的值为【本科】，freq 表示出现的频率为 387。由于薪资的 unique 比较多，我们查看一下存在什么值。

print(data['学历要求'].unique())

print(data['工作经验'].unique())

print(data['薪资'].unique())

二、预处理

　　从上述两张图可以看到，学历要求和工作经验的值比较少且没有缺失值与异常值，可以直接进行分析；但薪资的分布比较多，总计有75种，为了更好地进行分析，我们要对薪资做一个预处理。根据其分布情况，可以将它分成【5k 以下、5k-10k、10k-20k、20k-30k、30k-40k、40k 以上】，为了更加方便我们分析，取每个薪资范围的中位数，并划分到我们指定的范围内。

对【薪资】进行预处理之后，还要对【任职要求】的文本进行预处理。因为要做成词云图，需要对文本进行分割并去除掉一些出现频率较多但没有意义的词，我们称之为停用词，所以我们用 jieba 库进行处理。jieba 是一个python实现的分词库，对中文有着很强大的分词能力。

预处理完成之后，就可以进行可视化分析了。

三、可视化分析

我们先绘制环状图和柱状图，然后将数据传进去就行了，环状图的代码如下：

柱状图的代码如下：

我们再把学历要求和薪资的数据稍微处理一下变成字典形式，传进绘制好的环状图函数就行了。另外，我们还要对【任职要求】的文本进行可视化。

四、成果与总结

　　python数据分析师的学历大部分要求是本科，占了86%。

　　从柱状图可以看出，python数据分析师的工作经验绝大部分要求1-5年。

　　由此可以得出python数据分析的工资为10k-30k的比较多,工资高的估计要求会比较高，所以我们看一下职位要求。

从词云图可看出，数据分析肯定要对数据比较敏感，并且对统计学、excel、python、数据挖掘、hadoop等也有一定的要求。不仅如此，还要求具有一定的抗压能力、解决问题的能力、良好的表达能力、思维能力等。

相关文章

Python3 对拉勾数据进行可视化分析！
上回说到我们如何如何把拉勾的数据抓取下来的，既然获取了数据，就别放着不动，把它拿出来分析一下，看看这些数据里面都包...
python3 对拉勾数据进行可视化分析
一、前期准备由于上次抓的数据里面包含有 ID这样的信息，我们需要将它去掉，并且查看描述性统计，确认是否存在异常值...
python3 对拉勾数据进行可视化分析
上回说到我们如何如何把拉勾的数据抓取下来的，既然获取了数据，就别放着不动，把它拿出来分析一下，看看这些数据里面都包...
爬虫:爬取分析拉勾网数据分析职位信息
本文是我第三篇爬虫实战的代码,主要针对拉勾这一类有反爬机制的网站构思爬取思路,并对爬取的数据进行可视化及分析本来...
商业数据分析&作业1
对拉勾招聘网的数据指标分析数据字典量度：维度：
数据分析学习笔记（2）——爬取拉勾网数据分析师岗位
本次笔记主要记录了本人利用python编写爬虫对拉勾网的数据分析师岗进行爬取，因为打算从事数据分析师这个职业，所以...
谁说小白不能做项目？Python大咖手把手教你采集拉勾网！
全文简介本文是先采集拉勾网上面的数据，采集的是Python岗位的数据，然后用Python进行可视化。主要涉及的是...
大数据时代数据可视化的概念研究
本文基于对DT时代下数据可视化概念进行解读与分析。在大数据时代大背景下，作为前端工程师，接触数据，使用数据，分析数...
几种常见的数据可视化分析图表
可视化技术的高速发展带动着数据的进步。数据可视化的数据分析图表，借助于可视化的大屏，将数据以图表的形式进行汇总分析...
2018-12-20
拉勾网数据分析师薪酬分析数据是拉勾网“数据分析师” 这一职位的信息。主要分析了数据分析师总体薪酬情况、不同城市薪...

网友评论

本文标题：python3 对拉勾数据进行可视化分析

本文链接：https://www.haomeiwen.com/subject/bmcjgqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

编程网赚

python_pycham

关于我们|服务条款|联系我们|python3 对拉勾数据进行可视化分析|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！