前程无忧python岗位信息爬取和分析

前程无忧python岗位信息爬取和分析

作者: pao哥 | 来源:发表于2019-12-15 23:41 被阅读0次

前程无忧python岗位信息爬取和分析
前程无忧 Python 招聘岗位信息爬取和分析
利用python生成词云
51job'python'岗位分析
前程无忧职位信息爬取
Python案例篇：爬取分析大型招聘网站Python岗
前程无忧实战项目---Bs4
BeautifulSoup解析页面造成信息丢失的解决办法
6.爬取拉勾网职位信息
python爬取前程无忧分析一波机械职位信息

前程无忧python岗位信息爬取和分析

项目简介

爬取12月14日所有前程无忧中的python岗位信息, 共33751条数据
分析python岗位的以下情况:
1. 各个城市的岗位数量分布
2. 不同学历要求下的岗位数量分布
3. 工作经验年限与工资的关系
4. 城市与工资的关系
5. 岗位要求的技能关键词的词频
项目地址: https://github.com/397460848/51job-spider-and-data-analysis

项目内容

各城市的岗位数量分布

地区职位数量分布图.png
不同学历要求下的岗位数量分布

有一些岗位没有学历要求, 所以只有28000多条数据

学历职位数量分布图.jpg

工作经验年限与工资的关系

所有的单位全部换算成了(元/月)
岗位的工资一般都是一个区间, 在该次分析中都是使用工资区间的下限*1.2来计算的, 我认为这样可以较为准确的反应出岗位的实际工资
使用箱型图可以比较好的忽略异常值, 反应出大体的工资情况

工作经验与工资箱型图.jpg

城市与工资的关系
- 为了方便展示, 只统计了岗位最多的8个城市
  
  城市与工资箱型图.jpg

岗位要求的技能关键词的词云

python技能词云图.jpg

词频统计如下, 大家可以观察一下哪些技能关键词是python岗位被提及较多的

词频表.png

使用的库

爬虫部分:

requests: 用于请求url
redis: 可以使用python连接redis, 用于临时存储url
pymongo: 可以使用python连接mongodb, 存储爬下来的数据
lxml: 主要使用其中的xpath相关模块, 用于解析html
multiprocessing: 内置库, 用于开启线程池, 加快爬取速度

作图部分:

matplotlib: 用于作图
jieba: 用于中文分词
collections: 内置库, 用于统计词频
wordcloud: 用于生成词云图片
PIL: 用于图像处理

未提交部分

作图的部分是使用jupyer notebook写的, 代码写的太乱, 没有提交, 后续优化后提交

相关文章

前程无忧python岗位信息爬取和分析
前程无忧python岗位信息爬取和分析项目简介爬取12月14日所有前程无忧中的python岗位信息, 共337...
前程无忧 Python 招聘岗位信息爬取和分析
如何使用爬虫分析Python 岗位招聘情况 Life is short, you need Python。Pyth...
利用python生成词云
利用python的wordcloud包生成词云，分析前程无忧数据分析岗位的岗位职责和岗位要求效果
51job'python'岗位分析
项目介绍使用python requests爬取51job的13925条有关北京地区python的岗位信息，分析岗...
前程无忧职位信息爬取
分析网页通过浏览器查看网页源代码，可以找到相应的职位信息，可知目标网页为静态网页，因此可以直接爬取。爬取思路 ...
Python案例篇：爬取分析大型招聘网站Python岗
爬取前程无忧python岗位金三银四已经即将来到了尾声，现在还有多少是待业，或者说没有去到自己理想的开发岗啊？ ...
前程无忧实战项目---Bs4
利用Bs4,爬取前程无忧职位信息。里面才用的是css选择器爬取标签内容代码如下：
BeautifulSoup解析页面造成信息丢失的解决办法
在爬取前程无忧信息时,使用下面的解析方法出现了信息丢失的问题: html = BeautifulSoup(resu...
6.爬取拉勾网职位信息
首先先尝试爬取沈阳python相关岗位信息此时我们得到爬取数据，但是并不能在得到的数据内查找到岗位信息通过观察可...
python爬取前程无忧分析一波机械职位信息
秋招这个时候已经开始了，正所谓知己知彼方能百战不殆，今天就从招聘网站下手分析一波机械的就业前景。这次获取数据的网站...

网友评论

本文标题：前程无忧python岗位信息爬取和分析

本文链接：https://www.haomeiwen.com/subject/umxrnctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|前程无忧python岗位信息爬取和分析|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！