美文网首页
利用Python爬虫抓取拉勾网职位信息

利用Python爬虫抓取拉勾网职位信息

作者: 一只努力的小白 | 来源:发表于2018-08-21 16:38 被阅读0次

      最近到了找工作的季节,利用之前学过的Python爬虫的知识抓取拉勾网的招聘信息,顺便检验一下学习效果,并记录一下

1.思路

首先,打开拉勾网,我设置的是北京地区的数据分析的职位信息

接下来需要提取这些职位信息,直接通过查看网页源码无法获取,因为拉勾网利用了异步加载技术,需要借助chrome浏览器的小工具进行分析,按F12即可打开,界面如下

搜索界面

点击Nerwork进入网络分析界面,此时出现的是空白,刷新网页之后,有某个请求发送到了服务器

找到的json

点开上面的json网页之后可以看到有我们需要的信息,因此下一步进行代码部分。

2.代码

代码部分我采用的Scrapy框架编写的爬虫

首先,确定需要获取的职位信息包括什么,这一部分在items.py中编写

items.py

主要部分为爬虫的编写,由于时间有点紧张就不进行详细的分析了,代码如下:

1 2 3

爬取结果保存到了excel中方便查看,数据写入部分的代码在pipelines.py中编写如下,利用python中的openpyxl库:

信息写入

相关文章

网友评论

      本文标题:利用Python爬虫抓取拉勾网职位信息

      本文链接:https://www.haomeiwen.com/subject/rnrjiftx.html