Python爬虫实战-抓取拉钩招聘信息

作者: 加来依蓝 | 来源:发表于2018-04-10 19:00 被阅读31次

爬取过程：

1、获取数据：Requests

2、解析数据：使用pandas的 DataFrame.from_dict ()

3、保存数据：pandas

步骤一：分析网页

爬取拉钩招聘信息需要先登录，通过分析，爬取时需要的信息如下：

url ='https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false'

请求首部：

headers ={

'Cookie': ......,

'Referer': ......,

'User-Agent': ......,

}

采用POST方法进行请求

二、代码实现

核心代码如下图所示，不过别忘了添加headers。

调用方法示例： get_job_info(2, '数据','深圳')

本文标题：Python爬虫实战-抓取拉钩招聘信息

本文链接：https://www.haomeiwen.com/subject/czinhftx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！