美文网首页虫虫
python爬取boss直聘职位数据,并保存到本地

python爬取boss直聘职位数据,并保存到本地

作者: 9ba4bd5525b9 | 来源:发表于2019-07-22 14:42 被阅读15次

    基本环境配置

    1、requests,用于模拟http/https请求

    安装: pip install requests

    2、beautifulsoup4,用于解析网页,得出我们想要的内容。

    安装: pip install beautifulsoup4

    3、xlwt,将爬到的结果以Excel的形式保存到本地

    安装: pip install xlwt

    api: xlwt api

    打开网页

    首先打开boss直聘官网,选择一个地点,然后输入关键字,点击搜索,这里以深圳、python为例。

    观察地址栏URL,可以发现有四个参数,分别是query,city,industry和position,query和city很明显是我输入的python和选择的地点深圳;而industry和position也就是公司行业和职位类型,这里没有选择这两项。

    分析网页

    F12打开开发者工具

    每一条职位信息都在一个<li>标签中,<li>标签下的<div class=“job-primary”>就是我们要找的内容。

    代码

    获取城市编码

    url中的city=101280600,显示的是深圳,说明城市名有一个对应的编号,F12 点击Network选中XHR,有一个city.json

    完整代码

    相关文章

      网友评论

        本文标题:python爬取boss直聘职位数据,并保存到本地

        本文链接:https://www.haomeiwen.com/subject/goqwlctx.html