美文网首页大数据 爬虫Python AI Sql
Python的Scrapy框架抓取同城艺龙的招聘信息

Python的Scrapy框架抓取同城艺龙的招聘信息

作者: 敏儿敏儿 | 来源:发表于2019-11-26 16:31 被阅读0次

    尝试利用scrapy框架来抓取招聘信息,选了同城艺龙的,点击同城艺龙社招
    先建立好一个爬虫项目和爬虫文件,之前有写过,在此不做赘述。

    一、分析网页中职位信息

    image.png

    选取一个职位名称,鼠标右击,点击“检查”,可以看到代码内容。
    在建立的爬虫文件中,编写如下代码:

    image.png

    在pipelines.py文件中编写代码如下:


    image.png

    最后在setting.py中设置如下:


    image.png image.png

    ROBOTSTXT_OBEY 默认是True,一定要设为False,不然爬取不到内容

    最后执行以下代码,可以爬取的内容如下:


    image.png

    我在代码中利用切片功能将爬取职位数设置为爬取三个

            tr_list = response.xpath("//table[@class='jobsTable']/tr")[1:4]
    
    

    如果将[1:4]改为[1:-1],则会将当前页面的所有职位内容都爬取下来,如下图:

    image.png image.png

    数了一下,发现最后一个职位没有爬取下来,莫非被网站禁止了,最多只能爬取14个职位?这个待我研究研究哈

    相关文章

      网友评论

        本文标题:Python的Scrapy框架抓取同城艺龙的招聘信息

        本文链接:https://www.haomeiwen.com/subject/gvxywctx.html