美文网首页
scrapy笔记

scrapy笔记

作者: 盗花 | 来源:发表于2016-05-08 20:18 被阅读90次

1.return与yield
两个关键字都可以返回scrapy.Request,区别是return返回的是列表,即使是只有一个scrapy.Request,以必须在外面加上[]返回;yield直接返回scrapy.Request
2.cookie的使用
访问一个网站时,若要加上cookie,可以在start_requests函数中加入。
示例:在百度首页加上登录名的cookie

def start_requests(self):
    url = 'http://www.baidu.com/'
    cookie = {
        'BDUSS': '***'
    }
    return [scrapy.Request(url=url, cookies=cookie)]
    # 或者为 yield scrapy.Request(url=url, cookies=cookie)

2.time.time
利用time.time()可实现简单的计算程序耗时功能。

相关文章

  • Scrapy笔记

    Scrapy笔记 安装scrapy框架: 安装scrapy:通过pip install scrapy即可安装。 如...

  • scrapy笔记

    1 scrapy的运行原理 参考:Learning Scrapy笔记(三)- Scrapy基础Scrapy爬虫入门...

  • Scrapy笔记

    Scrapy笔记 pip 指定源安装模块 创建Scrapy项目 创建Scrapy爬虫程序 启动Scrapy爬虫 在...

  • scrapy学习笔记(有示例版)

    scrapy学习笔记(有示例版) 我的博客 scrapy学习笔记1.使用scrapy1.1创建工程1.2创建爬虫模...

  • scrapy爬虫折腾系列-02

    Scrapy折腾系列-02 1、笔记 response是一个scrapy.http.response.html.H...

  • 分布式爬虫笔记(一)- 非框架实现的Crawlspider

    不久前写过一篇使用Scrapy框架写的Crawlspider爬虫笔记(五)- 关于Scrapy 全站遍历Crawl...

  • 使用scrapy-deltafetch实现增量爬取

    Scrapy学习笔记-使用scrapy-deltafetch实现增量爬取 前言 在之前的文章中我们都是对目标站点进...

  • 2018-08-12

    Scrapy学习 《精通Scrapy网络爬虫》第八章--仅作为本人学习笔记,如有侵权,请私信我删除 1、项目需求 ...

  • Scrapy笔记

    入门 http://scrapy-chs.readthedocs.org/zh_CN/1.0/intro/tuto...

  • scrapy笔记

    1.return与yield两个关键字都可以返回scrapy.Request,区别是return返回的是列表,即使...

网友评论

      本文标题:scrapy笔记

      本文链接:https://www.haomeiwen.com/subject/lnwsrttx.html