Scrapy的基本使用（三）——Scrapy爬虫的数据类型

作者: NiceBlueChai | 来源:发表于2017-11-27 22:13 被阅读14次

Scrapy爬虫的使用步骤
步骤1：创建一个工程和Spider模板
步骤2：编写Spider
步骤3：编写Item Pipeline
步骤4：优化配置策略

Scrapy的数据类型

Request类
class scrapy.http.Request()
Request对象表示一个HTTP请求
由Spider生成，由Downloader执行

属性或方法	说明
.url	Request对应的请求URL地址
.method	对应的请求方法，'GET' 'POST'等
.headers	字典类型风格的请求头
.body	请求内容主体，字符串类型
.meta	用户添加的扩展信息，在Scrapy内部模块间传递信息使用
.copy()	复制该请求

Response类型
class scrapy.http.Response()
Response对象表示一个HTTP响应
由Downloader生成，由Spider处理

Item类型
class scrapy.item.Item()
Item对象表示一个从HTML页面中提取的信息内容
由Spider生成，由Item Pipeline处理
Item类似字典类型，可以按照字典类型操作

网友评论

本文标题：Scrapy的基本使用（三）——Scrapy爬虫的数据类型

本文链接：https://www.haomeiwen.com/subject/uldjbxtx.html