美文网首页python3大数据
手把手教你进行Scrapy中item类的实例化操作

手把手教你进行Scrapy中item类的实例化操作

作者: Python进阶学习交流 | 来源:发表于2020-05-09 13:09 被阅读0次

接下来我们将在爬虫主体文件中对Item的值进行填充。

1、首先在爬虫主体文件中将Item模块导入进来,如下图所示。

2、第一步的意思是说将items.py中的ArticleItem类导入到爬虫主体文件中去,将两个文件串联起来,其中items.py的部分内容如下图所示。

3、将这个ArticleItem类导入之后,接下来我们就可以对这个类进行初始化,并对其进行相应值的填充。首先去parse_detail函数下对其进行实例化,实例化的方法也十分简单,如下图所示。

4、接下来,我们将填充对应的值。实际上我们在之前通过Xpath或者CSS选择器已经获取到了目标数据,如下图所示,现在要做的就是依次填充目标字段的值。

5、我们可以像字典一样来给目标字段传值,例如item[“title”]= title,其他的目标字段的填充也是形如该格式,填充完成之后如下图所示。

其中,目标字段可以参考items.py中定义的item,这样可以加快填充的速度。

6、到这里,我们已经将需要填充的字段全部填充完成了,之后我们需要调用yield,这点十分重要。再调用yield之后,实例化后的item就会自动传递到pipeline当中去。可以看到下图中的pipelines.py中默认给出的代码,说明pipeline其实是可以接收item的。

7、到这里,关于实例化item的步骤就已经完成了,是不是比较简单呢?我们后面把pipeline配置起来,一步一步的将Scrapy串起来。

****看完本文有收获?请转发分享给更多的人****

IT共享之家

入群请在微信后台回复【入群】


想学习更多Python网络爬虫与数据挖掘知识,可前往专业网站:http://pdcfighting.com/

相关文章

  • 手把手教你进行Scrapy中item类的实例化操作

    接下来我们将在爬虫主体文件中对Item的值进行填充。 1、首先在爬虫主体文件中将Item模块导入进来,如下图所示。...

  • 手把手教你进行Scrapy中item类的实例化操作

    接下来我们将在爬虫主体文件中对Item的值进行填充。 1、首先在爬虫主体文件中将Item模块导入进来,如下图所示。...

  • Item容器

    Item :位置:scrapy根目录下的item.py中的Item类item.py:Field类:一个dict的...

  • 2019-01-25 json 中的ensure_ascii=F

    最近的scrapy 中item序列化 中输出中文的问题.

  • scrapy 信号槽的使用

    scrapy文档讲了scrapy的信号,但没有说明具体怎么用,下面是实例 在spider类下 spider类初始化...

  • Java类加载的过程

    JVM规定,在以下四种情况下必须要对一个类进行初始化操作 实例化了类的对象 通过反射调用了类的实例化方法 实例化了...

  • Java se - 实例方法,类方法

    定义 实例方法:可以对当前对象的实例变量进行操作,也可以对类变量进行操作,由实例对象调用。类方法:不能访问实例变量...

  • set()方法

    在DI的时候,利用set()方法,可以在一个实现类中对另外一个类进行实例化操作。即将一个属性注入另外一个类中。

  • python scrapy

    pipspider scrapy命令 middleware中间件 item Item提供了类字典的API,并且可以...

  • 常用设计模式

    工厂设计模式 工厂设计模式,主要用于进行实例化对象时的解耦操作,避免使用new关键字实例化对象,通过反射,根据类名...

网友评论

    本文标题:手把手教你进行Scrapy中item类的实例化操作

    本文链接:https://www.haomeiwen.com/subject/fdcknhtx.html