美文网首页
2018-09-19 scrapy-Pipeline(一)

2018-09-19 scrapy-Pipeline(一)

作者: 认真的史莱冰 | 来源:发表于2018-09-19 12:49 被阅读0次

当item进入pipeline的时候就要经过一个个管道,入库或者进行其他作用。先介绍scrapy内置的Pipeline图片管道和文件管道

图片管道

首先如果要用图片管道那么就必须启用item,用item对象才能完成对图片的读写

在items文件中的某一个Item类中,我们需要img_urls和images作为成员变量

img_urls装载的是图片链接,

images是不需要在spider中被赋值的,在图片管道文件中,如果这个images对应的img_urls是正确的,那么下载到的图片信息会传递给这个images

在settings文件中,我们要指出他的存储路径,用

IMAGES_STORE这个名字(不能乱改的)

并且可以在IMAGES_MIN_HEIGHT和IMAGES_MIN_WIDTH中设置图片的最小宽度和长度设定好这些就直接开始爬就完事儿了

IMAGES_EXPIRES可以设置有效的图片时间,这个90天中是不会再一次下载这个图片

IMAGES_THUMBS这个可以设置缩略图

相关文章

  • 2018-09-19 scrapy-Pipeline(一)

    当item进入pipeline的时候就要经过一个个管道,入库或者进行其他作用。先介绍scrapy内置的Pipeli...

  • 随手拍

    2018-09-19

  • 2018-09-19

    戴师傅 2018-09-19 2018-09-19 20:32 打开App (稻盛哲学学习会)打卡第135天 姓名...

  • Vue-05-xiaoming

    2018-09-19 话不多说,步入正轨==》》》Ming Never Give upQAQ~ 当我们说到组件(c...

  • 睾酮测定指南 2018

    2018-09-19 不列颠哥伦比亚省临床实践指南中心(BC,Clinical Practice Guidelin...

  • 懂你L4-U2-1-Vocabulary-Great Disco

    流利说 D78 2018-09-19 三 学习 Level4-Unit1-Part4*Learning- "Voc...

  • 田园米多多

    喜乐田园138517732 2018-09-19 田园感恩成长日志~每天都有小确幸 “愿望” 是希望某事发生, “...

  • (20)我拿什么奉献给你

    (20)我拿什么奉献给你 晨小贝 已关注 2018-09-19 19:37 · 字数 2352 · 阅读 16 ·...

  • 转帖:说的有理!中国确实没有价值观

    鲍鹏山 | 商鞅,闯入中华人间的魔鬼 2018-09-19 09:03 一 在了解商鞅这个人物以后,感觉非常震撼 ...

  • 无滋无味

    此刻的我 听着歌 有些许的思绪 工作疲惫 有点小感冒 有说不出的滋味 2018-09-19 乌鲁木齐

网友评论

      本文标题:2018-09-19 scrapy-Pipeline(一)

      本文链接:https://www.haomeiwen.com/subject/meabnftx.html