python scrapy 教程示范案例- 抓取图文信息

作者: shelling_ | 来源:发表于2019-06-29 00:05 被阅读0次

python scrapy 教程示范案例- 抓取图文信息
pm2.5 小型爬虫
python 爬虫之路之Scrapy框架
Scrapy安装
初识Scrapy框架+爬虫实战(7)-爬取链家网100页租房信息
Win32 Python3.6爬虫-Scrapy简介与安装
Scrapy定时爬虫总结&Docker/K8s部署
Scrapy入门案例
Python爬虫之Scrapy的安装
Python爬虫：和我一起学习scrapy（一）

更多干活分享可访问博主个人网站
https://www.fzg5.com/blog/

scrapy_projects

可以作为 scrapy 学习项目

项目一

爬取一生必须知道的50幅中国名画，每一幅你都不容错过这篇文章中的50幅名画

items创建

painter = scrapy.Field()
pic_name = scrapy.Field()
picture = scrapy.Field()

scrapy配置

allowed_domains = ['sohu.com']
    start_urls = ['http://www.sohu.com/a/157709282_661623']

    def parse(self, response):
        pic_list = response.xpath('//article[@class="article"]/p')
        items = []
        for pic in pic_list[2:]:
            if len(pic.extract().split('／'))>1: 
                item = FamouspicspiderItem()
                item['painter'] = pic.xpath('span/text()')[0].extract().split('／')[1]
                item['pic_name'] = pic.extract().split('／')[0].split('、')[1]
                items.append(item)
            if pic.xpath('img/@src').extract(): 
                items[-1]['picture'] = pic.xpath('img/@src').extract()[0]
            
        return items

pipelines自定义存储

with open(picPath, 'wb') as fp:
    response = urlopen(item['picture'])
    fp.write(response.read())

4.修改配置文件,注册自定义存储文件

# Configure item pipelines
# See https://doc.scrapy.org/en/latest/topics/item-pipeline.html
ITEM_PIPELINES = {
   'famousPicSpider.pipelines.FamouspicspiderPipeline': 300,
}

5、scrapy crawl famousPic

GitHub

https://github.com/shellingshord/scrapy_projects#%E9%A1%B9%E7%9B%AE%E4%B8%80

更多干活分享可访问博主个人网站
https://www.fzg5.com/blog/

网友评论

Python

本文标题：python scrapy 教程示范案例- 抓取图文信息

本文链接：https://www.haomeiwen.com/subject/cvzycctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

python scrapy 教程示范案例- 抓取图文信息

scrapy_projects

项目一

爬取一生必须知道的50幅中国名画，每一幅你都不容错过这篇文章中的50幅名画

GitHub

相关文章

python scrapy 教程示范案例- 抓取图文信息

pm2.5 小型爬虫

python 爬虫之路之Scrapy框架

Scrapy安装

初识Scrapy框架+爬虫实战(7)-爬取链家网100页租房信息

Win32 Python3.6爬虫-Scrapy简介与安装

Scrapy定时爬虫总结&Docker/K8s部署

Scrapy入门案例

Python爬虫之Scrapy的安装

Python爬虫：和我一起学习scrapy（一）

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python

python scrapy 教程 示范案例- 抓取图文信息

scrapy_projects

爬取一生必须知道的50幅中国名画，每一幅你都不容错过 这篇文章中的50幅名画

GitHub

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

python scrapy 教程示范案例- 抓取图文信息

爬取一生必须知道的50幅中国名画，每一幅你都不容错过这篇文章中的50幅名画