scrapy-3.items并存入csv/json

scrapy-3.items并存入csv/json

作者: ddm2014 | 来源:发表于2018-06-17 21:22 被阅读0次

scrapy-3.items并存入csv/json
爬取猫眼电影存入csv
MongoDB数据的导入导出
java json转csv 并导出
python csv、json、pickle数据持久化
csv文件的生成
neo4j-批量导入工具使用
csv2json
CSV和JSON的转换
python写入json文件

如果只是把数据打印出来，还是有些不太够用，scrapy还提供了各种存储途径。
items我觉得有点像pandas里的列，名字就是列名。items文件已经写好框架只要把你需要爬取的名字加进去就好。

import scrapy

class ZdmItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()
    price = scrapy.Field()
    # pass

然后更改spider程序。

import scrapy
from pyquery import PyQuery as pq
#导入items
from zdm.items import ZdmItem  

class SmzdmCrawler(scrapy.Spider):
    name = 'smzdm'
    start_urls = ['https://faxian.smzdm.com/']

    def parse(self, response):
        res = pq(response.body)
        for item in res('.feed-block-ver').items():
            yield scrapy.Request(item('a').attr('href'),self.parse_detail)

    def parse_detail(self,response):
        res = pq(response.body)
        #导入item，添加内容
        zdmitem = ZdmItem()           
        zdmitem['name'] = res('.article_title em').eq(0).text()
        zdmitem['price'] = res('.article_title span').text()
        yield zdmitem

更改之处为导入item和把原本print的部分放入到item里去。

然后就可以存到json，csv等格式了。
只需要在terminal里输入
scrapy crawl smzdm -o smzdm.csv
scrapy crawl smzdm -o smzdm.json
就存好了

相关文章

scrapy-3.items并存入csv/json
如果只是把数据打印出来，还是有些不太够用，scrapy还提供了各种存储途径。items我觉得有点像pandas里的...
爬取猫眼电影存入csv
爬取猫眼电影存入csv
MongoDB数据的导入导出
json、csv的导入说明： Demo: json、csv的导出说明： Demo: 数组查询
java json转csv 并导出
1.pom文件引入jar包 2.添加工具类方法 3.调用方法生成csv 示例导出后
python csv、json、pickle数据持久化
1. csv/json/pickle基本概念 csv:CSV（Comma Separated Values）格式是...
csv文件的生成
列表导出为csv文件字典导出为csv文件 json导出为csv文件
neo4j-批量导入工具使用
从mysql中导出数据存储为csv文件 neo4j 数据库读取csv文件读取但不存入数据库读取并存入数据库,需...
csv2json
import csv import jsoncsvfile = open('file.csv', 'r')json...
CSV和JSON的转换
import json fo=open('csv.csv','r') ls=[] for i in fo: i=...
python写入json文件
想要多条相同key的数据添加json中，先将数据存入到字典中，再append到列表中。最后存入json中。这样子...

网友评论

我爱编程

本文标题：scrapy-3.items并存入csv/json

本文链接：https://www.haomeiwen.com/subject/rqxgeftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

我爱编程

关于我们|服务条款|联系我们|scrapy-3.items并存入csv/json|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！