day5、scrapy有意思吧音乐

作者: 是东东 | 来源:发表于2018-08-21 20:46 被阅读0次

day5、scrapy有意思吧音乐
Scrapy爬取网易云音乐和评论（二、Scrapy框架每个模块的
Scrapy爬取网易云音乐和评论（一、思路分析）
Scrapy爬取网易云音乐和评论（四、关于API）
Scrapy爬取网易云音乐和评论（三、爬取歌手）
Scrapy爬取网易云音乐和评论（五、评论）
爬虫就业冲刺20180818
learning scrapy 读书笔记
day5、Scrapy
考拉在家早教之锅碗瓢盆水果舞

intrest.py

# -*- coding: utf-8 -*-
import scrapy
from u148.items import U148Item
#爬取 有意思吧网站的音乐
#http://www.u148.cn/music


class IntrestSpider(scrapy.Spider):
    name = 'intrest'
    allowed_domains = ['u148.cn']
    start_urls = ['http://www.u148.cn/music/']

    def parse(self, response):
        print("__________________________")
        m_list = response.xpath("//article[starts-with(@class,'ajaxpost box')]")
        # 遍历这些音乐
        for m in m_list:
            item = U148Item()
            item["title"] = m.xpath(".//h2/a/@title").extract()[0]
            item["img"] = m.xpath(".//img[@class='thumb']/@src").extract()[0]
            item["zhaiyao"] = m.xpath(".//div[@class='excerpt']/text()").extract()[0]
            item["author"] = m.xpath(".//span[@class='author']/a/text()").extract()[0]
            item["time"] = m.xpath(".//span[@class='date']/text()").extract()[0]
            yield item

items.py

import scrapy


class U148Item(scrapy.Item):
    title = scrapy.Field()
    img = scrapy.Field()
    zhaiyao = scrapy.Field()
    author = scrapy.Field()
    time = scrapy.Field()

pipelines.py

class U148Pipeline(object):
    def process_item(self, item, spider):
        return item

网友评论

本文标题：day5、scrapy有意思吧音乐

本文链接：https://www.haomeiwen.com/subject/mzcsiftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

day5、scrapy有意思吧音乐

相关文章

day5、scrapy有意思吧音乐

Scrapy爬取网易云音乐和评论（二、Scrapy框架每个模块的

Scrapy爬取网易云音乐和评论（一、思路分析）

Scrapy爬取网易云音乐和评论（四、关于API）

Scrapy爬取网易云音乐和评论（三、爬取歌手）

Scrapy爬取网易云音乐和评论（五、评论）

爬虫就业冲刺20180818

learning scrapy 读书笔记

day5、Scrapy

考拉在家早教之锅碗瓢盆水果舞

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读