Scrapy抓取网页数据

作者: hexg1016 | 来源:发表于2018-11-29 13:53 被阅读0次

Python爬虫 --- 2.3 Scrapy 框架的简单使用
【实战演练】Python爬虫，使用2.3 Scrapy 框架爬
【实战演练】Python爬虫，使用2.3 Scrapy 框架爬
Scrapy抓取网页数据
使用Beautiful Soup抓取结构化数据
scrapy-splash抓取动态数据
scrapy递归抓取网页数据
《利用 Python36，基于 Scrapy 框架的爬虫思路
爬虫框架scrapy和数据库MongoDB的结合使用（一）
06 scrapy框架

1创建项目

打开dos命令窗口，这里选择D:\pythonSpider。输入命令：

scrapy startproject dangle

D:\pythonSpider目录下会创建dangle文件夹，进入该文件加结构如下：

进入dangle文件夹

2分析网页

用chrome浏览器打开网址http://ng.d.cn/xiaomiqiangzhan/

按F12分析网页的结构

通过分析网页，我们知道要抓取的版本号的路径为

3编写代码

Pycharm打开项目dangle

Spider目录下新建dangle.py

# coding:utf-8

import scrapy

from ..items import DangleItem

class DangleSpider(scrapy.Spider):

name = "dangle"

start_urls = ['http://ng.d.cn/xiaomiqiangzhan/']

def parse(self, response):

print(response)

zf = DangleItem()

title_list = response.xpath(".//div[@class='rigame fl']/text()").extract()

#print(title_list .replace('\r','').replace('\n','').replace('\t','').strip())

pass #自行添加

4执行结果

Dos命令行下，在dangle的目录，执行

scrapy crawl dangle

版本号抓取到了

网友评论

本文标题：Scrapy抓取网页数据

本文链接：https://www.haomeiwen.com/subject/sjtfcqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Scrapy抓取网页数据

相关文章

Python爬虫 --- 2.3 Scrapy 框架的简单使用

【实战演练】Python爬虫，使用2.3 Scrapy 框架爬

【实战演练】Python爬虫，使用2.3 Scrapy 框架爬