美文网首页scrapy爬虫学习笔记
scrapy学习笔记(〇)

scrapy学习笔记(〇)

作者: ATangYaaaa | 来源:发表于2018-06-04 13:38 被阅读0次

人若无名,便可潜心练剑。

本篇补冲基础知识:scrapy架构安装和shell用法。

安装顺序:

1. Python 3.6

2. python -m pip install pywin32

3. python -m pip install lxml

4. python -m pip install setuptools

5. python -m pip install zope.interface

6. 下载对应已编译版本:

    https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

    pip install .\Twisted-18.7.0-cp36-cp36m-win_amd64.whl

    python -m pip install Twisted

7. python -m pip install pyOpenSSL

8. python -m pip install scrapy

建议的运行终端:powershell

运用scrapy shell进行爬虫预分析:

1. scrapy shell http://www.weather.com.cn/weather1d/101250101.shtml

2. print(response)看网页响应状态

3. response.body看有无内容

4. view(response)弹出浏览器看下载的网页是否与原网页一致

5. response.xpath('//p[contains(@class,"tem")]/span/text()').extract()提取信息

6. response.xpath('//p[contains(@class,"tem")]/span/text()').re('\d{0,2}\')[0]正则提取信息(提取两位数字)

相关文章

  • scrapy学习笔记(有示例版)

    scrapy学习笔记(有示例版) 我的博客 scrapy学习笔记1.使用scrapy1.1创建工程1.2创建爬虫模...

  • 2018-08-12

    Scrapy学习 《精通Scrapy网络爬虫》第八章--仅作为本人学习笔记,如有侵权,请私信我删除 1、项目需求 ...

  • Scrapy笔记

    Scrapy笔记 安装scrapy框架: 安装scrapy:通过pip install scrapy即可安装。 如...

  • scrapy笔记

    1 scrapy的运行原理 参考:Learning Scrapy笔记(三)- Scrapy基础Scrapy爬虫入门...

  • 使用scrapy-deltafetch实现增量爬取

    Scrapy学习笔记-使用scrapy-deltafetch实现增量爬取 前言 在之前的文章中我们都是对目标站点进...

  • scrapy笔记(4) - 跟踪调试scrapy

    学习要点 学习如何跟踪调试scrapy框架 oh..距离上次写scrapy笔记3已经有一个多月了,跳票这么久,除了...

  • Scrapy笔记

    Scrapy笔记 pip 指定源安装模块 创建Scrapy项目 创建Scrapy爬虫程序 启动Scrapy爬虫 在...

  • scrapy学习笔记(〇)

    人若无名,便可潜心练剑。 本篇补冲基础知识:scrapy架构安装和shell用法。 安装顺序: 1. Python...

  • Scrapy学习笔记

    安装 python:python3现在各种包对3的支持都变的原来越好了,上一个系统装scarpy时还是各种问题(捂...

  • Scrapy学习笔记

    scrapy是python最有名的爬虫框架之一,可以很方便的进行web抓取,并且提供了很强的定制型,这里记录简单学...

网友评论

    本文标题:scrapy学习笔记(〇)

    本文链接:https://www.haomeiwen.com/subject/pugesftx.html