学习爬虫

作者: Monica丶 | 来源:发表于2018-12-30 22:56 被阅读3次

一、前期准备
方法一:
1. 创建虚拟环境

python3 -m venv 虚拟环境名称
  1. 激活虚拟环境
在 Windows 下:
./ 虚拟环境名称/Scripts/activate.bat

在 OS X 和 Linux 上:
source ./venv/bin/activate
  1. 安装依赖
下载 vc++ 14安装
pip install twisted[tls]

4.安装Scrapy

pip install scrapy

方法二:

可以直接下载安装Anaconda在可视化界面完成(我是懒癌患者,所以我推荐这种方式,哈哈)

二、开始爬虫
1.新建一个爬虫项目(生成项目目录)

scrapy startproject 项目名称

2.生成爬虫

scrapy genspider  爬虫名  域名

3.配置请求身份

在setting文件下→设置user-agent(具体需要到你要爬的网页上找,很简单~)

4.编写爬虫

在你之前爬虫名文件中编写--首先修改在class里的start_urls 看是否是你要爬的那页网址--再到parse方法中编写爬虫代码

5.我爬的简单的豆瓣上电影信息(如图)


image.png

6.运行爬虫

scrapy crawl 爬虫名

这样一个简单的爬虫流程就走完啦,是不是感觉没那么复杂呢!!!

相关文章

  • 爬虫入门

    为什么要学习爬虫? Python做爬虫优势 关于Python网络爬虫,我们需要学习的有: 什么是爬虫? 网络爬虫(...

  • 资料

    Python爬虫系列(一)初期学习爬虫的拾遗与总结(11.4更) Python爬虫学习系列教程 Python爬虫学习手册

  • Python爬虫学习(十六)初窥Scrapy

    Python爬虫学习(一)概述Python爬虫学习(二)urllib基础使用Python爬虫学习(三)urllib...

  • Python爬虫学习系列教程

    转自: 静觅»Python爬虫学习系列教程 Python爬虫学习系列教程 Python版本:2.7 一、爬虫入门 ...

  • Python爬虫学习之小结(一)

    到目前为止,Python爬虫学习已经写了八篇文章,分别是: Python爬虫学习(一)概述Python爬虫学习(二...

  • python爬虫学习-day7-实战

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

  • Python 基础爬虫目录

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

  • python爬虫学习-day5-selenium

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

  • python爬虫学习-day6-ip池

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

  • python爬虫学习-day3-BeautifulSoup

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

网友评论

    本文标题:学习爬虫

    本文链接:https://www.haomeiwen.com/subject/tfnplqtx.html