美文网首页
Python爬虫学习2-爬虫做什么

Python爬虫学习2-爬虫做什么

作者: MingSha | 来源:发表于2017-04-01 15:20 被阅读0次

网络爬虫可以让我们从网上得到我们想要的数据:Internet is database。
网络爬虫可以由许多方法实现。
目前最常用的是requests+beautifulsoup或者使用Scrapy框架。
Scrapy是基于twisted的,方便扩展而且可以把requests+beautifulsoup集成到爬虫中,不过使用scrapy内置的css和xpath selector也非常方便。后者的速度更快,如果只是简单应用可以使用前者。

网页分类

1、静态网页
2、动态网页(ajax等)
3、webservice(Restapi)

爬虫作用

1、如百度、谷歌等搜索引擎
2、推荐型网站
3、机器学习样本
4、数据分析(如用户、金融分析)

相关文章

  • Python爬虫学习2-爬虫做什么

    网络爬虫可以让我们从网上得到我们想要的数据:Internet is database。网络爬虫可以由许多方法实现。...

  • Python爬虫学习(十六)初窥Scrapy

    Python爬虫学习(一)概述Python爬虫学习(二)urllib基础使用Python爬虫学习(三)urllib...

  • 资料

    Python爬虫系列(一)初期学习爬虫的拾遗与总结(11.4更) Python爬虫学习系列教程 Python爬虫学习手册

  • 爬虫入门

    为什么要学习爬虫? Python做爬虫优势 关于Python网络爬虫,我们需要学习的有: 什么是爬虫? 网络爬虫(...

  • Python爬虫学习系列教程

    转自: 静觅»Python爬虫学习系列教程 Python爬虫学习系列教程 Python版本:2.7 一、爬虫入门 ...

  • Python爬虫学习之小结(一)

    到目前为止,Python爬虫学习已经写了八篇文章,分别是: Python爬虫学习(一)概述Python爬虫学习(二...

  • python爬虫学习-day7-实战

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

  • Python 基础爬虫目录

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

  • python爬虫学习-day5-selenium

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

  • python爬虫学习-day6-ip池

    目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

网友评论

      本文标题:Python爬虫学习2-爬虫做什么

      本文链接:https://www.haomeiwen.com/subject/sjviottx.html