美文网首页python网络爬虫基础
爬虫原理与数据抓取--爬虫基础教程(python)(一)

爬虫原理与数据抓取--爬虫基础教程(python)(一)

作者: 白夜前端 | 来源:发表于2019-02-12 12:52 被阅读0次

为什么要写网络爬虫?

首先,我们知道如今大数据十分火热,那么数据从何而来呢?
小编整理了一下:

网络爬虫的定义是什么?

百度百科:网络爬虫
按照自己的话来说,互联网就是一个很大的蜘蛛网,而爬虫就是网上爬来爬去的蜘蛛。

那么这个蜘蛛除了爬取数据还有什么其他用处呢?

我们会在掌握基础后,实现以下功能:

  • 12306抢票
  • 网站上的抢票
  • 等等...

python写网络爬虫我们需要掌握:

  • Python基础语法(基础知识)
  • 对前端页面结构的掌握(html,js),内容的抓取(数据抓取)
  • 对HTML页面的数据提取(json数据的提取)
  • Scrapy框架以及scrapy-redis分布式策略(第三方框架)
  • 爬虫(Spider)、反爬虫(Anti-Spider)、反反爬虫(Anti-Anti-Spider)的战争。。。

内容参考传智播客

相关文章

网友评论

    本文标题:爬虫原理与数据抓取--爬虫基础教程(python)(一)

    本文链接:https://www.haomeiwen.com/subject/nhoheqtx.html