美文网首页
webmagic高级:(五)

webmagic高级:(五)

作者: 沙漏如心 | 来源:发表于2018-03-20 17:35 被阅读0次

这个呢,也就是我对webmagic 做的最后一篇的内容了,在这个里面我打算说很多的的对象,只不过这些对象内容较为简单,或者说容易理解! 

    首先呢,第一个对象就是pipeline 里面的ResultItems对象了!

ResultItems

       这个呢就是这个对象里面的所有的内容,剩下的都是一些简单的方法!, 有图片我们可以看出来,ResultItems  这个对象里面最核心的内容就是一个Map一个用来存出一些数据的集合!在自己解析完页面之后,将自己需要保存的一些数据传到这个里面去,然后在pipe line 里面进行一些保存,就是这个样子;了!

剩下的,就是代理!

Proxy

干过爬虫的人呢,都会知道代理这个词,而webmagic呢,内部也是集成了代理系统的!  

   相应的,有代理就会有代理池了!

ProxyProvider

  这个呢,就是webmagic 内部集成的代理池了。 具体使用方法,请自己摸索,我没有使用过他内部自己集成的代理。 而且官网也没有这部分内容哦! 

https://blog.csdn.net/qq_36783371  一个大佬写的博客,欢迎去砸鸡蛋!

相关文章

  • webmagic高级:(五)

    这个呢,也就是我对webmagic 做的最后一篇的内容了,在这个里面我打算说很多的的对象,只不过这些对象内容较为简...

  • webmagic高级:(一)

    我们在前面的一些内容里面大概的讲述了一下,我对这个webmagic爬虫框架的一些了解,以及对整个爬虫的一些...

  • webmagic高级:(二)

    这个篇呢,我们主要说这个Page 对象,使用过webmagic 的人呢,都知道Page对象呢。是在dow...

  • webmagic高级:(三)

    这一篇呢,我们看看Site 这个对象! Site 作为Webmagic 的一个重要对象,却永远是呗最先忽略掉的一个...

  • webmagic高级:(四)

    本篇呢,本来打算写一下,pipeline里面的ResultItems对象,但是呢,简单看了一下,里面东西...

  • WebMagic指北

    WebMagic指北 一、快速开始 WebMagic主要包含两个jar包:webmagic-core-{versi...

  • java爬虫基础--webmagic

    java爬虫--webmagic 整理自尚硅谷教学内容 一、webMagic的总体介绍 WebMagic的结构分为...

  • WebMagic+Spring Boot爬取网易云音乐评论

    关于WebMagic WebMagic是一个简单灵活的Java爬虫框架。基于WebMagic,你可以快速开发出一个...

  • 爬虫框架webmagic与spring boot的结合使用

    1. 爬虫框架webmagic WebMagic是一个简单灵活的爬虫框架。基于WebMagic,你可以快速开发出一...

  • Webmagic+selenium+chromedriver使用

    一、Webmagic总体架构: WebMagic的结构分为Downloader、PageProcessor、Sch...

网友评论

      本文标题:webmagic高级:(五)

      本文链接:https://www.haomeiwen.com/subject/jjnxqftx.html