美文网首页Web Scraper
1.4 插件元素详解 --webscraper操作手册

1.4 插件元素详解 --webscraper操作手册

作者: niujw | 来源:发表于2019-12-02 14:42 被阅读0次

    上一节我们拆解了抓取数据的基本步骤,
    这一小节我们来认识一下webscraper这个插件的各个选项和按钮
    首先要知道我们创建的一个抓取数据的工程就是一个sitemap对象

    主页面
    主页面
    • 1 Sitemaps: 该页面记录了我们创建的所有的sitemap工程目录
    • 2 sitemap: 在Sitemaps中点击单个sitemap工程我们就可以编辑每个sitemap工程,具体有以下几个选项:
      Selectors: 当前sitemap的数据选择区域
      Selectors graph:当前sitemap选择器的图结构
      Edit metadata:编辑当前sitemap的源数据(主要包括sitemap名称和爬取的url)
      Scrape:启动sitemap工程进行抓取数据
      Browse: --
      Export Sitemap: 当我们编写好了sitemap之后可导出当前工程的配置文件
      Export data as CSV: 当sitemap工程抓取完之后,通过此选项导出CSV(excel文件)
      2
    • 3 Create new sitemap: 新建sitemap工程,既可以直接新建工程也可以直接使用别人的sitemap配置。
      Create Sitemap:创建新的sitemap
      Sitemap name:你的新sitemap的名称
      Start url: 要抓取的网站的链接,直接从浏览器复制粘贴进去
      import Sitemap:导入其他的sitemap配置文件
      Create new sitemap

    主页面基本上就这些元素,在后面的教程示例中我们会用到这些内容,用几次就熟悉了。
    接下来我们用几个例子来带你熟悉这个插件的神奇之处

    相关文章

      网友评论

        本文标题:1.4 插件元素详解 --webscraper操作手册

        本文链接:https://www.haomeiwen.com/subject/rpubwctx.html