美文网首页
Xpath helper Python爬虫工具谷歌浏览器插件

Xpath helper Python爬虫工具谷歌浏览器插件

作者: 简书用户9527 | 来源:发表于2017-12-18 22:04 被阅读208次

    介绍:

    一款很实用的谷歌浏览器Xpath 解析工具,通过浏览器在线解析工具可以省去很多重复运行,等待的时间。总之,就是能够很直观的查看你要解析到的结果

    工具截图

    黑色的Xpath helper.png

    功能

    google插件XPath Helper可以支持在网页点击元素生成xpath,整个抓取使用了xpath、正则表达式、消息中间件、多线程调度框架(参考)。xpath 是一种结构化网页元素选择器,支持列表和单节点数据获取,他的好处可以支持规整网页数据抓取。

    如果我们要查找某一个、或者某一块元素的xpath路径,可以按住shift,并移动到这一块中,上面的框就会显示这个元素的xpath路径,右边则会显示解析出的文本内容,并且我们可以自己改动xpath路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的xpath语句是否书写正确。

    插件下载

    一般的现在是翻墙不了了,所以我们直接去谷歌浏览器插件网进行插件的下载:Chrome插件网

    下载的CRX文件.png

    安装

    下载下来,我们进行安装,直接把谷歌浏览器打开,
    输入:chrome://extensions/

    直接把文件拖进去,然后就会让我确实是否要安装插件。

    扩展程序.png

    这样我们就把插件安装好了

    插件的使用

    1.在chrome浏览器安装好xpath helper插件后,打开某个网页(以搜狐为例)拷贝目标页面元素的XPATH,如下图所示:


    xpath打开页面.png

    2.点击 Ctrl + Shift + X 激活 XPath Helper 的控制台,然后您可以在 Query 文本框中输入相应 XPath 进行调试了,提取的结果将被显示在旁边的 Result 文本框中,如下图所示:

    黑框.png

    步骤

    1。打开一个新的标签,并导航到你最喜欢的网页。
    2。按Ctrl-Shift键-X以打开XPath辅助控制台。
    3。按住Shift键鼠标在页面上的元素。查询框会不断更新,以显示鼠标指针下面的元素充分XPath查询。结果框其右侧将显示评价结果的查询。
    4。如果需要的话,可以直接在控制台编辑XPath查询。在结果框中将立即反映任何变化。
    5。再次按Ctrl-Shift键-X关闭控制台

    相关文章

      网友评论

          本文标题:Xpath helper Python爬虫工具谷歌浏览器插件

          本文链接:https://www.haomeiwen.com/subject/xnkvwxtx.html