美文网首页
xpath工具与lxml库的使用

xpath工具与lxml库的使用

作者: 遇明不散 | 来源:发表于2019-07-09 12:58 被阅读0次

xpath

在XML文档中查找信息的语言,同样适用于HTML文档的检索

xpath辅助工具
Chrome插件

插件:XPath Helper
打开/关闭:Ctrl + Shift + X

Firefox插件

XPath checker

XPath表达式编辑工具

XML quire

xpath匹配规则
选取节点
  • / 从根节点开始选取
  • // 从整个文档中查找节点
  • @ 选取某个节点的属性
  • text() 获取某个节点中的文本
  • 节点对象.text 获取节点对象的内容
@的使用
  • 选取1个节点 //title[@lang="en"]
  • 选取N个节点 //title[@lang]
  • 选取节点的属性值 //title/@lang
匹配多路径
# 获取所有book节点下的 title节点和price节点
//book/title | //book/price
函数
# 匹配一个属性值中包含某些字符串的节点
contains()
# title节点包含 e 字符
//title[contains(@lang,"e")]

lxml库及xpath使用

lxml库的使用流程
# 1.导模块
from lxml import etree
# 2.利用lxml库的etree模块创建解析对象
parseHtml = etree.HTML(html)
# 3.解析对象调用xpath工具定位节点信息
# 只要调用了xpath,结果一定是列表 
r_list = parseHtml.xpath('xpath表达式')

Ajax动态网站数据抓取

滚动鼠标滑轮时加载

相关文章

  • lxml库与Xpath语法

    lxml库使用Xpath语法解析定位网页数据。 lxml库的使用 (1)修正HTML代码 lxml为XML解析库,...

  • 爬虫12:解析器lxml

    在python中,主要使用 lxml 库来进行xpath获取(在框架中不使用lxml,框架内直接使用xpath即可...

  • xpath工具与lxml库的使用

    xpath 在XML文档中查找信息的语言,同样适用于HTML文档的检索 xpath辅助工具 Chrome插件 插件...

  • day67-爬虫之xml及beautifulsoup

    1爬虫解析库的使用 Xpath解析库使用Xpath解析库需要先安装lxml库pip3 install lxmlBe...

  • 爬虫学习(二)数据解析

    1.xpath语法 2.1用lxml库解析html字符串和文件 2.2xpath和lxml库配合使用 示例 电影天...

  • Python学习手册-lxml库(Xpath解析)

    前言 今天要说一个解析利器xpath解析,使用的库是lxml库,它是一个非常强大的数据抽取工具,哈哈,非常好用!建...

  • Python解析库lxml与xpath用法总结

    本文主要围绕以xpath和lxml库进行展开: 一、xpath 概念、xpath节点、xpath语法、xpath轴...

  • Xpath与lxml库

    处理HTML文档很累,有没有其他的方法? 有!那就是XPath,我们可以先将 HTML文件 转换成 XML文档,然...

  • lxml模块

    lxml 模块 简介 xpath定位 详见xpath定位 lxml模块中使用xpath语法定位元素提取属性值或文本...

  • 114.xpath的使用的案例及代码

    一.xpath的使用: XML Path Language XML 路径语言安装lxml库 (持HTML和XML解...

网友评论

      本文标题:xpath工具与lxml库的使用

      本文链接:https://www.haomeiwen.com/subject/qofbhctx.html