美文网首页
网页解析库XPath(九)

网页解析库XPath(九)

作者: 梦捷者 | 来源:发表于2019-07-15 11:33 被阅读0次

    一、XPath的简介

    • XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。相比于BeautifulSoup,Xpath在提取数据时会更有效率。
    • lxml的安装
    pip install lxml
    

    二、XPath的语法

    • XPath 使用路径表达式在 XML/HTML 文档中选取节点。
    • 下面列出了最有用的路径表达式:
    1、谓语
    • 谓语被嵌在方括号中。在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果。
    2、选取未知节点

    XPath通配符可用来选取未知节点。

    3、用text()方法获取某个节点下的文本
    4、用string()方法获取某个节点下所有的文本
    用法示例:https://www.jianshu.com/p/b0a8c6fb7b42

    相关文章

      网友评论

          本文标题:网页解析库XPath(九)

          本文链接:https://www.haomeiwen.com/subject/joyzkctx.html