美文网首页python测试开发
xpath路径表达式笔记

xpath路径表达式笔记

作者: Leo_0626 | 来源:发表于2017-10-12 18:10 被阅读9次

简单说,xpath就是选择XML文件中节点的方法。
所谓节点(node),就是XML文件的最小构成单位,一共分成7种。

  • element(元素节点)
  • attribute(属性节点)
  • text (文本节点)
  • namespace (名称空间节点)
  • processing-instruction (处理命令节点)
  • comment (注释节点)
  • root (根节点)
    xpath可以用来选择这7种节点。不过,下面的笔记只涉及最常用的第一种element(元素节点),因此可以将下文中的节点和元素视为同义词。
    一、xpath表达式的基本格式
    xpath通过"路径表达式"(Path Expression)来选择节点。在形式上,"路径表达式"与传统的文件系统非常类似。

斜杠(/)作为路径内部的分割符。

同一个节点有绝对路径和相对路径两种写法。

绝对路径(absolute path)必须用"/"起首,后面紧跟根节点,比如/step/step/...。

相对路径(relative path)则是除了绝对路径以外的其他写法,比如 step/step,也就是不使用"/"起首。

"."表示当前节点。

".."表示当前节点的父节点

二、选择节点的基本规则

  • nodename(节点名称):表示选择该节点的所有子节点

  • "/":表示选择根节点

  • "//":表示选择任意位置的某个节点

  • "@": 表示选择某个属性
    三、选择节点的实例
    先看一个XML实例文档。


<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
  <book>
    <title lang="eng">Harry Potter</title>
    <price>29.99</price>
  </book>
  <book>
    <title lang="eng">Learning XML</title>
    <price>39.95</price>
  </book>
</bookstore>

[例1]
bookstore :选取 bookstore 元素的所有子节点。
[例2]
/bookstore :选取根节点bookstore,这是绝对路径写法。
[例3]
bookstore/book :选取所有属于 bookstore 的子元素的 book元素,这是相对路径写法。
[例4]
//book :选择所有 book 子元素,而不管它们在文档中的位置。
[例5]
bookstore//book :选择所有属于 bookstore 元素的后代的 book 元素,而不管它们位于 bookstore 之下的什么位置。
[例6]
//@lang :选取所有名为 lang 的属性。
四、xpath的谓语条件(Predicate)
所谓"谓语条件",就是对路径表达式的附加条件。
所有的条件,都写在方括号"[]"中,表示对节点进行进一步的筛选。
[例7]
/bookstore/book[1] :表示选择bookstore的第一个book子元素。
[例8]
/bookstore/book[last()] :表示选择bookstore的最后一个book子元素。
[例9]
/bookstore/book[last()-1] :表示选择bookstore的倒数第二个book子元素。
[例10]
/bookstore/book[position()<3] :表示选择bookstore的前两个book子元素。
[例11]

//title[@lang] :表示选择所有具有lang属性的title节点。
[例12]
//title[@lang='eng'] :表示选择所有lang属性的值等于"eng"的title节点。
[例13]
/bookstore/book[price] :表示选择bookstore的book子元素,且被选中的book元素必须带有price子元素。
[例14]

/bookstore/book[price>35.00] :表示选择bookstore的book子元素,且被选中的book元素的price子元素值必须大于35。
[例15]
/bookstore/book[price>35.00]/title :表示在例14结果集中,选择title子元素。
[例16]
/bookstore/book/price[.>35.00] :表示选择值大于35的"/bookstore/book"的price子元素。
五、通配符

"*"表示匹配任何元素节点。

"@*"表示匹配任何属性值。

node()表示匹配任何类型的节点。

[例17]
//* :选择文档中的所有元素节点。
[例18]
// :表示选择所有第二层的元素节点。

[例19]
/bookstore/* :表示选择bookstore的所有元素子节点。

[例20]
//title[@*] :表示选择所有带有属性的title元素。
六、选择多个路径
用"|"选择多个并列的路径。
[例21]
//book/title | //book/price :表示同时选择book元素的title子元素和price子元素。

相关文章

  • xpath使用笔记

    xpath学习笔记 xpath简介 xpath 用于在XML文档中通过元素和属性进行导航xpath 使用路径表达式...

  • selenium xpath详解

    什么是 XPath? XPath 使用路径表达式在 XML 文档中进行导航, 使用路径表达式来选取 XML 文档中...

  • xpath和Css定位总结

    Xpath转Css写法图 Xpath等价于css的一些写法 Xpath路径表达式CSS选择器表达式只通过绝对路径、...

  • 5. XPath 解析库

    XPath XPath,全称XML Path Language,即XML路径语言,它提供简洁明了的路径选择表达式,...

  • XPath

    XPath 简介 什么是 XPath?XPath 使用路径表达式在 XML 文档中进行导航XPath 包含一个标准...

  • xpath 资料

    xpath路径表达式笔记 学爬虫利器XPath,看这一篇就够了 有感4月份,看过的python基础和爬虫相关的知识...

  • 利用Xpath提取HTML节点

    目录 什么是Xpath? 常见的Xpath中节点及节点间的关系 Xpath路径表达式(节选) 2018.3.28更...

  • XPath语法

    XPath 语法XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) ...

  • xpath 语法 使用

    XPath 语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path)...

  • XPath 解析 以及 re正则

    XPath 语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path)...

网友评论

    本文标题:xpath路径表达式笔记

    本文链接:https://www.haomeiwen.com/subject/bauoyxtx.html