XPath:一门在 XML 文档中查找信息的语言。
学习要求:html、css、js,简单了解即可。
xpath教程
XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。
XML 文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。
节点关系:父(Parent)、子(Children)、兄弟(Sibling)、祖先(Ancestor)、子孙(Descendant)。
基本语法:
python xpath的学习
Python Xpath解析库
简单示例:
from lxml import etree
xml_string = '''
<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>
<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>
page = etree.HTML(xml_string.lower())
book = page.xpath(u'//bookstore/book[position()<3]')
print(book)
网友评论