XML
XML指可扩展标记语言(EXtensible Markup Language)
XML和HTTP的区别
区别.jpgXpath
Xpath(XML Path Language)是一门在XML文档中查找信息的语言,可用来在XML文档中对元素和属性进行遍历
- / :从根节点选取
- // :从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
- . :选取当前节点
- .. :选取当前节点的父节点
- @:选取属性
Xpath的使用
1、安装lxml
pip install lxml
lxml 是一个HTML/XML的解析器,主要的功能是如何解析和提取HTML/XML数据
2、使用
from lxml import etree
html = etree.HTML(text)
content = html.xpath('xpath表达式')
网友评论