最近研究爬虫的时候,发现chrome也支持xpath,用法如下,在console中输入
$x("//h1")
即可定位到第一个h1元素。
image.png
xpath常用语法
1.定位元素
使用/ 或者//定位元素,如果路径以/开始,代表相对于一个元素的绝对路径,如果路径以//开始,则表示选择文档中所有符合该条件的元素。
/div/p/a # 表示选择div元素下p元素的a子节点
/div//a # 表示选择div元素下所有的后代节点中的a节点。
2.选择未知元素
使用通配符*
选择未知元素。
/div/* # 选择div元素下所有的子节点。
/*/*/a # 选择具有两个父元素的所有a节点。
//** 选中所有元素。
3.选择分支
通过在XPath表达式中使用方括号可以进一步地指定一个元素。
/div/p[1] # 选择div下第一个p节点。
/div/p[last()] # 选择最后一个元素
4.选择多个路径
使用| 选择多个路径。
/div/p | div/a
5.选择属性
使用@
选择属性。
//@country #选中所有名为country的属性
//a[@href="www.baidu.com'] # 选中所有href为百度的链接。
网友评论