美文网首页
XPATH 学习记录

XPATH 学习记录

作者: 有你有我 | 来源:发表于2017-03-25 10:45 被阅读33次

xpath 是把文档结构看成类似于文件夹的树形结构来进行处理的。

基本的元素表示

/ 根目录

// 任意目录

.   当前目录

..  选取目录的父目录(可以利用父目录选择同胞目录)

//@

@属性值

* 任何元素

@* 任何属性

举例子

//dl[@class="menu"]   ,选择<dl class="menu"></dl>

./dt//text()   ,选择当前选择下dt节点之下的文字内容

//ul[@class="news_list"]//@href    选择ul  class="news_list"下所有的链接的href值(后面的//@href表示取他的值)

所谓的XPTH“正则”

利用通配符 *  node()  和函数 ends-with,starts-with,contains完成简单正则匹配。

//div[@*]  表示所有带有属性的div标签

//node()[starts-with(name(),"addr")] 任意目录下

比如搜索所有含有onlick属性的以look开头的

//*[starts-with(@onclick, "look")]  任意目录下onclick属性值以look开头

注意:

scrapy使用xpath匹配后,虽然还是xpath对象,但是其他内容还是存在的,所有在选择目录是

如果在这个里面选择content,使用./content,而不是/content

相关文章

  • XPATH 学习记录

    xpath 是把文档结构看成类似于文件夹的树形结构来进行处理的。 基本的元素表示 / 根目录 // 任意目录 . ...

  • xpath使用笔记

    xpath学习笔记 xpath简介 xpath 用于在XML文档中通过元素和属性进行导航xpath 使用路径表达式...

  • 2018-10-18jement连接数据库

    xpath学习

  • Python爬虫-数据解析学习笔记之xpath

    1、xpath学习笔记 1)xpath描述   xpath(XML Path Language)是一门在XML和H...

  • 30.XPath

    学习要点: 1.IE 中的 XPath2.W3C 中的 XPath3.XPath 跨浏览器兼容 XPath 是一种...

  • Python爬虫(十三)_案例:使用XPath的爬虫

    本篇是使用XPath的案例,更多内容请参考:Python学习指南 案例:使用XPath的爬虫 现在我们用XPath...

  • 【Python爬虫】-【第四周】02-作业

    学习xpath语法 XPath 语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿...

  • Xpath用法记录

    1.last()匹配当前节点数组的最后一项 1 2 3 //li[last()] 匹配内容为3的li 2.c...

  • xpath学习

    1、xpath的简介 xpath是一门语言,它通过元素和属性来在xml文件中定位信息,在 XPath 中,有七种类...

  • xpath学习

    什么是 XPath XPath是一门在XML文档中查找信息的语言. XPath用于在XML文档中通过元素和属性进行...

网友评论

      本文标题:XPATH 学习记录

      本文链接:https://www.haomeiwen.com/subject/shlltttx.html