美文网首页
python3 xpath获取页面注释的方法

python3 xpath获取页面注释的方法

作者: 朝畫夕拾 | 来源:发表于2020-08-18 16:13 被阅读0次

from lxml import etree

html_str = """

<div id="box1">this from blog.csdn.net/lncxydjq , DO NOT COPY!

<div id="box2">*****

<!--can u get me, bitch?-->

</div>

</div>

"""

html = etree.HTML(html_str)

print html.xpath('//div[@id="box1"]/div/node()')[1]

print type(html.xpath('//div[@id="box1"]/div/node()')[1])

print html.xpath('//div[@id="box1"]/div/node()')[1].text

"""output:

<!--can u get me, bitch?-->

<type 'lxml.etree._Comment'>

can u get me, bitch?

"""

相关文章

  • python3 xpath获取页面注释的方法

    fromlxmlimportetreehtml_str=""" this from blog.csdn.net/l...

  • xpath获取当前节点的父节点,兄弟节点的方法

    xpath获取当前节点的父节点,兄弟节点的方法: xpath=\"//XCUIElementTypeStaticT...

  • 爬虫 之 xpath

    xpath是爬虫中一种分析页面数据的方法之一,可以补全非标准的html页面,方便获取数据,运用起来也比较简单, 首...

  • lxml结合xpath注意事项

    1.使用Xpath语法,应该使用Element.xpath方法,来执行xpath选择 示例代码如下: 2.获取某个...

  • 自动化脚本测试遇到的问题

    一、获取页面的表格有多少行 List rows =driver.findElements(By.xpath("//...

  • AppiumLibrary获取元素-xpath

    AppiumLibrary的获取元素基础方法和api见官方文档 xpath: appium里的xpath也是遵循x...

  • python3-注释

    Python3 注 确保对模块, 函数, 方法和行内注释使用正确的风格 Python中的注释有单行注释和多行注释:...

  • js 父子元素的调用

    一. jquery 的父子页面间元素的获取和方法调用: 父页面获取子页面元素: 父页面调用子页面方法: 子页面获取...

  • 常用的xpath

    xpath的模糊查询 选取同级节点 获取父级节点 xpath定位 列表时间筛选 xpath获取标签 xpath的s...

  • 网络爬虫(六)

    xpath解析原理 实例化etree对象,将页面源码传给该对象。 用生成的etree对象,调用xpath方法和xp...

网友评论

      本文标题:python3 xpath获取页面注释的方法

      本文链接:https://www.haomeiwen.com/subject/kzrkjktx.html