美文网首页
xpath 获取标签下所有文本

xpath 获取标签下所有文本

作者: monpetitpays | 来源:发表于2019-01-18 00:46 被阅读0次

    在进行抓取网络信息的过程中,xpath 有两种获取文本的方式。

    • text()
    • ..xpath('string(.)')

    但这两种方式获取的文本会有细微的不同:

    <div class = 'a'>
      text1
      <br>
      text3
      <br>
      text4
      <br>
      text5
      <br>
    </div>
    

    此时 如果用html.xpath('//div[@class="a"]/text()'),将会得到text1
    如果想获取text1 text2 text3 text4 text5,可以用string

    data = html.xpath('//div[@class="a"]')
    alltext = data.xpath('string(.)')
    

    相关文章

      网友评论

          本文标题:xpath 获取标签下所有文本

          本文链接:https://www.haomeiwen.com/subject/suisrqtx.html