美文网首页
当某些HTML文本内容无法被etree.HTML解析时

当某些HTML文本内容无法被etree.HTML解析时

作者: sexy_cyber | 来源:发表于2024-03-06 03:21 被阅读0次
  • 下面的代码有时候会遇到tree是None的情况
tree = etree.HTML(res.text)
  • 用beautifulsoup来替代
    比如获取标签属性为"NEXT_DATA"的script标签的文本内容
    res = requests.get(url,headers=headers)
    soup = BeautifulSoup(res.text, 'html.parser')
    target_script = soup.find("script", id="__NEXT_DATA__")
    if target_script:
        # 提取目标script标签的文本内容
        target_script_text = target_script.text

相关文章

网友评论

      本文标题:当某些HTML文本内容无法被etree.HTML解析时

      本文链接:https://www.haomeiwen.com/subject/qrqjzdtx.html