美文网首页
【原创】Beautifulsoup如何只提取标签内的文本

【原创】Beautifulsoup如何只提取标签内的文本

作者: 逢高_4882 | 来源:发表于2020-01-15 09:03 被阅读0次

示例

如下代码,只提取div里的文本,不提取span里的文本


from bs4 import BeautifulSoup

s='''
<div>
<span> 添加时间:</span>
" 26分钟前"
<br>
<span> 作者:</span>
" 陈冠希"
<br>
</div>
'''

soup=BeautifulSoup(s,'html5lib')
div=soup.find('div')
print([text.strip() for text in div.find_all(text=True) if text.parent.name !='span' and text.strip()])

输出结果

相关文章

网友评论

      本文标题:【原创】Beautifulsoup如何只提取标签内的文本

      本文链接:https://www.haomeiwen.com/subject/dwnzactx.html