re.sub

作者: 青铜搬砖工 | 来源:发表于2019-07-17 09:35 被阅读0次

re.sub比replace好用太多了
比如,去掉下面的a标签

import re
test_str = '''
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
'''
result = re.sub('<a.*?>|</a>','',test_str)
print(result)

结果如下

<li data-view="7”>
沧海一卢笑 
</li> 
<li data-view="7”>
沧海一卢笑 
</li> 
<li data-view="7”>
沧海一卢笑 
</li> 

先使用sub处理一下然后在提取数据可能会达到事半功倍的效果.

相关文章

网友评论

      本文标题:re.sub

      本文链接:https://www.haomeiwen.com/subject/fpmflctx.html