美文网首页
Python去除文章或评论中的无用信息(网址、字符)

Python去除文章或评论中的无用信息(网址、字符)

作者: 无量儿 | 来源:发表于2021-12-29 14:25 被阅读0次
def find_regular(content_raw):
    """去除内容中的各种信息"""
    content_raw1 = content_raw.replace('#', ' ').replace('【', '').replace('】', '').replace('<p>', ' ').replace('</p>', ' ')
    regular = re.compile(r'[a-zA-Z]+://[^\s]*[.com|.cn][/*\S*]*')  # 去除网址
    content = regular.sub('', content_raw1)
    return content

相关文章

网友评论

      本文标题:Python去除文章或评论中的无用信息(网址、字符)

      本文链接:https://www.haomeiwen.com/subject/hjvvqrtx.html