def find_regular(content_raw):
"""去除内容中的各种信息"""
content_raw1 = content_raw.replace('#', ' ').replace('【', '').replace('】', '').replace('<p>', ' ').replace('</p>', ' ')
regular = re.compile(r'[a-zA-Z]+://[^\s]*[.com|.cn][/*\S*]*') # 去除网址
content = regular.sub('', content_raw1)
return content
网友评论