问题描述
在做字符串比较的时候,一般不希望有特殊字符。比如:我要判断“某某(集团)股份有限公司”是否是上市公司,这时我便需要将该字符串和上市公司池的的字符串进行比较。但如果我这里的(
是中文的,二上市公司池里的却是英文的字符(
,便会导致做出该公司不是上市公司的误判。所以,在进行比较前,需要去除(
这样的无实际意义的字符。
解决方法
正则表达式
import re
cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
string1 = '@ad&*jfad张132(www)。。。'
string1 = cop.sub('', string1) #将string1中匹配到的字符替换成空字符
参考
https://blog.csdn.net/github_37412255/article/details/78499071
网友评论