美文网首页
python 正则表达式:只保留字符串中的中英文和数字

python 正则表达式:只保留字符串中的中英文和数字

作者: 张沐之_ | 来源:发表于2018-06-07 20:19 被阅读0次

    问题描述

    在做字符串比较的时候,一般不希望有特殊字符。比如:我要判断“某某(集团)股份有限公司”是否是上市公司,这时我便需要将该字符串和上市公司池的的字符串进行比较。但如果我这里的是中文的,二上市公司池里的却是英文的字符(,便会导致做出该公司不是上市公司的误判。所以,在进行比较前,需要去除这样的无实际意义的字符。

    解决方法

    正则表达式

    import re
    cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
    string1 = '@ad&*jfad张132(www)。。。'
    string1 = cop.sub('', string1) #将string1中匹配到的字符替换成空字符
    

    参考

    https://blog.csdn.net/github_37412255/article/details/78499071

    相关文章

      网友评论

          本文标题:python 正则表达式:只保留字符串中的中英文和数字

          本文链接:https://www.haomeiwen.com/subject/dzdnsftx.html