美文网首页
2018-10-23正则表达式

2018-10-23正则表达式

作者: _墨宇_ | 来源:发表于2018-10-23 20:49 被阅读0次

    正则表达式的语法

    用处:
    1.判断某个字符串是否符合某个条件
    ---判断输入的字符串是否是邮箱/手机号码,是否是ip地址(判断某个字符串是否符合某个规则)
    2.提取满足条件的字符串
    3.字符串的替换
    python中是通过re模块中相应的方法支持正则表达式的匹配,查找和替换功能
    正则表达式包含两个部分,一个是正则语法对应的字符,一个是普通字符

    正则表达式的特殊符号

    1 . (匹配任意字符)
    一个 . 只匹配一个任意字符

    from re import fullmatch
    re_str = r'a.b' #匹配一个长度为三,第一个为a,第二个为任意字符,最后一个是b 的字符串
    
    result = fullmatch(re_str,'acv')
    print(result) 
    

    2 \w(匹配数字字母下划线)
    一个\w匹配一个字符

    re_str = r'\w...' #匹配一个第一个是字母数字下划线,后面三个为任意字符的长度为四的字符串
    
    result = fullmatch(re_str,'accb')
    print(result)  #<_sre.SRE_Match object; span=(0, 4), match='accb'>
    
    

    3 \s(匹配任意一个空白字符)
    一个\s 匹配一个空白字符

    re_str = r'\w..\s.'  
    result = fullmatch(re_str,'_qw r')
    print(result) #<_sre.SRE_Match object; span=(0, 5), match='_qw r'>
    
    

    4 \d(匹配数字字符)

    re_str = r'\w\s..\d'
    result = fullmatch(re_str,'1 er2')
    print(result) #<_sre.SRE_Match object; span=(0, 5), match='1 er2'>
    

    5 \b (检测边界)
    一个\b不会去匹配一个字符,而是单纯检测\b出现的位置是否是单词边界
    单词边界:字符串的开始和结尾、空格、换行、标点符号等可以将两个单词隔开的字符都是单词边界

    re_str = r'\b\w\s\b\d.'
    result = fullmatch(re_str,'r 34')
    print(result) #<_sre.SRE_Match object; span=(0, 4), match='r 34'>
    

    6 ^(检测是否是字符串开头)

    re_str = r'^\w\s\b.\d'
    result = fullmatch(re_str,'r l5')
    print(result) #<_sre.SRE_Match object; span=(0, 4), match='r l5'>
    

    7 $(检测是否以字符串结尾)

    re_str = r'^\w.\d\s\b.$'
    result = fullmatch(re_str,'wu3 r')
    print(result) #<_sre.SRE_Match object; span=(0, 5), match='wu3 r'>
    

    8 \W ----匹配非字母数字下划线字符
    \S --- 匹配非空格字符
    \d ---- 匹配非数字字符

    9 [] (匹配中括号中出现的任意一个字符)
    [字符集] -- 匹配字符集中的任意一个字符
    [字符1-字符2] --- 匹配字符1到字符2范围内的字符
    注意: - 在中括号中,如果放在两个字符之间,表示范围。字符1的编码值要小于字符2的编码值

    
    # 匹配一个第一个字符是a或者b或者c,后面是三个a
    re_str = r'[abc]aaa'
    result = fullmatch(re_str,'aaaa')
    print(result)
    result = fullmatch(re_str,'baaa')
    print(result)
    
    re_str = r'[1-4]\d\d\d'
    result = fullmatch(re_str,'1456')
    print(result)
    # <_sre.SRE_Match object; span=(0, 4), match='aaaa'>
    # <_sre.SRE_Match object; span=(0, 4), match='baaa'>
    # <_sre.SRE_Match object; span=(0, 4), match='1456'>
    

    10 [^字符集] --- 匹配一个非中括号中字符的字符

    11 * (匹配0次或者多次)

    re_str = r'[1-9]*'
    result = fullmatch(re_str,'12123124141124')
    print(result)
    result = fullmatch(re_str,'')
    print(result)
    # <_sre.SRE_Match object; span=(0, 14), match='12123124141124'>
    # <_sre.SRE_Match object; span=(0, 0), match=''>
    

    12 + (匹配一次或者多次)

    re_str = r'[a-zA-Z_]+'
    result = fullmatch(re_str,'aW_weq')
    print(result)
    # <_sre.SRE_Match object; span=(0, 6), match='aW_weq'>
    

    13 ?(匹配0次或者1次)

    #练习: 写一个正则表达式,匹配所有的整数
    re_str = r'[-+]?[-1-9]+\b'
    result = fullmatch(re_str,'1234')
    print(result)
    #<_sre.SRE_Match object; span=(0, 4), match='1234'>
    

    14 {} (匹配指定次数)
    {n} ---- 匹配n次
    {m,n} ---- 匹配m到n次
    {m,} ---- 至少匹配m次
    {,n} ---- 最多匹配n次

    # 判断密码是否符合要求;密码是由数字和字母组成,并且6-16位
    re_str = r'[1-9a-zA-Z]{6,16}'
    result = fullmatch(re_str,'qwe123456')
    print(result)
    # <_sre.SRE_Match object; span=(0, 9), match='qwe123456'>
    

    正则表达式的分之和分组

    1 | (分之)
    条件1 | 条件2 --- 先用条件1区匹配,如果匹配成功,就匹配成功。
    如果条件1匹配失败,就用条件2匹配。
    注意: 如果条件1匹配成功就不会再用条件2再去匹配

    1. ()(分组)
      a.组合(将括号中的内容作为一个整体进行操作)
      b。捕获 --- 使用带括号的正则表达式匹配成功后,只获取括号中的内容
      c.重复--- 在正则表达式中,可以通过 \数字 来重复前面括号中来匹配到的结果.数字代表前面第几个分组
    a.组合,重复
    re_str = r'(\d{3})op\1'
    result = re.fullmatch(re_str,'123op123')
    print(result)
    # <_sre.SRE_Match object; span=(0, 8), match='123op123'>
    
    b.捕获
    

    re_str = r'(\d{3})'
    print(re.findall(re_str,'2131sadasda123asdas123xzx'))

    ['213', '123', '123']

    ####正则表达式re相关的方法
    1.compile
    
    compile(正则表达式字符串)   ---  将正则表达式字符串转换成正则表达式对象
    
    

    相关文章

      网友评论

          本文标题:2018-10-23正则表达式

          本文链接:https://www.haomeiwen.com/subject/ieaazftx.html