美文网首页
正则表达式

正则表达式

作者: 丫丫姑娘_b55e | 来源:发表于2018-07-03 17:48 被阅读0次
    正则表达式主要用于字符串的查找、匹配、分割

    match(正则表达式字符串,需要匹配的字符串)

    1.不带任何正则符号的正则表达式
    str1 = 'abc'
    print(re.match('abc', str1))

    1. . ---> 匹配任意的字符
      r'a.c' abc

    2. \w ---> 匹配字母、数字、下划线
      r 'g\w\wd '

    3. \s ---> 匹配空白字符(包括空格(\r)、制表符(\t)和回车(\n)等)

    4. \d ----> 匹配数字
      r'\d\d' 匹配前两位必须是数字的字符

    5. \b ---> 匹配单词边界(字符串的开始和结束、空格、标点符号 * 注意:\b是不能匹配出结果的,只是对需要出现边界的要求)

       re_str = '\bhow\b'
       print(re.match(r'\bhow\b', 'how~are you' ))
      
    6. ^ ---> 匹配开头
      ' ^the' ---> 匹配以the开头的字符

    7. () ---> 匹配字符串结束
      ' the $' ---> 匹配字符串以the结束

    8. /相应的大写字母 ----> /相应的小写字母的功能取反

    9. [ ]
      [ ] ---> 匹配[ ]中的任意一个字符
      [ ]中可以是具体的字符也可以是正则符号
      一个[ ]只能匹配一位的字符

    10. [ ^ ]
      [ ^ ] --> 匹配不在[ ]中的任意的一个字符
      re_str = r'[^abc]123'
      匹配第一个字符不是'b'或者'b'或者'c',后面是123的字符串

    11. ' * ' --> 匹配0次或者多次
      r ' a* ' ---> 匹配第一个字符是0个'a'或者多个'a'
      r'\d*' ---> 匹配第一个字符是0个或者多个数字;'cc','1cc','123abc'

    12. '+ ---> 匹配一次或者多次
      r'a+' --> 匹配第一个字符串开头是一个'a'或者多个'a': 'acc','aacc', 'aaadjk'
      r'\w+' ---> 前面是一个或者多个字母数字下划线

    13. ? ---> 匹配0次或者1次
      ? ---> 匹配0次或者1次
      r'a?123' ---> 匹配一个字符串'123'前有一个'a'或者没有字符

    14. { }
      {N} ---> 匹配N次

    写一个正则表达式完全匹配一个11位的数字字符串
    re_str = r'\d{11}$'
    print(re.match(re_str, '12637898276'))

    • {M,} --> 匹配至少M次
      r'\d{3,}' --> 匹配字符串开始是三个或者三个以上的数字;'123abc','12345abc'
    • {M,N} --> 匹配至少M次,最多N次

    要求密码是6到16位,由字母数字下划线组成
    re_str = r'\w{6,16}'
    print(re.match(re_str, 'anhajs'))

    判断一个字符串是否是标识符(字母、数字、下划线组成,数字不开头)
    [a-z]: 是字母'a'到'z'中的任意一个
    [A-Z]: 是字母'A'到'Z'中的任意一个
    [1-9]: 是数字'1'到'9'中的任意一个
    [a-zA-Z_]: 字母或者下划线
    re_str = r'[a-zA-Z_]\w*$'

    1. |
      | ---> 分支 (相当于逻辑运算符中的'or')
      r'(a|b)abc' ---> 匹配第一个字符是a或者b,后面是abc
      r'(\d{3})|([a-zA-Z]{3})' ---> 匹配开头是三个数字或者是哪个字母
    2. '
      '
      ?---> 重复任意次,尽可能少的匹配
      r'a*?' ---> 'aabc' 0
    3. ' +
      +? ---> 重复一次或者多次,尽可能少的匹配
      r'a+?' ---> 'aabc' 1

    总结?:就是在重复多次的匹配中如果后面加?,匹配的时候以能匹配的最少次数去匹配

    判断一个字符串是否是浮点数

    str1 = '+0.56'  # '0.23'
    result = re.match(r'[+-]?(0\.\d+)|([1-9]\d*\.\d+)',   str1)
    print(result)
    

    注意:正则表达式中如果需要使用有特殊功能的字符,需要使用''进行特殊说明
    . --> . * --> * + ---> + [-->[ ]--->]等
    []字符集中的特殊字符不需要加''来说明其为一个普通字符功能

    相关文章

      网友评论

          本文标题:正则表达式

          本文链接:https://www.haomeiwen.com/subject/lbdjuftx.html