美文网首页
day18正则表达式2

day18正则表达式2

作者: 星龙断月 | 来源:发表于2019-01-22 08:30 被阅读0次

    一、贪婪

    什么是非贪婪:在正则中控制匹配不确定次数的符号后边可以加?,来表示尽可能少的匹配
    在贪婪的时候,匹配是尽可能多的匹配
    注意:尽可能少是在能够匹配到的前提下尽可能少
    *?
    +?
    ??
    {M,}?
    {N,M}?
    {,N}?

        print(re.search(r'\d+', 'abchs3482==sdd'))
        print(re.search(r'\d+?', 'abchs3482==sdd'))
    
        print(re.search(r'"name":".*?",', '====,"name":"yuting","age":18, "爱好":"编程",....'))
    

    二、re模块

    1. compile(正则表达式) -> 将正则表达式转换成正则对象

    编译后可以直接通过对象调用相关的对象方法

        re_object = re.compile(r'\d{3}')
        re_object.fullmatch('432')
    

    2. fullmatch(正则表达式, 字符串) -> 让字符串和正则表达式完全匹配,匹配成功返回匹配对象,匹配失败返回None

    应用:检测字符串内容是否符合要求,例如:检测账号、密码、判断手机号、身份证号等是否合法

        result = re.fullmatch(r'(\d{3})=([a-z]+)', '342=sjaks')
        print(result)
    

    匹配对象

    1).span() - 匹配到的字符串在原字符串中的下标范围(结果是元素)
        print('====span====')
        print(result.span())   # 获取整个正则表达式匹配到的内容的范围
        # start, end = result.span()
        # print(start, end)
    
        print(result.span(1))  # 获取正则表达式中第一个分组匹配到的内容的范围
        print(result.span(2))  # 获取正则表达式中第二个分组匹配到的内容的范围
    
    2). start()和end() - 匹配到的字符串在原字符串中的开始下标和结束下标
        print('====start名,end====')
        print(result.start(), result.end())
        print(result.start(1), result.start(2))
    
    3). group() - 获取匹配到的字符串(结果是字符串)
        print(result.group())   # 获取整个正则匹配到的字符串
        print(result.group(1))  # 获取第一个分组匹配到的字符串
        print(result.group(2))  # 获取第二个分组匹配到的字符串
        print(result.groups())  # 同时获取所有分组匹配到的字符串(结果是元祖)
    
    4). string - 获取原字符串

    print(result.string)

    3.match(正则表达式,字符串) -> 让字符串的开头和正则表达式进行匹配,匹配成功结果是匹配对象,否则是None

    print(re.match(r'\D\d', 's3skjkjks'))

    4.search(正则表达式,字符串) -> 在字符串中去匹配出第一个符合正则表达式的子串, 匹配成功结果是匹配对象,否则是None

        print(re.search(r'[\u4e00-\u9fa5]{3}', 'hsj后视ss023你好吗,skss上的30s'))
    

    5.split(正则表达式,字符串) -> 将字符串按照满足正则要求的子串进行切割(返回值是列表)

        print(re.split(r'\d+', 'asj38jkas0093kjsj78kajs89==asdfj3jkkss'))
    

    6.sub(正则表达式,字符串1, 字符串2) -> 将字符串2中能够和正则表达式匹配的子串替换成字符串1,产生一个新的字符串

        print(re.sub(r'\d+', '*', 'jsj93jksj93j5a45s3s是看得见'))
        print(re.sub(r'傻逼|[傻艹草操]', '*', '你是傻逼吗?艹!'))
    

    7.findall(正则表达式, 字符串) -> 在字符串中获取满足正则表达式的所有的子串(结果是列表)

    注意: 如果正则表达式中有分组,直接获取到的是分组中匹配到的内容; 如果有多个分组列表中的元素是元祖

        print(re.findall(r'\d+[a-z]', 'sjh83bkss93ksjhf9922'))
        print(re.findall(r'(\d+)[a-z]', 'sjh83bkss93=sjhf9922'))
        print(re.findall(r'abc(\d{2}|[A-Z]{2})', '=-aaabc73kkjabcKJL=3'))
    

    8.finditer(正则表达式, 字符串) -> 在字符串中获取满足正则表达式的所有的子串(结果是迭代器,元素是匹配对象)

        result = re.finditer(r'(\d+)[a-z]', 'sj8khk83jks数据310sj=sd')
        print(result)
        print(next(result).group())
    

    9.re.I -> 忽略大小写

    匹配的约束条件是放在函数的flags参数中的
    print(re.fullmatch(r'[a-z]{2}', 'SA', re.I))
    练习

    验证输入用户名和QQ号是否有效并给出对应的提示信息

    要求:
    用户名必须由字母、数字或下划线构成且长度在6~20个字符之间
    QQ号是5~12的数字且首位不能为0

        re_str1 = r'[a-zA-Z\d_]{6,20}'
        re_str2 = r'[1-9]\d{4,11}'
    

    相关文章

      网友评论

          本文标题:day18正则表达式2

          本文链接:https://www.haomeiwen.com/subject/ilyhjqtx.html