美文网首页
正则表达式入门

正则表达式入门

作者: 五秋木 | 来源:发表于2017-11-11 22:37 被阅读0次
    正则表达式的语法1 正则表达式的语法2

    在sublime中正则匹配中文汉字:\u即可
    在python中匹配中文:[\u4e00-\u9fa5],正确与否,待验证

    主要功能函数

    测试代码如下:

    import re
    
    # re.search返回第一个match对象,搜索匹配正则表达式的第一个位置
    match1 = re.search(r'[1-9]\d{5}', 'BIT 100081')
    if match1:
        print(match1.group(0))
    
    # 从字符串的第一个位置开始匹配正则表达式,返回match对象
    match2 = re.match(r'[1-9]\d{5}', '100081 BIT')
    if match2:
        print(match2.group(0))
    
    # 搜索字符串,以列表形式返回全部能匹配的子串
    ls = re.findall(r'[1-9]\d{5}', '100081 BIT BIT 100084 100085')
    if ls:
        print(ls)
    
    # 分割字符串,按照正则表达式的形式,返回列表形式,去掉匹配的部分
    sp = re.split(r'[1-9]\d{5}', '100081 BIT 100078 TSU100084 ')
    print(sp)
    
    
    sp2 = re.split(r'[1-9]\d{5}', '100081 BIT 100078 TSU100084 ', maxsplit=1)
    print(sp2)
    
    # 迭代类型:匹配内容
    for m in re.finditer(r'[1-9]\d{5}', "BIT100081 TsU100084"):
        if m:
            print(m.group(0))
    
    # 替换string字符串,用新的字符串repl来替换匹配字符串pattern匹配成功部分
    re.sub(r'[1-9]\d{5}', ':zipcode', 'BIT100081 TUS100083')
    
    正则表达式的等价使用
    regex = re.compiler(r'[1-9]\d{5}') 等价使用方法

    match对象


    Re库的match对象的属性
    Re库的match对象的方法

    当匹配结果是多个字符串时,默认匹配最长的,即贪婪匹配
    最小字符串匹配:

    相关文章

      网友评论

          本文标题:正则表达式入门

          本文链接:https://www.haomeiwen.com/subject/arvgmxtx.html