美文网首页
python正则表达式1

python正则表达式1

作者: 闲云野鹤_23dd | 来源:发表于2021-03-22 05:30 被阅读0次

    python正则表达式1

    re 模块

    re 模块使 Python 语言拥有全部的正则表达式功能。
    可用于匹配文字,校验数据等

    正则表达式 字符含义

    常用:

    正则字符 含义
    ^ 匹配字符串的开头
    $ 匹配字符串的末尾。
    . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
    […] 用来表示一组字符,单独列出:[amk] 匹配 ‘a’,‘m’或’k’
    [^…] 不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
    re* 匹配0个或多个的表达式。
    re+ 匹配1个或多个的表达式。
    re? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
    re{n} 匹配n个前面表达式。例如,"o{2}“不能匹配"Bob"中的"o”,但是能匹配"food"中的两个o。
    re{n,} 精确匹配n个前面表达式。例如,"o{2,}“不能匹配"Bob"中的"o”,但能匹配"foooood"中的所有o。"o{1,}“等价于"o+”。"o{0,}“则等价于"o*”。
    re{n,m} 匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
    a b 匹配a或b
    (re) 匹配括号内的表达式,也表示一个组

    不常用:

    • (?imx) 正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。
    • (?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
    • (?: re) 类似 (…), 但是不表示一个组
    • (?imx: re) 在括号中使用i, m, 或 x 可选标志
    • (?-imx: re) 在括号中不使用i, m, 或 x 可选标志
    • (?#…) 注释.
    • (?= re) 前向肯定界定符。如果所含正则表达式,以 … 表示,在当前位置成功匹配时成功,否则失败。但一旦所含表达式已经尝试,匹配引擎根本没有提高;模式的剩余部分还要尝试界定符的右边。
    • (?! re) 前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功。
    • (?> re) 匹配的独立模式,省去回溯。
    • \w 匹配数字字母下划线
    • \W 匹配非数字字母下划线
    • \s 匹配任意空白字符,等价于 [\t\n\r\f]。
    • \S 匹配任意非空字符
    • \d 匹配任意数字,等价于 [0-9]。
    • \D 匹配任意非数字
    • \A 匹配字符串开始
    • \Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串。
    • \z 匹配字符串结束
    • \G 匹配最后匹配完成的位置。
    • \b 匹配一个单词边界,也就是指单词和空格间的位置。例如, ‘er\b’ 可以匹配"never" 中的 ‘er’,但不能匹配 “verb” 中的 ‘er’。
    • \B 匹配非单词边界。‘er\B’ 能匹配 “verb” 中的 ‘er’,但不能匹配 “never” 中的 ‘er’。
    • \n, \t, 等。 匹配一个换行符。匹配一个制表符, 等
    • \1…\9 匹配第n个分组的内容。
    • \10 匹配第n个分组的内容,如果它经匹配。否则指的是八进制字符码的表达式。

    正则实战

    re.match()

    re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。

    re.match(pattern, string, flags)
    
    

    pattern: 正则表达式
    string: 要匹配的字符串
    flags: 可选参数,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等

    flags参数及含义

    • re.I 使匹配对大小写不敏感
    • re.M 多行匹配,影响 ^ 和 $
    • re.S 使 . 匹配包括换行在内的所有字符

    例子

    ‘测试’ 不在字符的开头位置,就匹配不到

    匹配到后,会返回一个Match对象,里面有个span()方法,可以返回 匹配字符在 被匹配字符 的开始和结束索引

    匹配不到的话,返回None

    import re
    
    match = re.match('软件', '软件测试工程师') # 在起始位置匹配
    print(match)
    print(match.span())
    
    print(re.match('测试', '软件测试工程师'))         # 不在起始位置匹配
    
    

    输出

    <re.Match object; span=(0, 2), match='软件'>
    (0, 2)
    None
    
    

    相关文章

      网友评论

          本文标题:python正则表达式1

          本文链接:https://www.haomeiwen.com/subject/zgwdzktx.html