美文网首页
re模块的正则表达式

re模块的正则表达式

作者: a898311 | 来源:发表于2016-04-28 20:39 被阅读0次

    正则表达式的元字符有. ^ $ * ? { [ ] | ( )

    .表示任意字符,普通模式下匹配除换行符以外的所有字符
    []用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可以理解成或的关系。
    ^ 如果放在字符串的开头,则表示取非的意思。[^5]表示除了5之外的其他字符。而如果^不在字符串的开头,则表示它本身。

    重复功能的元字符


    * 对于前一个字符重复0到无穷次
    + 对于前一个字符重复1到无穷次
    ? 对于前一个字符重复0到1次
    {m,n} 对于前一个字符重复次数在为m到n次,其中,{0,} = *,{1,} = , {0,1} = ?
    {m} 对于前一个字符重复m次
    \d 匹配任何十进制数;它相当于类 [0-9]。
    \D 匹配任何非数字字符;它相当于类 [^0-9]。
    \s 匹配任何空白字符;它相当于类 [ fv]。
    \S 匹配任何非空白字符;它相当于类 [^ fv]。
    \w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
    \W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]。
    

    通过元字符的组合可以编译成正则表达式:
    1.元字符([ ]),它用来指定一个character class。字符(character)可以单个的列出,也可以通过”-“来分隔两个字符来表示一个范围。例如,[abc]匹配a,b或者c当中任意一个字符,[abc]也可以用字符区间来表示[a-c].如果想要匹配单个大写字母,你可以用 [A-Z]。
    2.元字符(),元字符backslash。做为 Python 中的字符串字母,反斜杠后面可以加不同的字符以表示不同特殊意义。
    它也可以用于取消所有的元字符,这样你就可以在模式中匹配它们了。例如,如果你需要匹配字符 “[” 或 “\”,你可以在它们之前用反斜杠来取消它们的特殊意义: [ 或 \
    3.元字符($)匹配字符串的结尾或者字符串结尾的换行之前。(在MULTILINE模式下,”$”也匹配换行之前)

    正则表达式”foo”既匹配”foo”又匹配”foobar”,而”foo$”仅仅匹配”foo”.

    教程

    相关文章

      网友评论

          本文标题:re模块的正则表达式

          本文链接:https://www.haomeiwen.com/subject/mayhrttx.html