.
: 匹配除了换行符以外的任意字符
\d
: 匹配一位数字(0,或1,或2,或……)
\w
: 匹配字母或数字或下划线或汉字
\s
: 匹配任意的空白符
\W
: 匹配任意不是字母,数字,下划线,汉字的字符
\S
: 匹配任意不是空白符的字符
\D
: 匹配任意非数字的字符
\B
: 匹配不是单词开头或结束的位置
[\^x]
: 匹配除了x以外的任意字符
[\^aeiou]
: 匹配除了aeiou这几个字母以外的任意字符
?
: 重复零次或一次
{n,}
: 重复n次或更多次
*?
: 重复任意次,但尽可能少重复
+?
: 重复1次或更多次,但尽可能少重复
??
: 重复0次或1次,但尽可能少重复
{n,m}?
: 重复n到m次,但尽可能少重复
{n,}?
: 重复n次以上,但尽可能少重复
\bhi\b
: 精确地查找 hi 这个单词
\bhi\b.*\bLucy\b
: 先是一个单词hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词。
^\d{5,12}$
: 5位到12位数字
\^\w+
: 匹配 一行的第一个单词
\(?0\d{2}[) -]?\d{8}
: 匹配几种格式的电话号码,像 (010)88886666,或022-22334455,或 0291234567``
捕获
(exp)
: 匹配exp,并捕获文本到自动命名的组里
(?<name>exp)
: 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp)
: 匹配exp,不捕获匹配的文本,也不给此分组分配组号
后向引用用于重复搜索前面某个分组匹配的文本。例如, \1 代表分组1匹配的文本。
例如:\b(\w+)\b\s+\1\b
,可以用来匹配重复的单词,像go go, 或者kitty kitty。
可以指定子表达式的组名。要指定一个子表达式的组名,请使用这样的语法 (?<Word>\w+)
(或者把尖括号换成'也行: (?'Word'\w+)
) ,这样就把 \w+ 的组名指定为 Word了。
零宽断言
(?=exp)
: 匹配exp前面的位置
(?<=exp)
: 匹配exp后面的位置
(?!exp)
: 匹配后面跟的不是exp的位置
(?<!exp)
: 匹配前面不是exp的位置
\b\w+(?=ing\b)
,匹配以ing结尾的单词的前面部分(除了ing以外的部分),如查找 I'm singing while you're dancing. 时,它会匹配 sing 和 danc。
\b((?!abc)\w)+\b
, 匹配不包含连续字符串abc的单词。
(?<![a-z])\d{7}
, 匹配前面不是小写字母的七位数字。
注释
(?#comment)
: 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读
网友评论