正则表达式(Regular Expression)在代码中一般简写为regex、regexp或re。在很多文本编译器中,正则表达式通常被用来检索、替换那些符合某种模式的文本。
正则表达式最常见的特殊符号和字符即所谓的元字符。
![](https://img.haomeiwen.com/i24337984/728ef7d9ddba12b1.jpg)
行定位符“^”表示行的开始,“$”表示行的结束。如“^Python”能够匹配字符串“python我会用”,但是不能匹配字符串“我会用Python”;“喜欢$”能够匹配字符串“我很喜欢”,但是不能匹配字符串“我很喜欢你”。“^”在方括号“[]”中使用时,表示的是不接收该字符集合,例如,“[^a-z]”能够匹配不在a~z范围内的任意字符。
元字符“.”表示匹配除换行符\n之外的任意字符。例如,正则表达式“b.g”能够匹配“big”“bug”“b g”,但是不能匹配“bug”;“b..g”可以匹配“bug”。
元字符“()”表示将小括号内的内容当作一个整体,括起来的表达式被定义为“组”,具有改变优先级和定义提取组两个作用。例如,“(p|b)ig”匹配的是“pig”“big”。
限定符“*”表示匹配位于“*”之前的0个或多个字符。例如,正则表达式“p*ig”能够匹配“ig”“ppig”“pig”等。
限定符“+”表示匹配位于“+”之前的一个或多个字符。例如,正则表达式“pig+”能够匹配“pig”“pigg”,但是不能匹配“pi”。
网友评论