认识正则表达式

作者: NiceBlueChai | 来源:发表于2017-11-01 19:12 被阅读48次

正则表达式是处理字符串的强大工具，拥有独特的语法和独特的处理引擎，效率可能不如str自带的方法，但功能十分强大。

特殊字符类子正则表达式中的应用

实例	描述
.	匹配除"\n"之外的任何单个字符。要匹配包括"\n"在内的任意字符，请使用如"[.\n]"的模式
\A	匹配字符串开始
\b	匹配一个字边界，即字与空格间的位置。
\B	非字边界匹配。
\d	匹配数字字符，等价于[0-9]
\D	匹配一个非数字字符，等价于[^0-9]
\s	匹配任意空白字符，包括空格，制表符，换页符等，等价于[\f\n\r\t\v]
\G	匹配最后完成的位置
\S	匹配任意非空白字符，等价于[^\f\t\n\v\r]
\w	匹配包括下划线的任意单词字符，等价于[a-zA-Z0-9]
\W	匹配任意非单词字符，等价于[^a-zA-Z0-9]
\z	匹配字符串结束
\Z	匹配字符串结束，如果存在换行，就只匹配到换行结束前的字符

字符类在正则表达式中的应用

非打印字符
非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列

字符	描述
\cx	匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
\f	匹配一个换页符。等价于 \x0c 和 \cL。
\n	匹配一个换行符。等价于 \x0a 和 \cJ。
\r	匹配一个回车符。等价于 \x0d 和 \cM。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t	匹配一个制表符。等价于 \x09 和 \cI。
\v	匹配一个垂直制表符。等价于 \x0b 和 \cK。

模式修正

所谓模式修正符，即可以在不改变正则表达式的情况下，通过模式修正符改变正则表达式的含义，从而实现一些匹配结果的条正等功能。比如，可以使用修正符I让匹配时不区分大小写
常见的模式修正符及其含义

符号	含义
I	匹配时忽略大小写
M	多行匹配
L	做本地化识别匹配
U	根据Unicode字符集解析字符
S	让.匹配包括换行符，即用了该模式修正后，"."匹配就可以匹配任意字符了