正则表达式
\w 匹配字母数字及下划线的字符
\w 匹配额不是字母、数字、下划线字符
\s 匹配任意空白字符,等价于[\t\n\r\f]
\S 匹配任意非空字符
\d 匹配任意数字,等价于[0-9]
\D 匹配任意非数字的字符
\A 匹配字符串开头
\Z 匹配字符串结尾,如果存在换行,只匹配到换行钱的结束字符串
\z 匹配字符串结尾,如果存在晃晃,同事还会匹配换行符
\G 匹配最后匹配完成的位置
\n 匹配一个黄航符
\t 匹配一个制表符
^ 匹配字符串的开头
$ 匹配字符串的结尾
. 匹配任意字符
[...] 匹配中括号中的任意一个
[^...] 匹配不在[]中括号的字符
* 匹配0个或多个
+ 匹配一个或多个
? 匹配0个或一个
{n} 精确匹配n个前面的表达式
{n,m} 匹配n次到m次,贪婪模式
a|b 匹配a或b
() 匹配括号内的表达式
修饰符
re.I 使匹配对大小写不敏感
re.L z做本地化识别 (locale-aware)匹配
re.M 多行匹配,影响^和$
re.S 使.匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响\w \W \b \B
match()方法 从开始位置开始匹配 第一个参数传入了正则表达式,第二个参数传入了要匹配的字符串
结果是SRE_Match对象,该对象有两个方法,group()方法可以输出匹配到的内容,span()方法可以输出匹配的范围,匹配到的结果字符串在原字符串中的位置范围
search() 匹配时会扫描整个字符串,然后返回第一个成功的结果,如果未找到,就返回None
findall() 匹配多个内容,返回列表
sub() 根据正则替换内容 第一个参数正则表达式 第二个参数替换的字符串 第三个参数需要匹配的字符串
compile() 方法可以将正则字符串编译成正则表达式对象,以便在后面的匹配复用
网友评论