总结语法如下:
1、‘^’,开始字符:"^The":表示所有以"The"开始的字符串("There","The cat"等);
2、‘$’,结束字符:"of despair$":表示所以以"of despair"结尾的字符串;
3、二者都没有:"notice":表示任何包含"notice"的字符串;
4、‘*’,表示重复前面一个字符,0次或者多次
5、‘+’,表示重复前面一个字符,1次或者多次
6、‘?’,表示重复前面一个字符,0次或者1次
11、"d": 匹配数字:
例如要匹配一个固定格式的电话号码以0开头前4位后7位,如0737-5686123 正则:^0ddd-ddddddd$ 这里只是为了介绍"d"字符,实际上有更好的写法。
12、"w":匹配字母,数字,下划线:
例如我要匹配"a2345BCD__TTz" 正则:"w+" 这里的"+"字符为一个量词指重复的次数,稍后会详细介绍。
13、"s":匹配空格 :
例如字符 "a b c" 正则:"wswsw" 一个字符后跟一个空格,如有字符间有多个空格直接把"s" 写成 "s+" 让空格重复
上面的初级的正则规则基本可以解决大部分需求了,进阶的先不补充了。
此外,再贴一个正则的在线测试网址:http://tool.oschina.net/regex/
基本用法
第一部分
Python支持的正则表达式元字符和语法:
. 除 外的所有字符
d 数字,等同于[0-9]
D 非数字,等同于[^0-9]
s 空白字符[ �]
S 非空白字符[^ �]
w 字母数字字符[a-zA-Z0-9]
W 非字母数字[^a-zA-Z0-9]
match 匹配,仅从起始位置,返回MatchObject
group编组
第三部分
re.I 忽略大小写
re.M 匹配多行
re.S "."匹配所有字符,包括
re.purge() 清除缓存,编译的正则模式会被清除
逃逸字符 re.escape()
进群:125240963 即可获取数十套PDF哦!
网友评论