简单来说,正则表达式就是记录文本规则的代码。
需 import re
可以用到 re.split re.findall re.match
"\b" 单词的开头或结尾,空格、标点、换行
"." 除换行符以外的任意字符
"\S" 非空白符的任意字符
"" 表示数量,它表示前面的字符可以重复任意多次(包括0次)
"+" 至少一个字符
"?" 0个或1个字符,
{n}表示n个字符,{n,m}表示n-m个字符
""在匹配时,会匹配尽可能长的结果。如果需要匹配到最短的就停止,需要用".?"(懒惰匹配)。
"\d" 数字
[0-9] "\d" "[0-9]+" "\d+" 任意长度的数字,其中包含0次,+表示1次以上
"\w" 字母或数字或下划线或汉字
"\s" 任意的空白符(与\S相反)
"^" 匹配字符串的开始, ^\d表示必须以数字开头。
"表示必须以数字结束
"\W" 任意不是字母,数字,下划线,汉字的字符
"\D" 任意非数字的字符
"\B" 不是单词开头或结束的位置
[a]的反义是[a],表示除a以外的任意字符。[abcd]就是除abcd以外的任意字符
A|B可以匹配A或B,所以(P|p)ython可以匹配'Python'或者'python'。
网友评论