23.re模块正则

作者: 哈哈大圣 | 来源:发表于2019-12-26 18:34 被阅读0次

1). 概述

re模块为正则表达式功能模块
模块导入方式

import re

2). 元字符

元字符	说明
`.`	默认匹配除`\n`之外的任意一个字符，若指定`flag DOTALL`,则匹配任意字符，包括换行
`^`	匹配字符开头，若指定`flags MULTILINE`,这种也可以匹配上`(r"^a","\nabc\neee",flags=re.MULTILINE)`
`$`	匹配字符结尾，若指定`flags MULTILINE` `,`re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group()`匹配到foo1
`*`	匹配``号前的字符0次或多次， `re.search('a','aaaabac')` 结果`aaaa`
`+`	匹配前一个字符1次或多次，`re.findall("ab+","ab+cd+abb+bba")` 结果`['ab', 'abb']`
`?`	匹配前一个字符1次或0次,`re.search('b?','alex').group()` 匹配b 0次
`{m}`	匹配前一个字符m次,`re.search('b{3}','alexbbbs').group()` 匹配到`bbb`
`{n,m}`	匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
`	`	匹配`	`左或`	`右的字符，`re.search("abc	ABC","ABCBabcCD").group()` 结果'ABC'
`(...)`	分组匹配,`re.search("(abc){2}a(123	45)", "abcabca456c").group()` 结果为'abcabca45'
`[]`	或匹配，满足里面
`\A`	只从字符开头匹配，`re.search("\Aabc","alexabc")` 是匹配不到的，相当于`re.match('abc',"alexabc")` 或`^`
`\Z`	匹配字符结尾，同`$`
`\d`	匹配数字0-9
`\D`	匹配非数字
`\w`	匹配`[A-Za-z0-9]`
`\W`	匹配非`[A-Za-z0-9]`
`\s`	匹配空`白字符`、`\t`、`\n`、`\r` , `re.search("\s+","ab\tc1\n3").group()` 结果 `\t'
`(?P<name>...)`	分组匹配 `re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city")` 结果`{'province': '3714', 'city': '81', 'birthday': '1993'}`

3). 匹配方法

compile:编辑匹配的模式
match:从头开始匹配,就是要求从头要满足条件才有返回值
search:匹配包含，匹配一个
re.findall:把所有匹配到的字符放到以列表中的元素返回
split:以匹配到的字符当做列表分隔符
sub:匹配字符并替换
fullmatch:全部匹配

4). 匹配方法案例

通用模板

s = "dfjie8sdjfe3"
match = re.search("[0-9]", s) #只匹配一个
if not match:    # 先要进行判断
    print("match is None")
if match:
    print(match.group())  # 得到值

search方法 + groups分组匹配

a = re.search("([a-z]+)([0-9]+)","abc123").groups()
print(a)

split：以匹配到的内容进行分割,可指定分割次数

a = re.split("\d+","dkfj3kd3kdf334dfldf3ldfd4",maxsplit=2)
print(a)

模糊替换匹配,可指定次数

a = re.sub("\d+","LOVE","kdjfiekdfie83df7jdf3",count=2)

全部匹配，否则返回None: 验证邮箱

a = re.fullmatch("\w+@(sina|qq|163|outlook|icloud)\.(com|cn)","lingchangdage@sina.com").group()

pattern

pattern = re.compile("\w+@\w+\.(com|cn|edu)")  #相当于提前把匹配规则写好
pattern.fullmatch("liuchengdaga@sina.com")  #直接使用匹配的规则
pattern.search("liuchengdaga@sina.com")

flags标志符用于添加特定的条件

a = re.search("a", "A", re.I) # 忽略大小写
b = re.search("foo.$", "foo1\nfoo2\n", re.MULTILINE) # 多行模式，匹配一行的结尾
c = re.search(".", "\n", re.S)  # S可以让通配符匹配换行符
d = re.search(".+#这个是注释，要加X "
                "a","aa",re.X)  # X可以为符号添加注释

网友评论

本文标题：23.re模块正则

本文链接：https://www.haomeiwen.com/subject/wbatoctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

23.re模块正则

1). 概述

2). 元字符

3). 匹配方法

4). 匹配方法案例

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

23.re模块 正则

1). 概述

2). 元字符

3). 匹配方法

4). 匹配方法案例

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

23.re模块正则