import re
1.compile(正则字符串) 将正则表达式字符串转换成正则表达式对象
转换成正则表达式对象后,可以通过对象调用相关的方法
re_obct = re.compile(r'\w{6,12}')
print(re_obct.fullmatch('ahsjjs'))
print(re.fullmatch(r'\w{6,12}', 'ahjhjs'))
2.fullmatch(正则表达式, 字符串) 完全匹配,从字符串开头匹配到结尾
返回值是匹配对象, 如果匹配失败返回None
match = re.fullmatch('\w{3}', 'h3s')
print(match)
# a.获取匹配到的结果
print(match.group())
# b.获取匹配到的范围
print(match.span())
# c.获取匹配到的开始下标和结束下标
print(match.start(), match.end())
# d.获取被匹配的字符串(原字符串)
print(match.string)
# 应用:判断一个字符串是否是某种字符串(判断账号、密码是否符合要求等)
3.match(正则表达式, 字符串) 不完全匹配,从字符串开头开始匹配,匹配到正则表达式对应的范围为止
返回值是匹配对象, 如果匹配失败返回None
match = re.match(r'\w{3}', 'h3shhhhsbs')
print(match)
print(match.group())
print(match.string)
# 应用: 判断一个字符串是否以某种字符串开头
4.search(正则表达式, 字符串) 在指定的字符串中查找某种字符串(以正则表达式来描述),如果有过个满足条件的,只匹配第一个
返回值是匹配对象,如果找不到符合要求的返回None
print(re.search(r'\d{2,}[a-z]', 'sh23n--8a7a7m0899'))
# 应用:判断一个字符串中是否包含某种字符串
5.findall(正则表达式, 字符串) 去获取指定字符串中满足正则条件的所有的子串
# 返回值是列表,列表中是符合要求的字符串。没有满足要求的子串就返回[]
result = re.findall(r'[a-zA-Z](\d+)', '12a123buy=236ok98s')
print(result)
# 注意:在通过正则表达式获取子串的时候,可以通过在正则表达式中添加括号,来约束获取的内容(只捕获括号中匹配到的内容)
# 匹配的时候还是按原正则表达式去查找
# 应用:字符串提取
6.finditer(正则表达式, 字符串) 用法和findall一样,只是返回值的类型不一样
返回一个迭代器,迭代器中的内容是匹配对象
注意:()捕获部分无效
result = re.finditer(r'[a-zA-Z](\d+)', '12a123buy=236ok98s')
for match in result:
print(match)
# print('ahsj27jkkaj7js8jsj'.split('sj'))
7.split(正则表达式, 字符串) 按正则表达式匹配到的字符串进行切割
返回值是列表,列表元素就切割后被分段的字符串
result = re.split(r'[\[\]*\-]', 'a[hsj27]jkkaj*7js8-jsj')
print(result)
8.sub(正则表达式,新字符串, 原字符串) 在原字符串中查找符合正则的子串,替换成新的字符串
返回值是替换后的字符串
"""将指定字符串中所有'sb'替换成'*'"""
str1 = '你好sb,你全家都是sb,傻叉,你是不是傻,手机上叉'
result = re.sub(r'sb|傻叉|傻', '*', str1)
print(str1, result)
网友评论