import re
if __name__ == '__main__':
# 1.compile(正则字符串) 将正则表达式字符串转换成正则表达式对象
# 转换成正则表达式对象后,可以通过对象调用相关的方法
re_obct = re.compile(r'\w{6,12}')
print(re_obct.fullmatch('ahsjjs'))
print(re.fullmatch(r'\w{6,12}', 'ahjhjs'))
运行结果如下:
<re.Match object; span=(0, 6), match='ahsjjs'>
<re.Match object; span=(0, 6), match='ahjhjs'>
# 2.fullmatch(正则表达式, 字符串) 完全匹配,从字符串开头匹配到结尾
# 返回值是匹配对象, 如果匹配失败返回None
match = re.fullmatch('\w{3}', 'h3s')
print(match)
# a.获取匹配到的结果
print(match.group())
# b.获取匹配到的范围
print(match.span())
# c.获取匹配到的开始下标和结束下标
print(match.start(), match.end())
# d.获取被匹配的字符串(原字符串)
print(match.string)
# 应用:判断一个字符串是否是某种字符串(判断账号、密码是否符合要求等)
运行结果如下:
<re.Match object; span=(0, 3), match='h3s'>
h3s
(0, 3)
0 3
h3s
# 3.match(正则表达式, 字符串) 不完全匹配,从字符串开头开始匹配,匹配到正则表达式对应的范围为止
# 返回值是匹配对象, 如果匹配失败返回None
match = re.match(r'\w{3}', 'h3shhhhsbs')
print(match)
print(match.group())
print(match.string)
# 应用: 判断一个字符串是否以某种字符串开头
运行结果如下:
<re.Match object; span=(0, 3), match='h3s'>
h3s
h3shhhhsbs
# 4.search(正则表达式, 字符串) 在指定的字符串中查找某种字符串(以正则表达式来描述),如果有过个满足条件的,只匹配第一个
# 返回值是匹配对象,如果找不到符合要求的返回None
print(re.search(r'\d{2,}[a-z]', 'sh23n--8a7a7m0899'))
# 应用:判断一个字符串中是否包含某种字符串
运行结果如下:
<re.Match object; span=(2, 5), match='23n'>
# 5.findall(正则表达式, 字符串) 去获取指定字符串中满足正则条件的所有的子串
# 返回值是列表,列表中是符合要求的字符串。没有满足要求的子串就返回[]
result = re.findall(r'[a-zA-Z](\d+)', '12a123buy=236ok98s')
print(result)
# 注意:在通过正则表达式获取子串的时候,可以通过在正则表达式中添加括号,来约束获取的内容(只捕获括号中匹配到的内容)
# 匹配的时候还是按原正则表达式去查找
# 应用:字符串提取
运行结果如下:
['123', '98']
# 6.finditer(正则表达式, 字符串) 用法和findall一样,只是返回值的类型不一样
# 返回一个迭代器,迭代器中的内容是匹配对象
# 注意:()捕获部分无效
result = re.finditer(r'[a-zA-Z](\d+)', '12a123buy=236ok98s')
for match in result:
print(match)
# print('ahsj27jkkaj7js8jsj'.split('sj'))
运行结果如下:
<re.Match object; span=(2, 6), match='a123'>
# 7.split(正则表达式, 字符串) 按正则表达式匹配到的字符串进行切割
# 返回值是列表,列表元素就切割后被分段的字符串
result = re.split(r'[\[\]*\-]', 'a[hsj27]jkkaj*7js8-jsj')
print(result)
运行结果如下:
<re.Match object; span=(14, 17), match='k98'>
# 8.sub(正则表达式,新字符串, 原字符串) 在原字符串中查找符合正则的子串,替换成新的字符串
# 返回值是替换后的字符串
"""将指定字符串中所有'sb'替换成'*'"""
str1 = '你好sb,你全家都是sb,傻叉,你是不是傻,手机上叉'
result = re.sub(r'sb|傻叉|傻', '*', str1)
print(str1, result)
运行结果如下:
['a', 'hsj27', 'jkkaj', '7js8', 'jsj']
你好sb,你全家都是sb,傻叉,你是不是傻,手机上叉 你好*,你全家都是*,*,你是不是*,手机上叉
网友评论