正则表达式

作者: 雪晴魅影 | 来源:发表于2018-07-13 16:13 被阅读0次

Linux命令行与Shell脚本编程大全-shell正则表达式
正则相关
正则表达式系列-1
正则表达式
Python基础入门 - 正则表达式与综合实战
Java正则表达式参考
正则表达式
Python爬虫(十)_正则表达式
python正则表达式
正则表达式

本文主要讲正则表达式的基本用法

python中导入模块：import re

【1】字符：^ . * $

^表示以什么字符开头的字符串；

.表示任意字符

*代表前面的字符可以出现任意多次,包括0次

regex_str = "^b.*" #^以‘b’开头的任意字符串

regex_str1 = ".*3$" # $以3结尾任意字符串

regex_str2 = "^b.3$" #‘b’字符开头，以3结尾，b和3之间可以是一个任意字符，只是匹配了三个字符的字符串

【2】字符：问号？非贪婪匹配,就是取消贪婪匹配（贪婪匹配与非贪婪匹配可以参考：正则表达式之贪婪与非贪婪模式详解）

（1）

line2 = “aaaboooobbbb123”

regex_str3 = ".*?(b.*?b).*"

match_object = re.match(regex_str3,line2)

if match_object :

print(match_object.group(1)) #输出结果boooob ，regex_str3表达式括号里面的才是要输出的值；

（2）

line=“study in 清华大学”

regex_str =".*?([\u4E00-\u9FA5])"+大学" #这个[\u4E00-\u9FA5]是指匹配任意连续的中文字符，加号就是匹配在”大学“前面的一个或者多个的字符；

#如果不加？，就是贪婪模式，括号里面就这是会匹配到”华“，”清“字当成是前面的*匹配掉，后面就只能匹配一个字了，加？号后，取消贪婪匹配，后面就能匹配到”清华“

【3】字符：+加号，字符至少出现一次，限定前面的字符出现至少一次，*限定前面的字符出现0次到多次都行

line3= “aaaboooobaabbb123”

regex_str4=".*(b.+b).*" #括号里面是要截取的内容，括号前面的可以是0位到多位的任意字符，从第一个b开始匹配，中间是一个字符至少有一位以上，然后又到右边的一个b

match_object = re.match(regex_str4,line3)

if match_object :

print(match_object.group(1)) #取得是括号里的内容，输出结果baab ；

【4】字符：{}，有三种模式 {2}和{2，}限定前面的字符自少出现多少次；{1，2} 限定前面的字符自少出现1次，最多等于2次

表达式：".*(b.{2}b).*" 针对字符串“aaaboooobaabbb123” 输出 baab

【5】字符| 是或的意思

字符串：“boby123”

表达式“（body|body123）” 匹配body或者body123都行，要加括号才能打印出来， print(match_object.group(1)) 打印出boby123

表达式“（（body|boddy）123）” 匹配的是body123或者boddy123 ，.group（1）是指外面的括号，打印是完整的body123；；.group（2）是指里面的括号，打印是里面匹配的body

【6】中括号[ ]，有三种用法：

【3，7，8】中括号里面的任意字符都行

【0-9】，【A-Za-z0-9_】表示区间，在这个区间的就行

【^6】反义，不等于6就行

表达式："(1[378][0-9]{9})" #字符串要求第一位是1，第二位是3/7/8，第三位到第9位是0到9区间出现9位（{9}表示前面的那个区间的数据出现9次，刚刚好就是9位数字）；注意小括号也一定要是英文的

【7】\s,\S,\w,\W

\s 表示一个空格字符串

\S表示非空格的任意一个字符串

\w表示【A-Za-z0-9_】这个里面的任意一个字符串

\W表示不在【A-Za-z0-9_】这个区间内的任意一个字符串都行

【8】[\u4E00-\u9FA5] 匹配连续的中文

表达式"[\u4E00-\u9FA5]+" 可以匹配到"中文s"这类的字符串，但是不能匹配到"中文"这样字符串的后面一个‘文’字，只能是‘中’

【9】\d 匹配连续的数字

line = "xxx出生2001年"

提取年份

reg_str = ".*?(\d+)年"

mo = re.match(reg_str,line)

if mo:

print(mo.group(1))

网友评论

本文标题：正则表达式

本文链接：https://www.haomeiwen.com/subject/xuxspftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

正则表达式

相关文章

Linux命令行与Shell脚本编程大全-shell正则表达式

正则相关