美文网首页
正则表达式

正则表达式

作者: Chen_xy | 来源:发表于2017-11-03 00:00 被阅读0次

一.原子:最基本的组成单位(每个正则表达式中至少包含一个)

1.普通字符作为原子
import re
string = "taoyunjiaoyu"
pat = "yun"
rst = re.search(pat, string)
print(rst)
2.非打印字符为原子 例:\n, \t
import re
string = '''taoyunjiaoyu
'''
pat = "\n"
rst = re.search(pat, string)
print(rst)
3.通用字符为原子

\w:匹配任意一个字母、数字、下划线
\W:除字母、数字、下划线
\d:十进制数字
\D:除十进制数字
\s:空白字符
\S:除空白字符

import re
string = '''taoyunsd5 64854165jiaoyu
'''
pat = "\w\d\s\d\w"
rst = re.search(pat, string)
print(rst)
4.原子表: [xyz] 从中任意选一个原子
import re
string = '''taoyunsd5 64854165jiaoyu
'''
pat = "tao[xyz]un"
rst = re.search(pat, string)
print(rst)
注: [^xyz]:除了这三个原子,其他都可以提取 ^:非

二.元字符

.:匹配除换行外的任意一个字符
^:匹配字符串的开始位置
$:匹配字符串的结束位置
*:前面这个元素出现0\1\多次
?:0\1次
+: 1\多次
{n}:恰好n次
{n},:至少n次
{n,m}:至少n次,最多m次
|:模式选择符或
():模式单元
例:

import re
string = 'taoyunsd5 64854165jiaoyu'
pat = "tao.un"
rst = re.search(pat, string)
print(rst)

三.模式修正符

I:匹配是忽略大小写*
M:多行匹配*
L:本地化识别匹配
U:对unicode字符进行解析
S:让.匹配包括换行符*

import re
string = "Python"
pat = "pyt"
rst = re.search(pat, string, re.I)
print(rst)

四.贪婪模式与懒惰模式

import re
string = "poythony468654y"
pat = "p.*y"   #贪婪模式,比较模糊
pat2 = "p.*?y"   #懒惰模式,比较精准
rst = re.search(pat, string, re.I)
rst2 = re.search(pat2, string, re.I)
print(rst)
print(rst2)

五.正则表达式函数

1.match:从头开始匹配
import re
string = "poythony468654y"
pat2 = "o.*?y"
rst2 = re.match(pat2, string, re.I)
print(rst2)
#None
2.search:
3.全局匹配格式re.compile(正则表达式).findall(数据)
rst=re.compile(pat).findall(string)
print(rst)
4.sub函数

六.正则实例

1.匹配.com和.cn网址
string="<a href=http'http://www.baidu.com'>百度首页</a>"
pat="[a-zA-Z]+://[^\s]*[.com|.cn]"
rst=re.compile(pat).findall(string)
print(rst)
2.正则实例:匹配电话号码
string="jsghajshda021-546463464646jksfjlksaf0773-546874651654165sdafsadf"
pat="\d{4}-\d{7}|\d{3}-\d{8}"
rst=re.compile(pat).findall(string)
print(rst)

相关文章

  • Linux命令行与Shell脚本编程大全-shell正则表达式

    本章内容: 定义正则表达式 了解基本正则表达式 扩展正则表达式 创建正则表达式 定义正则表达式 正则表达式是你定义...

  • 正则相关

    正则表达式基本语法 正则表达式常见字符 正则表达式特殊字符 正则表达式数量词 正则表达式边界匹配 正则表达式逻辑或...

  • 正则表达式系列-1

    正则表达式系列-1正则表达式系列-2正则表达式系列-3正则表达式系列-4 什么是正则表达式 正则表达式就是用事先定...

  • 正则表达式

    正则表达式 - 教程正则表达式 - 简介正则表达式 - 语法正则表达式 - 元字符正则表达式 - 运算符优先级正则...

  • Python基础入门 - 正则表达式与综合实战

    1. 初识正则表达式 1.1 介绍 步骤介绍正则表达式入门及应用正则表达式的进阶正则表达式案例 1.2 正则表达式...

  • Java正则表达式参考

    Java正则表达式入门 java正则表达式应用 深入浅出之正则表达式(一) 深入浅出之正则表达式(二) 正则表达式...

  • 正则表达式

    正则表达式 正则表达式就是记录文本规则的代码 正则表达式常用的元字符 正则表达式常用的限定符 正则表达式举例:这里...

  • Python爬虫(十)_正则表达式

    本篇将介绍python正则表达式,更多内容请参考:【python正则表达式】 什么是正则表达式 正则表达式,又称规...

  • python正则表达式

    本篇将介绍python正则表达式,更多内容请参考:【python正则表达式】 什么是正则表达式 正则表达式,又称规...

  • 正则表达式

    了解正则表达式基本语法 能够使用JavaScript的正则对象 正则表达式简介 什么是正则表达式 正则表达式:用于...

网友评论

      本文标题:正则表达式

      本文链接:https://www.haomeiwen.com/subject/gflzpxtx.html