美文网首页
正则表达式

正则表达式

作者: xiaozhoua | 来源:发表于2018-08-31 17:18 被阅读0次

0 基本知识

0.1 匹配(match)
0.2 捕获(capture)
0.3 替换(replace)
  • 获取特征对象
      pattern = re.compile("\\s+")
  • 匹配目标字符串
      match = pattern.match("hello world")

1 贪婪模式和非贪婪模式

1.1 概念解释

在整个表达式匹配成功的前提下:
贪婪模式:尽可能多的匹配(.*)--(来者不拒)
非贪婪模式:尽可能少的匹配(.*?)--(见好就收)
Python中数量词默认是贪婪模式

1.2 代码示例

import re
s = "aaabc11123aaabc"
# print(s)

pattern_1 = re.compile('a.*?b')
match_1 = pattern_1.findall(s)
print(match_1)   # 结果为 ['aaab', 'aaab']

pattern_2 = re.compile('a.*b')
match_2 = pattern_2.findall(s)
print(match_2)    # 结果为 ['aaabc11123aaab']

(1)a.*?b,非贪婪模式
  代表从a开始,碰到第一个b即为结束,下一匹配又是以a开始,以b结束的特征字串。所以匹配到两个结果;
(2)a.*b,贪婪模式
  代表从a开始,一直往下匹配,直到最后一个b结束

2 不同括号,不同含义

  • []----字符集
  • {n}---数量,n次
  • ()----分组,一个括号对代表一组
    ([a-z0-9]{3}) ([A-Z]+),前一组为连续的三个小写字母或数字字符(可混),后一组为一个或多个连续的大写字母。注意,两组中间有个空格,说明这两组只能匹配两个字符串。

3 匹配中文

Unicode字符集中,中文大多数位于[\\u4e00-\\u9fa5],要匹配中文,注意将源字符串,(要查找的内容)为Unicode编码,如s = u"服了you"

一些小东西

1. compile(re.*)

  • pattern = re.compile('\[a-z]+',re.I)
    (大写的 i),表示忽略大小写

  • pattern = re.compile('\[a-z]+',re.S)
    表示将源字符串按一个整体进行匹配,而不是一次只匹配一行

相关文章

  • Linux命令行与Shell脚本编程大全-shell正则表达式

    本章内容: 定义正则表达式 了解基本正则表达式 扩展正则表达式 创建正则表达式 定义正则表达式 正则表达式是你定义...

  • 正则相关

    正则表达式基本语法 正则表达式常见字符 正则表达式特殊字符 正则表达式数量词 正则表达式边界匹配 正则表达式逻辑或...

  • 正则表达式系列-1

    正则表达式系列-1正则表达式系列-2正则表达式系列-3正则表达式系列-4 什么是正则表达式 正则表达式就是用事先定...

  • 正则表达式

    正则表达式 - 教程正则表达式 - 简介正则表达式 - 语法正则表达式 - 元字符正则表达式 - 运算符优先级正则...

  • Python基础入门 - 正则表达式与综合实战

    1. 初识正则表达式 1.1 介绍 步骤介绍正则表达式入门及应用正则表达式的进阶正则表达式案例 1.2 正则表达式...

  • Java正则表达式参考

    Java正则表达式入门 java正则表达式应用 深入浅出之正则表达式(一) 深入浅出之正则表达式(二) 正则表达式...

  • 正则表达式

    正则表达式 正则表达式就是记录文本规则的代码 正则表达式常用的元字符 正则表达式常用的限定符 正则表达式举例:这里...

  • Python爬虫(十)_正则表达式

    本篇将介绍python正则表达式,更多内容请参考:【python正则表达式】 什么是正则表达式 正则表达式,又称规...

  • python正则表达式

    本篇将介绍python正则表达式,更多内容请参考:【python正则表达式】 什么是正则表达式 正则表达式,又称规...

  • 正则表达式

    了解正则表达式基本语法 能够使用JavaScript的正则对象 正则表达式简介 什么是正则表达式 正则表达式:用于...

网友评论

      本文标题:正则表达式

      本文链接:https://www.haomeiwen.com/subject/kuaswftx.html