Python实用技法第27篇:编写多行模式的正则表达式

作者: IT派森 | 来源:发表于2019-08-24 22:55 被阅读2次

1、需求

我们打算用正则表达式对一段文本块做匹配,但是希望在进行匹配时能够跨越多行。

2、解决方案

这个问题一般出现在希望使用句点(.)来匹配任意字符,但是忘记了句点并不能匹配换行符。

实例:假设向匹配C语言风格的注释:

import re

str_pat=re.compile(r'/\*(.*?)\*/')
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))
Python资源分享qun 784758214 ,内有安装包,PDF,学习视频,这里是Python学习者的聚集地,零基础,进阶,都欢迎

结果:

[' mark ']
[]

要解决这个问题,可以添加对换行符的支持。

实例:

import re

#将.换成(?:.|\n)
str_pat=re.compile(r'/\*((?:.|\n)*?)\*/')
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))

结果:

[' mark ']
[' mark \n 2018 ']

(?:.|n)指定了一个非捕获组(即,这个组只做匹配但不捕获结果,也不会分配组号)。

3、分析

re.compile()函数可接受一个有用的标记:re.DOTALL,这使得表达式中的句点【.】可以匹配所有的字符,也包括换行符。

实例:

import re

str_pat=re.compile(r'/\*(.*?)\*/',re.DOTALL)
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))

结果:

[' mark ']
[' mark \n 2018 ']
Python资源分享qun 784758214 ,内有安装包,PDF,学习视频,这里是Python学习者的聚集地,零基础,进阶,都欢迎

对于简单的情况,使用re.DOTALL标记就可以很好的完成工作。但是如果要处理及其复杂的模式,可以选择利用非捕获组定义在自己的表达式中,这样无需额外的标记也能正常工作。

相关文章

  • Python实用技法第27篇:编写多行模式的正则表达式

    1、需求 我们打算用正则表达式对一段文本块做匹配,但是希望在进行匹配时能够跨越多行。 2、解决方案 这个问题一般出...

  • JavaScript 和正则表达式

    正则表达式 简介正则表达式(regular expression,缩写RegExp) 是一种特殊的符号编写模式,描...

  • re.DOTALL --编写多行模式的正则表达式

    这个问题一般出现在希望使用句点(.)来匹配任意字符,但是忘记了句点并不能匹配换行符时: 解决方法1:添加对换行符的...

  • Python 学习笔记 068

    正则表达式 Python检索正则的编写 正则表达式的具体应用 1.匹配单个字符与数字 . 匹...

  • Python ☞ day 11

    Python学习笔记之 正则表达式 re模块概述:Python自1.5以后增加了re的模块,提供了正则表达式模式...

  • Python Lib -- 正则表达式

    Python Raw String 在python字符串中 \ 是转义序列符号,所以在编写正则表达式时,建议使用 ...

  • Python 学习笔记 067

    正则表达式 Python自1.5以后增加了re的模块,提供了正则表达式模式 re模块使Python语言拥有了全部的...

  • 爬虫的提取(2)--re正则

    python正则表达式基本元字符 贪婪模式在python中默认采用的是贪婪模式,使用非贪婪模式的话,只需要在量词后...

  • 爬虫之简单爬取糗事百科

    技术路线:python+requests+re 代码如下: 关键点:正则表达式的编写:pattern = re.c...

  • Python正则表达式

    正则表达式中,常用的匹配模式: python 正则表达式的语法: 使用正则表达式,需要导入模块: 输出结果:['h...

网友评论

    本文标题:Python实用技法第27篇:编写多行模式的正则表达式

    本文链接:https://www.haomeiwen.com/subject/vxujdctx.html