美文网首页
python正则表达式去除匹配模式两端的引号等定位符

python正则表达式去除匹配模式两端的引号等定位符

作者: 迪丽娜扎 | 来源:发表于2017-08-05 00:07 被阅读0次

在实际应用中,利用正则表达式在文本数据中提取特定的字符串时,我们实际用于定位的正则表达式有一部分是不想要的。举例来说,在以下文本中

........他说:“别说我的眼泪你无所谓。”然后她说,"滚蛋".....

如果我们想把两个人说的话提取出来,可以利用双引号构建正则表达式,形如 “.*” 但这样提取出来的字符串会包含双引号本身。为了去除双引号,可以使用以下模式:

pattern = re.compile(‘(?<=“).*(?=”)’)

开头不想要的东西放在括号()内,并在前面添加?<=三个字符,末尾不想要的也放在括号()内,前面加?=两个字符即可。

当然,就本例来说,如果为了防止贪婪匹配,可以把中间的任意字符改为非双引号的字符,即[^"]*

相关文章

  • python正则表达式去除匹配模式两端的引号等定位符

    在实际应用中,利用正则表达式在文本数据中提取特定的字符串时,我们实际用于定位的正则表达式却有一部分是不想要的。举例...

  • 非贪婪模式(?) --实现最短匹配的正则

    问题引入: 问题:在这个例子中,模式r'"(.)"'尝试去匹配包含在引号中文本。但是,操作符在正则表达式中采用的是...

  • Perl正则表达式常用语法总结

    操作符 m/.../ 模式匹配操作符 s/.../.../ 模式替换操作符 qr/.../ 预编译正则表达式 =~...

  • 正则专题

    1 正则表达式的基本语法 元字符的功能:限定符;选择匹配符;分组组合和反向引用符;特殊字符;字符匹配符;定位符 1...

  • 正则表达式基本知识

    概述正则表达式是一种描述字符串结果的语法规则,是一个特定的格式化模式,可以匹配、替换、截取匹配的字符串。 行定位符...

  • 正则表达式

    正则表达式是一种窥视字符串结构的语法规则,是一个特定的格式化模式,可以匹配、替换、截取匹配的字符串。 行定位符 ^...

  • Python 正则表达式

    正则表达式模式 模式描述^匹配字符串的开头$匹配字符串的末尾。.匹配任意字符,除了换行符,当re.DOTALL标记...

  • 9.2.1 正则表达式语法介绍1

    9.2.1 正则表达式语法介绍1 定界符原子元字符模式修正符 Perl兼容正则表达式 正则表达式作为一个匹配的模版...

  • 9.2.2 正则表达式语法介绍2

    9.2.2 正则表达式语法介绍2 定界符原子元字符模式修正符 Perl兼容正则表达式 正则表达式作为一个匹配的模版...

  • mysql(04day)

    Mysql支持正则表达式的匹配,Mysql中使用REGEXP操作符来进行正则表达式匹配。 下面中的正则模式中可用于...

网友评论

      本文标题:python正则表达式去除匹配模式两端的引号等定位符

      本文链接:https://www.haomeiwen.com/subject/lsyblxtx.html