美文网首页
正则表达式如何处理嵌套结构

正则表达式如何处理嵌套结构

作者: CrixalisAs | 来源:发表于2018-03-30 15:47 被阅读0次

1、 .net处理嵌套结构的方法

举例说明:

问题描述:从before (nope (yes (here) okay) after中匹配得到最大的被”()”包含的文本。即显示红色的部分。

答案:.net:\((?>[^()]+|\((?<DEPTH>)|\)(?<-DEPTH>))*(?(DEPTH)(?!))\)

分析:

  • (1)、\(匹配左括号;\)匹配右括号;[^()]+匹配非括号字符串

  • (2)、(?>….)固化分组,固化分组的作用在于:一旦括号内的子表达式匹配之后,匹配的内容就固定下来,在接下来的匹配过程中不会改变,除非整个固化分组的括号都被弃用,在外部回溯中重新应用。该处使用固化分组的作用在于提高匹配速度。

  • (3)、DEPTH的使用:DEPTH实际使用了命名捕获的<?>…>,它总是能够匹配成功。正则表达式引擎的回溯堆栈保存了当前匹配成功分组的相关信息,而(?<DEPTH>)跟在\(后,所以它的成功匹配便可以保存\(的个数。跟随在\)后的结构(?<-DEPTH>)是.NET独有的结构,它会在匹配\)成功之后去掉最近的”successful DEPTH”标记。如果不存在这样的”successful DEPTH”标记,就会报告失败,整个正则表达式匹配失败:1,每匹配一个\(会把正则表达式保存的当前括号嵌套深度值加1;2, 每匹配一个\)会把正则表达式保存的当前括号嵌套深度值减1;3, (?(DEPTH)(?!))确保匹配最后的\)时,深度为0。

2, 如何使用正则表达式处理句法分析树

如何使用正则表达式识别一棵类似如下表示的句法分析树?

(TOP (S (NPB (DT The) (NN question) ) (VP (VBZ remains) (SBAR-A (IN whether) (S-A (NPB (PRP they) ) (VP (MD will) (VP-A (VB be) (ADJP (JJ able) (SG (VP (TO to) (VP-A (VB help) (PUNC. us.) ) ) ) ) ) ) ) ) ) ) )

答案:\((?>[^()]+|\([^()\s]+\s(?<DEPTH>)|\)\s(?<-DEPTH>))*(?(DEPTH)(?!))\)

分析类似。

3, 使用正则表达式处理句法分析树实例

  • a. 使用正则表达式获取所有的叶结点: \((?<POS>[^()]+)\s(?<Leaf>[^()]+)\)

  • b. 使用正则表达式获取所有的名词短语NP:

\(NP\s(?>[^()]+|\([^()\s]+\s(?<DEPTH>)|\)\s(?<-DEPTH>))*(?(DEPTH)(?!))\)

  • c. 使用正则表达式获取满足如下性质的子树

i. 该子句的标记为SBAR[^()]*

ii. 该子句根节点的第一个儿子为一个词性为IN的词。

iii. 该子句的第二个儿子为一个子句:使用S[^()]*识别

iv. 该子句没有其他的儿子

(?<Clause>\(S[^() ]\s(?<INWH>\(IN\s[^()]+\)\s)(?<ClauseAfterInWh>\(S[^() ]\s(?>[^()]+|\([^()\s]+\s(?<DEPTH>)|\)\s(?<-DEPTH>))*(?(DEPTH)(?!))\)\s)\)\s(?#Clause))

相关文章

  • 正则表达式如何处理嵌套结构

    1、 .net处理嵌套结构的方法 举例说明: 问题描述:从before (nope (yes (here) oka...

  • 第四天

    for与for的嵌套形式,for与if的嵌套形式。以及关于如何跳出循环中的“break”的。for循环结构与if ...

  • 结构体嵌套

    普通结构体嵌套 普通结构体嵌套,嵌套结构体可以通过 .子变量.方法 的方式获取被嵌套的属性和方法 匿名嵌套 匿名嵌...

  • 结构体嵌套

    结构体嵌套 结构体嵌套时应逐级引用

  • python进阶-08-数据结构

    1 概念 算法不关注处理何种数据,数据结构关注的是如何组织数据比如可以使用列表嵌套元组保存学生信息,也可使用列表嵌...

  • 2018-12-17数据

    结构数据 xml json 非结构化数据 html处理方法 xpath 正则表达式 json 怎么找json的ur...

  • 如何处理常见的JSON嵌套结构

    我们继续之前的话题。很多时候,服务器返回的JSON都不是一个“扁平”的结构,而是包含了各种嵌套,在这一节,我们就来...

  • 爬虫处理——结构化数据操作

    爬虫处理之结构化数据操作 目录清单 正则表达式提取数据 正则表达式案例操作 Xpath提取数据 Xpath案例操作...

  • 爬虫0040:数据筛选

    爬虫处理之结构化数据操作 ——编辑:大牧莫邪 目录清单 正则表达式提取数据 正则表达式案例操作 Xpath提取数据...

  • python第五天

    爬虫实践 一、数据提取 非结构化数据处理 文本、电话号码、邮箱地址>>>正则表达式 html文件>>>正则表达式、...

网友评论

      本文标题:正则表达式如何处理嵌套结构

      本文链接:https://www.haomeiwen.com/subject/pbsicftx.html