美文网首页
第八章 匹配原理

第八章 匹配原理

作者: 马小跳_ | 来源:发表于2018-12-20 21:11 被阅读9次

8.1 有穷自动机

正则表达式能迅速进行复杂处理的秘密就在于,它采用了一种特殊的理论模型:有穷自动机(finite automata),也叫做有穷状态自动机(finite-state machine)。这种机器具备有限个状态,可以根据不同条件在状态之间转移。
严格的说起来,有穷自动机必须满足4个条件:

  1. 具有有限多个状态
  2. 有一套状态转移函数(规则)
  3. 有一个开始状态
  4. 有一个或多个最终状态

8.2 正则表达式的匹配过程

正则表达式所使用的理论模型就是有穷自动机,其具体实现称为正则引擎(regex engine)。用正则表达式处理字符串,首先需要生成自动机(“编译”正则对象);之后无论输入什么字符串,正则引擎都只需要老老实实地在状态之间游走。

8.3 回溯

比起DFA,NFA看起来足够“麻烦”:它的状态是不确定的,这有点像走迷宫,越走岔路口越多,最后不会迷路吗?

不过,NFA的正则引擎自有办法:如果有多个可能的状态,它们会在选择时记录下这些状态备用,然后才选择其中某个状态尝试;如果之后遇到死路,则退回去,选择最近一次记录的且未尝试过的状态;如果又遇到死路,再选择最近一次记录的且未尝试过的状态...

这有点像在分岔路口留下标记——如果我们在遇到的每个分岔路口都留下标记,即使前头是死路,也可以根据标记返回,而不会迷路。

8.4 NFA和DFA

根据状态的确定与否,一般我们会把有穷自动机(正则引擎)分为两类:一类是确定型有穷自动机(definite finite automata,简称DFA),在任何时刻,它所处的状态是确定无疑的;另一台是非确定型有穷自动机(non-definite finite automata,简称NFA),在某个时刻,它所处的状态可能是不确定的。

相关文章

  • 第八章 匹配原理

    8.1 有穷自动机 正则表达式能迅速进行复杂处理的秘密就在于,它采用了一种特殊的理论模型:有穷自动机(finite...

  • 正则表达式回溯法原理

    来源:正则表达式回溯法原理作者:老姚(转载已获得作者授权) 学习正则表达式,是需要懂点儿匹配原理的。而研究匹配原理...

  • OpenCV-Python学习(十三):模板匹配

    目录: 1.模板匹配原理 2.模板匹配操作1)单对象匹配:原图中仅有一个与模板匹配2)多对象匹配:原图中有多个与模...

  • iOS - 判断 NSString 字符串是否包含 Emoji

    第一种方案:模糊匹配 这种方式使用 Unicode 码点进行匹配,具体的编码原理和编码转换原理可以参考这篇文章:i...

  • 第四章 正则表达式回溯法原理

    第四章 正则表达式回溯法原理 学习正则表达式,是需要懂点儿匹配原理的。 而研究匹配原理时,有两个字出现的频率比较高...

  • qingshu面试

    public class Solution { //编译原理的() 匹配 // 15 2 public...

  • 09--KMP

    [toc] KMP算法原理 KMP思想 假设字符串abcdefgab和模式串abcdex,进行匹配,当匹配到x位置...

  • 不积跬步之第四章--正则回溯法原理

    大佬的话,学习正则表达式,是需要懂点匹配原理的。而聊到匹配原理,就说道了回溯,那么什么是回溯呢?这是我们这一章要明...

  • 招聘与配置

    一、员工素质测评的基本原理 1、个体差异原理。 2、工作差异原理。 3、人岗匹配原理。 员工素质测评的类型。 选拔...

  • 字符串匹配-Sunday算法

    Sunday算法 匹配原理 从前往后匹配,如果遇到不匹配情况,则查看母串S中参与匹配的最后一位的下一位字符,记做C...

网友评论

      本文标题:第八章 匹配原理

      本文链接:https://www.haomeiwen.com/subject/pbiukqtx.html