美文网首页
正则表达式贪婪模式与非贪婪模式

正则表达式贪婪模式与非贪婪模式

作者: 左冬的博客 | 来源:发表于2017-09-10 22:03 被阅读0次

    什么是正则表达式的贪婪模式和非贪婪模式?

    我们先从例子入手:

    var str = 'a "witch" and her "boom" is one';
    str.match(/".*"/g); 
    

    原本想要匹配的字符为"witch""broom"两个字符串,运行以上的例子看看运行结果:


    发现匹配的是"witch" and her "broom"这个字符串,之所以出现这个结果,是因为正则表达式的贪婪模式在起作用。

    查找算法

    我们假设自己是正则引擎,模拟一下搜索实现的过程。
    正则引擎先从字符串的第0位开始搜索。

    1. 第一个查找字符是",正则在第三位匹配到了它:
    2. 引擎尝试匹配正则的剩余部分,第二个字符是.,它代表任意字符。隐藏匹配到了w
    3. .代表任意字符重复一次到多次,因此正则引擎匹配到所有字符:
    4. 当文本结束后,点的匹配停止了,但任然有剩余的正则需要匹配,即:",因此,正则引擎开始倒过来回溯,换句话说,就是一个字符一个字符缩减匹配。

      当匹配缩减后,它开始尝试匹配剩余的正则,但"没有匹配上字符e
    5. 因此正则继续缩减.所重复的字符,再继续尝试:

      引号"没有匹配上n,又失败了,继续尝试匹配。。。
    6. 正则引擎继续回溯,一次一次缩减.重复的字符个数,直到剩余的正则都匹配上:

      现在"终于匹配上了。如果正则是global的,正则引擎会从上次匹配结果之后继续查找更多结果。
      由上面的例子可以看出,在贪婪(默认)模式下,正则引擎尽可能多的重复匹配字符

    非贪婪模式

    非贪婪模式和贪婪模式相反,可通过在代表数量的标示符后放置?来开启非贪婪模式,如?+?甚至是??


    可以看到,这次匹配到了"witch""broom"
    接下来看看非贪婪模式.?是怎样运转的
    1. 第一步和上面类似,引号"被匹配上:
    2. 第二步,.被匹配上:
    3. 下面是两者的重要区别。正则引擎尝试用最小可能的重复次数来进行匹配,因此在.匹配了w后,它立即尝试"的匹配:

      没有匹配上,因为i!="
    4. .重复更多的字符,在进行尝试:

      又匹配上,继续。。。
    5. 终于匹配上了:


    6. 因为正则是global的,所以正则引擎继续后面的匹配,从引号后面的a字符开始。后面又匹配到第二个字符串:

    常见量次符:
    ? 问号表示某个模式出现0次或1次,等同于{0,1}。
    * 星号表示某个模式出现0次或多次,等同于{0,}。
    + 加号表示某个模式出现1次或多次,等同于{1,}。

    总结:通过上面的两个例子,我们发现一些量词符在默认情况下都是最大可能的匹配,即匹配直到下一个字符不满足匹配规则为止,这就是贪婪模式。要想匹配到非贪婪模式可以在量词后面加一个问号。

    参考资料:

    正则表达式贪婪与非贪婪模式
    RegExp对象

    相关文章

      网友评论

          本文标题:正则表达式贪婪模式与非贪婪模式

          本文链接:https://www.haomeiwen.com/subject/ukqajxtx.html