美文网首页
2023-02-23 js中正则表达式的贪婪模式和惰性模式

2023-02-23 js中正则表达式的贪婪模式和惰性模式

作者: 追寻1989 | 来源:发表于2023-02-22 11:51 被阅读0次

贪婪模式——在匹配成功的前提下,尽可能多的去匹配

惰性模式——在匹配成功的前提下,尽可能少的去匹配

使用正则表达式中的贪婪、惰性的量词可以控制表达式匹配过程,我们知道量词?、*、+的意义,可以指定相关模式出现的次数,默认的情况下我们使用的是贪婪量词,它的匹配过程是从整个字符串开始查看,如果不匹配就去掉最后一个,再看看是否匹配,如此循环一直到匹配或字符串空为止,如:

str = "abbbaabbbaaabbb1234";

reg = /.*bbb/g;//*是贪婪量词

reg.test(str);

这个匹配过程将从整个字符串开始:

reg.test("abbbaabbbaaabbb1234");//false  ,则去掉最后一个字符4再继续

reg.test("abbbaabbbaaabbb123");//false  ,则去掉最后一个字符3再继续

reg.test("abbbaabbbaaabbb12");//false  ,则去掉最后一个字符2再继续

reg.test("abbbaabbbaaabbb1");//false  ,则去掉最后一个字符1再继续

reg.test("abbbaabbbaaabbb");//true ,结束

// 因此
str.match(reg); // ['abbbaabbbaaabbb']

在贪婪量词的后面加多一个?就变成了惰性量词,它的匹配过程相反,是从前面第一个开始,不匹配则加一个,如此循环直到字符串结束,以上面的为例子。

str = "abbbaabbbaaabbb1234";

reg = /.*?bbb/g;//*?是惰性量词

reg.test(str);

它的匹配过程如下:

reg.test("a");//false,  再加一个

reg.test("ab");//false,  再加一个

reg.test("abb");//false,  再加一个

reg.test("abbb");//true,  匹配了,保存这个结果,再从下一个开始

reg.test("a");//false,  再加一个

reg.test("aa");//false,  再加一个

reg.test("aab");//false,  再加一个

reg.test("aabb");//false,  再加一个

reg.test("aabbb");//true,  匹配了,保存这个结果,再从下一个开始

...

// 因此
str.match(reg); // ['abbb', 'aabbb', 'aaabbb']

加深印象,再来个示例剖析:

  • 贪婪模式
str = "abbb{{aabbb}}aaa{{bbb}}1234";

reg = /{{(.*)}}/g;

str.match(reg);  //  ['{{aabbb}}aaa{{bbb}}']

它的匹配过程如下:

// 匹配左侧 {{
reg.test("abbb{{aabbb}}aaa{{bbb}}1234");//false  ,则去掉第一个字符a再继续

reg.test("bbb{{aabbb}}aaa{{bbb}}1234");//false  ,则去掉第一个字符b再继续

reg.test("bb{{aabbb}}aaa{{bbb}}1234");//false  ,则去掉第一个字符b再继续

reg.test("b{{aabbb}}aaa{{bbb}}1234");//false  ,则去掉第一个字符b再继续

reg.test("{{aabbb}}aaa{{bbb}}1234");//false  ,已满足左侧条件但还不满足右侧条件,继续匹配

// 匹配右侧 }}
reg.test("abbb{{aabbb}}aaa{{bbb}}1234");//false  ,则去掉最后一个字符4再继续

reg.test("abbb{{aabbb}}aaa{{bbb}}123");//false  ,则去掉最后一个字符3再继续

reg.test("abbb{{aabbb}}aaa{{bbb}}12");//false  ,则去掉最后一个字符2再继续

reg.test("abbb{{aabbb}}aaa{{bbb}}1");//false  ,则去掉最后一个字符1再继续

reg.test("abbb{{aabbb}}aaa{{bbb}}");//true ,满足右侧条件,保存满足两个条件区间的  {{aabbb}}aaa{{bbb}} 这个结果,结束

// 因此
str.match(reg); // ['{{aabbb}}aaa{{bbb}}']
  • 惰性模式
str = "abbb{{aabbb}}aaa{{bbb}}1234";

reg = /{{(.*)}}/g;

str.match(reg);  //  ['{{aabbb}}aaa{{bbb}}']

它的匹配过程如下:

reg.test("a");// false,  再加一个

reg.test("ab");// false,  再加一个

reg.test("abb");// false,  再加一个

reg.test("abbb");// false,  再加一个

reg.test("abbb{");// false,  再加一个

reg.test("abbb{{");// false,  已满足左侧条件但还不满足右侧条件,再加一个

reg.test("abbb{{a");// false,  再加一个

reg.test("abbb{{aa");// false,  再加一个

reg.test("abbb{{aab");// false,  再加一个

reg.test("abbb{{aabb");// false,  再加一个

reg.test("abbb{{aabbb");//false,  再加一个

reg.test("abbb{{aabbb}");// false,  再加一个

reg.test("abbb{{aabbb}}");// true,满足右侧条件,保存满足两个条件区间的  {{aabbb}}  这个结果,再从下一个开始

reg.test("a");//false,  再加一个

reg.test("aa");//false,  再加一个

reg.test("aaa");//false,  再加一个

reg.test("aaa{");//false,  再加一个

reg.test("aaa{{");//false,  已满足左侧条件但还不满足右侧条件,再加一个

reg.test("aaa{{b");//false,  再加一个

reg.test("aaa{{bb");//false,  再加一个

reg.test("aaa{{bbb");//false,  再加一个

reg.test("aaa{{bbb}");//false,  再加一个

reg.test("aaa{{bbb}}");// true,满足右侧条件,保存满足两个条件区间的 {{bbb}} 这个结果,再从下一个开始

...依次推类

// 因此
str.match(reg); // ['{{aabbb}}', '{{bbb}}']
贪婪与惰性模式区别如下:

一、从语法角度看

贪婪模式用于匹配优先量词修饰的子表达式,匹配优先量词包括:{m,n}{m,}?*+

惰性模式用于匹配忽略优先量词修饰子表达式,匹配忽略优先量词包括:{m,n}?{m,}???*?+?

二、从应用角度看

两者均影响被量词修饰的子表达式匹配行为,贪婪模式在匹配成功的前提下尽可能多地匹配,而惰性模式则在匹配成功的前提下尽可能少匹配。惰性模式只被部分NFA引擎支持。

三、从匹配原理看

能达到同样匹配结果的情况下,通常贪婪模式效率较高。

惰性模式都可通过修改量词修饰的子表达式转换为贪婪模式。

贪婪模式可以与固化分组结合,提升匹配效率,而惰性模式不行。

相关文章

  • 正则表达式的贪婪模式和非贪婪模式

    一、什么是贪婪模式和非贪婪模式? 定义 贪婪模式:正则表达式趋向于匹配最大长度。 非贪婪模式:正则表达式趋向于匹配...

  • JS正则表达式难点突破:贪婪模式/惰性模式

    在讲贪婪模式和惰性模式之前,先回顾一下JS正则基础: 写法基础: ①不需要双引号,直接用//包含 => /wehf...

  • 正则表达式

    贪婪模式和非贪婪模式 正则表达式是贪婪匹配的。比如:'123456789'.replace(/\d{3,6}/g,...

  • 正则表达式possessive、greediness和lazin

    正则表达式(Regular Expression)的贪婪模式(Greediness)和懒惰模式(Laziness)...

  • 正则表达式(语法)

    1.1 正则表达式元字符和语法: 1.2. 数量词的贪婪模式与非贪婪模式 正则表达式通常用于在文本中查找匹配的字符...

  • 爬虫的提取(2)--re正则

    python正则表达式基本元字符 贪婪模式在python中默认采用的是贪婪模式,使用非贪婪模式的话,只需要在量词后...

  • 正则表达式

    1.什么是贪婪模式和非贪婪模式? 量词在默认下是尽可能多的匹配的,就是贪婪模式;非贪婪模式,让正则表达式尽可能少的...

  • 正则表达式

    1.什么是贪婪模式和非贪婪模式? 贪婪模式 一般情况下,正则表达式在匹配过程中会尽可能多的匹配 非贪婪模式 让正则...

  • JavaScript 正则表达式( 匹配网页的图片地址)

    正则表达式 - 元字符 贪婪模式与非贪婪模式 贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为;贪婪模式 在...

  • 正则表达式贪婪模式与非贪婪模式

    什么是正则表达式的贪婪模式和非贪婪模式? 我们先从例子入手: 原本想要匹配的字符为"witch"和"broom"两...

网友评论

      本文标题:2023-02-23 js中正则表达式的贪婪模式和惰性模式

      本文链接:https://www.haomeiwen.com/subject/dbcakdtx.html