美文网首页
不积跬步之第二章--正则位置匹配攻略

不积跬步之第二章--正则位置匹配攻略

作者: 雨飞飞雨 | 来源:发表于2021-06-12 14:48 被阅读0次

    带着问题看文章?

    • 什么是位置?
    • 开始位置和结束位置怎么匹配?
    • 字符和非字符之间怎么匹配?
    • 我想要匹配一个对象之前的位置,怎么匹配?

    什么是位置呢??

    位置就是字符和字符之间的空隙。其实一段字符串是这样组成的。

    const string = ""+"h"+""+"o"+""+"l"+""+"l"+""+"w";
    

    而那些空的字符其实就是位置。

    在es5中,有6个锚:

    ^、$、\b、\B、(?=p)、(?!p)
    
    image.png

    ^$

    其中^表示开头的位置,在多行匹配中匹配行开头。而$表示结尾的位置,在多行匹配中匹配行结尾。

    var result = "hello".replace(/^|$/g, '#');
    console.log(result);
    // => "#hello#"
    

    多行匹配模式(即有修饰符 m)时,二者是行的概念,这一点需要我们注意:

    var result = "I\nlove\njavascript".replace(/^|$/gm, '#');
    console.log(result);
    /*
    #I#
    #love#
    #javascript#
    */
    

    \b\B

    \b是单词边界,具体就是\w\W之间的位置,\w[0-9a-zA-Z_],而\W则是上面的取反。同时也包括\w^之间的位置。\w$之间的位置。

    例如"[JS] Lesson_01.mp4"中的\b.

    var result = "[JS] Lesson_01.mp4".replace(/\b/g, '#');
    console.log(result);
    // => "[#JS#] #Lesson_01#.#mp4#"
    

    可以看到#替换的位置是[]之间的位置,也就是\w\W之间的位置。

    .#mp4#则是\w$之间的位置

    知道了\b的位置,那么我们就知道了\B的意思,它是\b的取反。具体说来就是 \w\w\W\W^\W\W$ 之间的位置。

    var result = "[JS] Lesson_01.mp4".replace(/\B/g, '#');
    console.log(result);
    // => "#[J#S]# L#e#s#s#o#n#_#0#1.m#p#4"
    

    (?=p)(?!p)

    (?=p)这个模式比较有意识,它表示什么什么之前的位置。其中p表示一个子模式,先匹配到这个p的子模式,找到它,然后取它之前的位置。

    例如:(?=l),表示的是l前面的位置。

    var result = "hello".replace(/(?=l)/g, '#');
    console.log(result);
    // => "he#l#lo"
    

    (?!p) 则是(?=p)的取反。

    var result = "hello".replace(/(?!l)/g, '#');
    console.log(result);
    // => "#h#ell#o#"
    

    二者的学名分别是 positive lookaheadnegative lookahead

    不匹配任何东西的正则

    var regex = /.^/g
    

    因为此正则要求只有一个字符,但该字符后面是开头,而这样的字符串是不存在的。

    数字的千位分隔符表示法

    要求把1234567变成1,234,567。怎么匹配呢?

    分析一下:

    千位分隔符 其实就是从后往前数,三个位置前面,就放一个逗号。

    什么东西前面的位置,想到了什么,是不是位置分割父(?=\d{3}$).

    其中$表示从结束位置开始匹配。

    var result = "12345678".replace(/(?=\d{3}$)/g, ',')
    console.log(result);
    // => "12345,678"
    

    因为逗号出现的位置,要求后面 3 个数字一组,也就是 \d{3} 至少出现一次。

    var result = "12345678".replace(/(?=(\d{3})+$)/g, ',')
    console.log(result);
    // => "12,345,678"
    

    如果正好是123456789正好是9位呢,那么就就会出现开头,所以我们要限制它出现在开始位置。

    想到了啥?(?!^)所以组合起来是这样。

    var regex = /(?!^)(?=(\d{3})+$)/g;
    var result = "12345678".replace(regex, ',')
    console.log(result);
    // => "12,345,678"
    result = "123456789".replace(regex, ',');
    console.log(result);
    // => "123,456,789"
    
    

    如果要把 "12345678 123456789" 替换成 "12,345,678 123,456,789"

    也就是说,我们要匹配的不仅仅是开始和结束的位置。而是要求字符组和非字符组的间隔位置。那么我们可以把它们替换成上面刚刚学习到的\b

    那么就是这样。

    var string = "12345678 123456789",
    regex = /(?!\b)(?=(\d{3})+\b)/g;
    var result = string.replace(regex, ',')
    console.log(result);
    // => "12,345,678 123,456,789"
    

    其中 (?!\b) 怎么理解呢?
    要求当前是一个位置,但不是 \b 前面的位置,其实 (?!\b) 说的就是 \B

    因此最终正则变成了:/\B(?=(\d{3})+\b)/g

    可视化就是

    image.png

    相关文章

      网友评论

          本文标题:不积跬步之第二章--正则位置匹配攻略

          本文链接:https://www.haomeiwen.com/subject/slxmeltx.html