不积跬步之第二章--正则位置匹配攻略

作者: 雨飞飞雨 | 来源:发表于2021-06-12 14:48 被阅读0次

不积跬步之第二章--正则位置匹配攻略
第二章正则表达式位置匹配攻略
js正则表达式教程（一）
正则表达式位置匹配攻略
《javaScript正则表达式迷你书》（一）
不积跬步之第一章--正则字符匹配攻略
第一章正则表达式字符匹配攻略
正则表达式字符匹配攻略
正则位置匹配
不积跬步之正则的终章整理

带着问题看文章？

什么是位置？
开始位置和结束位置怎么匹配？
字符和非字符之间怎么匹配？
我想要匹配一个对象之前的位置，怎么匹配？

什么是位置呢？？

位置就是字符和字符之间的空隙。其实一段字符串是这样组成的。

const string = ""+"h"+""+"o"+""+"l"+""+"l"+""+"w";

而那些空的字符其实就是位置。

在es5中，有6个锚：

^、$、\b、\B、(?=p)、(?!p)

image.png

`^`和`$`

其中^表示开头的位置，在多行匹配中匹配行开头。而$表示结尾的位置，在多行匹配中匹配行结尾。

var result = "hello".replace(/^|$/g, '#');
console.log(result);
// => "#hello#"

多行匹配模式（即有修饰符 m）时，二者是行的概念，这一点需要我们注意：

var result = "I\nlove\njavascript".replace(/^|$/gm, '#');
console.log(result);
/*
#I#
#love#
#javascript#
*/

`\b`和`\B`

\b是单词边界，具体就是\w和\W之间的位置，\w是[0-9a-zA-Z_]，而\W则是上面的取反。同时也包括\w和^之间的位置。\w和$之间的位置。

例如"[JS] Lesson_01.mp4"中的\b.

var result = "[JS] Lesson_01.mp4".replace(/\b/g, '#');
console.log(result);
// => "[#JS#] #Lesson_01#.#mp4#"

可以看到#替换的位置是[和]之间的位置，也就是\w和\W之间的位置。

而.#mp4#则是\w和$之间的位置

知道了\b的位置，那么我们就知道了\B的意思，它是\b的取反。具体说来就是 \w 与\w、 \W 与 \W、^ 与 \W，\W 与 $ 之间的位置。

var result = "[JS] Lesson_01.mp4".replace(/\B/g, '#');
console.log(result);
// => "#[J#S]# L#e#s#s#o#n#_#0#1.m#p#4"

`(?=p)` 和 `(?!p)`

(?=p)这个模式比较有意识，它表示什么什么之前的位置。其中p表示一个子模式，先匹配到这个p的子模式，找到它，然后取它之前的位置。

例如：(?=l)，表示的是l前面的位置。

var result = "hello".replace(/(?=l)/g, '#');
console.log(result);
// => "he#l#lo"

而(?!p) 则是(?=p)的取反。

var result = "hello".replace(/(?!l)/g, '#');
console.log(result);
// => "#h#ell#o#"

二者的学名分别是 positive lookahead 和 negative lookahead。

不匹配任何东西的正则

var regex = /.^/g

因为此正则要求只有一个字符，但该字符后面是开头，而这样的字符串是不存在的。

数字的千位分隔符表示法

要求把1234567变成1,234,567。怎么匹配呢？

分析一下：

千位分隔符其实就是从后往前数，三个位置前面，就放一个逗号。

什么东西前面的位置，想到了什么，是不是位置分割父(?=\d{3}$).

其中$表示从结束位置开始匹配。

var result = "12345678".replace(/(?=\d{3}$)/g, ',')
console.log(result);
// => "12345,678"

因为逗号出现的位置，要求后面 3 个数字一组，也就是 \d{3} 至少出现一次。

var result = "12345678".replace(/(?=(\d{3})+$)/g, ',')
console.log(result);
// => "12,345,678"

如果正好是123456789正好是9位呢，那么就就会出现开头，所以我们要限制它出现在开始位置。

想到了啥？(?!^)所以组合起来是这样。

var regex = /(?!^)(?=(\d{3})+$)/g;
var result = "12345678".replace(regex, ',')
console.log(result);
// => "12,345,678"
result = "123456789".replace(regex, ',');
console.log(result);
// => "123,456,789"

如果要把 "12345678 123456789" 替换成 "12,345,678 123,456,789"。

也就是说，我们要匹配的不仅仅是开始和结束的位置。而是要求字符组和非字符组的间隔位置。那么我们可以把它们替换成上面刚刚学习到的\b

那么就是这样。

var string = "12345678 123456789",
regex = /(?!\b)(?=(\d{3})+\b)/g;
var result = string.replace(regex, ',')
console.log(result);
// => "12,345,678 123,456,789"

其中 (?!\b) 怎么理解呢？
要求当前是一个位置，但不是 \b 前面的位置，其实 (?!\b) 说的就是 \B。

因此最终正则变成了：/\B(?=(\d{3})+\b)/g。

可视化就是

image.png

网友评论

本文标题：不积跬步之第二章--正则位置匹配攻略

本文链接：https://www.haomeiwen.com/subject/slxmeltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！