带着问题看文章?
- 什么是位置?
- 开始位置和结束位置怎么匹配?
- 字符和非字符之间怎么匹配?
- 我想要匹配一个对象之前的位置,怎么匹配?
什么是位置呢??
位置就是字符和字符之间的空隙。其实一段字符串是这样组成的。
const string = ""+"h"+""+"o"+""+"l"+""+"l"+""+"w";
而那些空的字符其实就是位置。
在es5中,有6个锚:
^、$、\b、\B、(?=p)、(?!p)
image.png
^
和$
其中^
表示开头的位置,在多行匹配中匹配行开头。而$
表示结尾的位置,在多行匹配中匹配行结尾。
var result = "hello".replace(/^|$/g, '#');
console.log(result);
// => "#hello#"
多行匹配模式(即有修饰符 m)时,二者是行的概念,这一点需要我们注意:
var result = "I\nlove\njavascript".replace(/^|$/gm, '#');
console.log(result);
/*
#I#
#love#
#javascript#
*/
\b
和\B
\b
是单词边界,具体就是\w
和\W
之间的位置,\w
是[0-9a-zA-Z_]
,而\W
则是上面的取反。同时也包括\w
和^
之间的位置。\w
和$
之间的位置。
例如"[JS] Lesson_01.mp4"
中的\b
.
var result = "[JS] Lesson_01.mp4".replace(/\b/g, '#');
console.log(result);
// => "[#JS#] #Lesson_01#.#mp4#"
可以看到#
替换的位置是[
和]
之间的位置,也就是\w
和\W
之间的位置。
而.#mp4#
则是\w
和$
之间的位置
知道了\b
的位置,那么我们就知道了\B
的意思,它是\b
的取反。具体说来就是 \w
与\w
、 \W
与 \W
、^
与 \W
,\W
与 $
之间的位置。
var result = "[JS] Lesson_01.mp4".replace(/\B/g, '#');
console.log(result);
// => "#[J#S]# L#e#s#s#o#n#_#0#1.m#p#4"
(?=p)
和 (?!p)
(?=p)
这个模式比较有意识,它表示什么什么之前的位置。其中p
表示一个子模式,先匹配到这个p
的子模式,找到它,然后取它之前的位置。
例如:(?=l)
,表示的是l
前面的位置。
var result = "hello".replace(/(?=l)/g, '#');
console.log(result);
// => "he#l#lo"
而(?!p)
则是(?=p)
的取反。
var result = "hello".replace(/(?!l)/g, '#');
console.log(result);
// => "#h#ell#o#"
二者的学名分别是 positive lookahead
和 negative lookahead
。
不匹配任何东西的正则
var regex = /.^/g
因为此正则要求只有一个字符,但该字符后面是开头,而这样的字符串是不存在的。
数字的千位分隔符表示法
要求把1234567
变成1,234,567
。怎么匹配呢?
分析一下:
千位分隔符 其实就是从后往前数,三个位置前面,就放一个逗号。
什么东西前面的位置,想到了什么,是不是位置分割父(?=\d{3}$)
.
其中$
表示从结束位置开始匹配。
var result = "12345678".replace(/(?=\d{3}$)/g, ',')
console.log(result);
// => "12345,678"
因为逗号出现的位置,要求后面 3 个数字一组,也就是 \d{3} 至少出现一次。
var result = "12345678".replace(/(?=(\d{3})+$)/g, ',')
console.log(result);
// => "12,345,678"
如果正好是123456789
正好是9位呢,那么就就会出现开头,所以我们要限制它出现在开始位置。
想到了啥?(?!^)
所以组合起来是这样。
var regex = /(?!^)(?=(\d{3})+$)/g;
var result = "12345678".replace(regex, ',')
console.log(result);
// => "12,345,678"
result = "123456789".replace(regex, ',');
console.log(result);
// => "123,456,789"
如果要把 "12345678 123456789"
替换成 "12,345,678 123,456,789"
。
也就是说,我们要匹配的不仅仅是开始和结束的位置。而是要求字符组和非字符组的间隔位置。那么我们可以把它们替换成上面刚刚学习到的\b
那么就是这样。
var string = "12345678 123456789",
regex = /(?!\b)(?=(\d{3})+\b)/g;
var result = string.replace(regex, ',')
console.log(result);
// => "12,345,678 123,456,789"
其中 (?!\b)
怎么理解呢?
要求当前是一个位置,但不是 \b
前面的位置,其实 (?!\b)
说的就是 \B
。
因此最终正则变成了:/\B(?=(\d{3})+\b)/g
。
可视化就是
image.png
网友评论