关于JS的正则表达式骚操作

作者: lhyt | 来源:发表于2018-02-07 10:53 被阅读0次

关于JS的正则表达式骚操作
js骚操作
js骚操作
js 骚操作
关于js类型转换骚操作
JS正则表达式的骚操作
js的骚操作
JavaScript 的 4 种数组遍历方法： for VS f
PHP链式操作
JavaScript 正则匹配的 Unicode 模式

本文是lhyt本人原创，希望用通俗易懂的方法来理解一些细节和难点。转载时请注明出处。文章最早出现于本人github

0.前言

本文主要介绍了捕获和非捕获的概念，并举了一些例子，这些都是正则表达式在js中进阶的一些用法。后面有彩蛋哦

1.捕获

1.1RegExp对象的相关属性

一般用（）括住的就是捕获组，而且类似于算术中的括号，从左到右，逐层去括号。比如存在（A）（（B）C）这种，他捕获到的将会是(A)((B)C)、(B)、((B)C)，并在内存中存放，可以通过RegExp对象的$属性来访问到。

/(1((2)3))/.test('123')

RegExp.$1 //123

RegExp.$2 //2

RegExp.$3 //23

/(((1)2)3)/.test('123')

RegExp.$1 //123

RegExp.$2 //12

RegExp.$3 //1

这个顺序，按左括号的顺序来算的，第几个（就表示第几个$符号属性，一般从1开始，最多$9

还有一些旧的RegExp长属性名，在高级程序设计108页里面

简写的话还是有很多不兼容的问题的，最好写全称

1.2数字的反向引用

有的人就问，用正则怎么匹配AABB类型的词语？比如高高兴兴、亮晶晶这些。在正则里面反斜杠+数字就可以做到，表示重复第n个捕获组的内容，这个n和上面$后面的数字同理：

/(.)\1(.)\2/.test('高高兴兴') //TRUE，第一个和第二个相同，第三四个相同

/(.)(.)\2/.test('亮晶晶') // TRUE ，后面两个相同

2.非捕获

以 (?) 开头的组是非捕获组，它不捕获文本，也不针对组合计进行各种操作，不将匹配到的字符存储到内存中，从而节省内存。也就是上面所讲的$属性他都不会具有。一般用于只需要检测结果的情况。

(?:a)非捕获一个a

/(?:a)1(?:b)/.test('a1b') //true

RegExp.$1 //''

var reg = /(?:\d{4})-(\d{2})-(\d{2})/

var date = '2018-01-02'

reg.test(date)

RegExp.$1 // 01

RegExp.$2 // 02

2.1断言

也有人叫前瞻，顾名思义，就是往前面（右边）看，看看是不是某个东西。

(?=x) 匹配后面是x的数据：

/i am (?=a)/.test('i am a') //你右边是a

(?!x) 匹配后面不是x的数据

/i am (?!a)/.test('i am b') //你右边不是a

2.2筛选

(?!B)[A-Z]：在大写字母集合中，除去B

/(?!B)[A-Z]/.test('A') //true

/(?!B)[A-Z]/.test('B') //false

3.匹配模式

3.1惰性匹配和贪婪模式

*? 重复0次或更多次

+? 重复一次或更多次

?? 重复0次或一次

{n,}? 重复n次或更多次

{n,m}? 重复n到m次

以上所有的匹配都是尽可能的少重复，只要满足条件就行了，不继续匹配了，在某个程度来说也是性能优化的方法之一。

那么贪婪模式就是没有做了上面的措施的都属于贪婪模式，比如正则元字符、量词单独出现的情况。

对于字符串'abbba'使用/ab*/g和/ab*? /g

贪婪模式：ab* 结果：abbb 和 a，第一次找到了a，继续找发现后面接几个b也是符合的，直到发现了第二个a才停止，再找到第二个a

惰性匹配：ab*? 结果：a 和 a，第一次找到了a，*的要求是不需要b也可以，所以停止，接着又找到第二个a

彩蛋：

检测一个数是否是质数的方法

相信大家都见过一个很强大的函数，一行代码判断出一个数是不是质数：

function isPrime(n){

return n<2?false:!/^(11+?)\1+$/.test(Array(n+1).join('1'))

}

看上去好像很牛逼，容我细细道来：

首先最小的质数是2，所以先判断是否小于2

如果大于2，先创建一个长度是n的字符串，里面铺满了1。Array(n+1)创建n+1个空位（undefined），再用1作为分隔符分开转化为字符串，所以就得到一个长度为n的字符串，全是1组成

^11+？怎么理解

表示以1开头，后面惰性匹配多个1（1个或者无穷个）

\1+$怎么理解

表示重复^11+？这段匹配到的内容

合起来怎么理解

神奇的地方来了，首先，惰性匹配的是一个1，也就是11，后面重复11的整数次，也就是重复2次4次6次...等等，如果刚刚好匹配到了，说明这个数能被整除，说明他不是质数。如果后面的字符串不能构成2的整数倍个11，那么第一轮惰性匹配失败。

接着第二轮惰性匹配，匹配11，也就是前面捕获的是111，那么后面就开始重复111的整数倍，如果刚刚好能匹配完，说明不是质数

接着第三轮，匹配111，捕获到1111，后面重复1111的整数倍

...

直到不能再匹配，说明这个数就是质数。

其实，里面相当于循环

for(var i = 2;i<n;i++){

if(n%i==0){return false}

}

return true

正则的强大，真的是法力无边。jQuery作者正则玩得飞起，号称世界上最强的选择器sizzle，就是强大正则做出来的

原文来自lhyt的github

网友评论

本文标题：关于JS的正则表达式骚操作

本文链接：https://www.haomeiwen.com/subject/cmsozxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

关于JS的正则表达式骚操作

0.前言

1.捕获

1.1RegExp对象的相关属性

1.2数字的反向引用

2.非捕获

2.1断言

2.2筛选

3.匹配模式

3.1惰性匹配和贪婪模式

彩蛋：

相关文章

关于JS的正则表达式骚操作

js骚操作

js骚操作

js 骚操作

关于js类型转换骚操作

JS正则表达式的骚操作

js的骚操作

JavaScript 的 4 种数组遍历方法： for VS f

PHP链式操作

JavaScript 正则匹配的 Unicode 模式

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读