美文网首页
关于JS的正则表达式骚操作

关于JS的正则表达式骚操作

作者: lhyt | 来源:发表于2018-02-07 10:53 被阅读0次

本文是lhyt本人原创,希望用通俗易懂的方法来理解一些细节和难点。转载时请注明出处。文章最早出现于本人github

0.前言

本文主要介绍了捕获和非捕获的概念,并举了一些例子,这些都是正则表达式在js中进阶的一些用法。后面有彩蛋哦

1.捕获

1.1RegExp对象的相关属性

一般用()括住的就是捕获组,而且类似于算术中的括号,从左到右,逐层去括号。比如存在(A)((B)C)这种,他捕获到的将会是(A)((B)C)、(B)、((B)C),并在内存中存放,可以通过RegExp对象的$属性来访问到。

/(1((2)3))/.test('123')

RegExp.$1 //123

RegExp.$2 //2

RegExp.$3 //23

/(((1)2)3)/.test('123')

RegExp.$1 //123

RegExp.$2 //12

RegExp.$3 //1

这个顺序,按左括号的顺序来算的,第几个(就表示第几个$符号属性,一般从1开始,最多$9

还有一些旧的RegExp长属性名,在高级程序设计108页里面

简写的话还是有很多不兼容的问题的,最好写全称

1.2数字的反向引用

有的人就问,用正则怎么匹配AABB类型的词语?比如高高兴兴、亮晶晶这些。在正则里面反斜杠+数字就可以做到,表示重复第n个捕获组的内容,这个n和上面$后面的数字同理:

/(.)\1(.)\2/.test('高高兴兴') //TRUE,第一个和第二个相同,第三四个相同

/(.)(.)\2/.test('亮晶晶') // TRUE ,后面两个相同

2.非捕获

以 (?) 开头的组是非捕获组,它不捕获文本 ,也不针对组合计进行各种操作,不将匹配到的字符存储到内存中,从而节省内存。也就是上面所讲的$属性他都不会具有。一般用于只需要检测结果的情况。

(?:a)非捕获一个a

/(?:a)1(?:b)/.test('a1b') //true

RegExp.$1 //''

var reg = /(?:\d{4})-(\d{2})-(\d{2})/

var date = '2018-01-02'

reg.test(date)

RegExp.$1 // 01

RegExp.$2 // 02

2.1断言

也有人叫前瞻,顾名思义,就是往前面(右边)看,看看是不是某个东西。

(?=x) 匹配后面是x的数据 :

/i am (?=a)/.test('i am a') //你右边是a

(?!x) 匹配后面不是x的数据

/i am (?!a)/.test('i am b') //你右边不是a

2.2筛选

(?!B)[A-Z]:在大写字母集合中,除去B

/(?!B)[A-Z]/.test('A') //true

/(?!B)[A-Z]/.test('B') //false

3.匹配模式

3.1惰性匹配和贪婪模式

*? 重复0次或更多次

+? 重复一次或更多次

?? 重复0次或一次

{n,}? 重复n次或更多次

{n,m}? 重复n到m次

以上所有的匹配都是尽可能的少重复,只要满足条件就行了,不继续匹配了,在某个程度来说也是性能优化的方法之一。

那么贪婪模式就是没有做了上面的措施的都属于贪婪模式,比如正则元字符、量词单独出现的情况。

对于字符串'abbba'使用/ab*/g和/ab*? /g

贪婪模式:ab* 结果:abbb 和 a,第一次找到了a,继续找发现后面接几个b也是符合的,直到发现了第二个a才停止,再找到第二个a

惰性匹配:ab*? 结果:a 和 a,第一次找到了a,*的要求是不需要b也可以,所以停止,接着又找到第二个a

彩蛋:

检测一个数是否是质数的方法

相信大家都见过一个很强大的函数,一行代码判断出一个数是不是质数:

function isPrime(n){

return n<2?false:!/^(11+?)\1+$/.test(Array(n+1).join('1'))

}

看上去好像很牛逼,容我细细道来:

首先最小的质数是2,所以先判断是否小于2

如果大于2,先创建一个长度是n的字符串,里面铺满了1。Array(n+1)创建n+1个空位(undefined),再用1作为分隔符分开转化为字符串,所以就得到一个长度为n的字符串,全是1组成

^11+?怎么理解

表示以1开头,后面惰性匹配多个1(1个或者无穷个)

\1+$怎么理解

表示重复^11+?这段匹配到的内容

合起来怎么理解

神奇的地方来了,首先,惰性匹配的是一个1,也就是11,后面重复11的整数次,也就是重复2次4次6次...等等,如果刚刚好匹配到了,说明这个数能被整除,说明他不是质数。如果后面的字符串不能构成2的整数倍个11,那么第一轮惰性匹配失败。

接着第二轮惰性匹配,匹配11,也就是前面捕获的是111,那么后面就开始重复111的整数倍,如果刚刚好能匹配完,说明不是质数

接着第三轮,匹配111,捕获到1111,后面重复1111的整数倍

...

直到不能再匹配,说明这个数就是质数。

其实,里面相当于循环

for(var i = 2;i<n;i++){

if(n%i==0){return false}

}

return true

正则的强大,真的是法力无边。jQuery作者正则玩得飞起,号称世界上最强的选择器sizzle,就是强大正则做出来的

原文来自lhyt的github

相关文章

  • 关于JS的正则表达式骚操作

    本文是lhyt本人原创,希望用通俗易懂的方法来理解一些细节和难点。转载时请注明出处。文章最早出现于本人github...

  • js骚操作

    1. 使用 ^ 切换变量 0 或 1 2. 使用 & 判断奇偶性 偶数 & 1 = 0奇数 & 1 = 1 3. ...

  • js骚操作

    1.生成随机ID 2.每秒更新当前时间 3.生成随机 16 进制 颜色 码 如 # ffffff 4.返回键盘 5...

  • js 骚操作

    1、如何优雅的取随机字符串 2、如何优雅的取整 3、优雅的金钱格式化 4、两个属性换值 5、实现深拷贝

  • 关于js类型转换骚操作

    本文是lhyt本人原创,希望用通俗易懂的方法来理解一些细节和难点。转载时请注明出处。文章最早出现于本人github...

  • JS正则表达式的骚操作

    参考资料 《JS正则表达式的分组匹配》《正则表达式之捕获组/非捕获组介绍》《正则表达式中(?:pattern)、(...

  • js的骚操作

    1、js数组索引添加值 2、js函数parseInt(转16进制 py版本

  • JavaScript 的 4 种数组遍历方法: for VS f

    译者按: JS 骚操作。 原文:For vs forEach() vs for/in vs for/of in J...

  • PHP链式操作

    众位看官是不是很羡慕js的那种链式操作,比如这种:document.getElementById()这种骚操作,是...

  • JavaScript 正则匹配的 Unicode 模式

    疑惑的 unicode 模式 前两天室友正在看 js 关于正则表达式的博客,发现 js 正则表达式中有个 u,可以...

网友评论

      本文标题:关于JS的正则表达式骚操作

      本文链接:https://www.haomeiwen.com/subject/cmsozxtx.html