正则新特性
在正式开始之前,简单地了解一下ES5的修饰符:
这些符号被称为正则表达式模式修饰符,用法含义如下:
1、/g 表示该表达式将用来在输入字符串中查找所有可能的匹配,返回的结果可以是多个。如果不加/g最多只会匹配一个
2、/i 表示匹配的时候不区分大小写,这个跟其它语言的正则用法相同
3、/m 表示多行匹配。什么是多行匹配呢?就是匹配换行符两端的潜在匹配。影响正则中的^$符号
4、/s 与/m相对,单行模式匹配。
5、/e 可执行模式,此为PHP专有参数,例如preg_replace函数。
6、/x 忽略空白模式。
这里有值得注意的一点,这些修饰符是可以混合使用的。例如 /ig、/ie等。
1、构造函数的变化
//es5
let regex = new RegExp('xyz','i');//忽略大小写
let regex2 = new RegExp(/xyz/i);
let regex12 = /xyz/i; //上面两种方法简写
console.log(regex.test('xyz123'), regex12.test('xyz123'));//true, true
//es6
let regex3 = new RegExp(/xyz/ig, 'i');
console.log(regex3.flags);//i 获取正则修饰符,es6中第二个参数覆盖了第一个的修饰符
2、正则方法的扩展
字符串对象共有4个方法,可以使用正则表达式:match()、replace()、search()和split()。
ES6将这4个方法,在语言内部全部调用RegExp的实例方法,从而做到所有与正则相关的方法,全都定义在RegExp对象上。
String.prototype.match 调用 RegExp.prototype[Symbol.match]
String.prototype.replace 调用 RegExp.prototype[Symbol.replace]
String.prototype.search 调用 RegExp.prototype[Symbol.search]
String.prototype.split 调用 RegExp.prototype[Symbol.split]
3、u修饰符*
/*u修饰符:
* 理解:正则处理UNcode字符时候的特征值
* 如果处理的字符串中有大于两个字节的一定要加u修饰符
* 修改es5中。点可以匹配一切字符的观念,大于两个字节就不能匹配
* */
//不加u,无法将四个字节的UTF-16编码识别为一个字符,所以就可以产生匹配。
console.log('u-1:', /^\uD83D/.test('\uD83D\uDC2A'));//true
//加u,将四个字节的UTF-16编码识别为一个字符,所以就不可以产生匹配。
console.log('u-2:', /^\uD83D/u.test('\uD83D\uDC2A'));//false
console.log(/\u{61}/.test('a'));//false
console.log(/\u{61}/u.test('a'));//true {}中的是Unicode编码不加u无法识别
console.log(`\u{20BB7}`);
//. 用于匹配任何字符,在这种大于两个字节字符的情况下不成立
let s = '𠮷';
console.log('1:',/^.$/.test(s));
console.log('2:',/^.$/u.test(s));
//字符串中有的字符大于两个字节的要加上u才能识别
console.log('3:',/𠮷{2}/.test('𠮷𠮷'));
console.log('4:',/𠮷{2}/u.test('𠮷𠮷'));
4、y修饰符*
/*y修饰符:
* y和g修饰符的比较:
* 相同点:都是全局匹配
* 不同点:g是匹配后,接下来只要有符合的就能匹配上,
* 但是y修饰符是必须从下一个了开始匹配,不成功就是null
*
* */
let s = 'bbb_bb_b';
let a1 = /b+/g;
let a2 = /b+/y;
console.log("1:", a1.exec(s), a2.exec(s));//exec() 方法用于检索字符串中的正则表达式的匹配。
console.log("2:", a1.exec(s), a2.exec(s));
//es中新增属性sticky,判断一个正则对象是否开启了y修饰符,返回true\false
console.log(a1.sticky, a2.sticky);
// ES5的source属性
console.log(/abc/ig.source);//"abc" 返回正则表达式的正文
5、s修饰符(es6还没有实现)
- 换行符、回车符、行分隔符、段分隔符,点(.)也是不能识别的,需要加上s修饰符。
网友评论