工作中不可避免的会用到正则表达式,现就正则做以下总结。
- 正则简介
正则表达式是一种表达文本模式(即字符串结构)的方法,常常用作按照“给定模式”匹配文本的工具。
有两种创建方式,一种是使用字面量,以斜杠表示开始和结束。另一种是使用 RegExp 构造函数。 - 正则匹配规则
- 字面量字符
字符只表示字面的含义,无其他特殊含义。例如/abc/
就匹配字符串abc
。 - 元字符
字符有特殊含义,不代表字面的意思。主要有以下几种:
^
表示字符串的开始位置。
$
表示字符串的结束位置。
|
表示或关系。
.
表示除回车、换行 、行分隔符和段分隔符以外的所有字符。
除此之外,还有\,*,+,?,(),[],{}等。
此类字符如果要匹配它们本身,就需要在它们前面要加上反斜杠。 - 字符类
字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。
如果方括号内的第一个字符是^
,则表示除了字符类之中的字符,其他字符都可以匹配。
对于连续序列的字符,连字符-
用来提供简写形式,表示字符的连续范围。
注意,字符类的连字符必须在头尾两个字符中间,才有特殊含义,否则就是字面含义。
例如:/[0-9]/
匹配0到9的数字;/[^0-9]/
匹配除了0到9之外的所有字符。
- 字面量字符
注意:大部分元字符在字符类中表示它们本身的含义,不代表特殊含义。
-
预定义模式
为了我们的方便,js将一些常用的字符类进行了包装,并提供了简写方式给我们,这就是预定义模式。
\d
:匹配0-9之间的任一数字,相当于[0-9]。
\D
:匹配所有0-9以外的字符,相当于[^0-9]。
\w
:匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]。
\W
:除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]。
\s
:匹配空格(包括制表符、空格符、断行符等),相等于[\t\r\n\v\f]。
\S
:匹配非空格的字符,相当于[^\t\r\n\v\f]。
\b
:匹配词的边界。
\B
:匹配非词边界,即在词的内部。 -
重复类
模式的精确匹配次数,使用大括号({})表示。{n}表示恰好重复n次,{n,}表示至少重复n次,{n,m}表示重复不少于n次,不多于m次。 -
量词符
?
问号表示某个模式出现0次或1次,等同于{0, 1}。
*
星号表示某个模式出现0次或多次,等同于{0,}。
+
加号表示某个模式出现1次或多次,等同于{1,}。 -
贪婪模式
三个量词符,默认情况下都是最大可能匹配,即匹配直到下一个字符不满足匹配规则为止。
如果想将贪婪模式改为非贪婪模式,可以在量词符后面加一个问号。 -
修饰符
修饰符表示模式的附加规则,放在正则模式的最尾部,可以单个使用,也可以多个一起使用。
i
:表示忽略大小写;g
:表示全局匹配;m
:表示多行模式。 -
组匹配
我们知道重复类只能给单个字符设置,那么假如我们要重复hello三遍该怎么写呢?此时就要用到组匹配。
例如:var reg = /(hello){3}/
。圆括号表示分组匹配。在正则表达式内部,可以用\n
引用括号匹配的内容,n是从1开始的自然数,表示对应顺序的括号。
(?:x)
称为非捕获组,表示不返回该组匹配的内容,即匹配的结果中不计入这个括号。
x(?=y)
称为先行断言,表示x只有在y前面才匹配,y不会被计入返回结果。
x(?!y)
称为先行否定断言,表示x只有不在y前面才匹配,y不会被计入返回结果。 -
正则对象属性与方法
- 属性:
ignoreCase
:返回一个布尔值,表示是否设置了i修饰符,该属性只读。
global
:返回一个布尔值,表示是否设置了g修饰符,该属性只读。
multiline
:返回一个布尔值,表示是否设置了m修饰符,该属性只读。
lastIndex
:返回下一次开始搜索的位置。该属性可读写,但是只在设置了g修饰符时有意义。
source
:返回正则表达式的字符串形式(不包括反斜杠),该属性只读。 - 方法:
test()
:返回一个布尔值,表示当前模式是否能匹配参数字符串。
exec()
:返回一个数组,成员是每一个匹配成功的子字符串,否则返回null。
如果正则表示式包含圆括号(即含有“组匹配”),则返回的数组会包括多个成员。第一个成员是整个匹配成功的结果,后面的成员就是圆括号对应的匹配成功的组。该数组还包含以下两个属性,input
表示整个原字串,index
表示整个模式匹配成功的开始位置(从0开始计数)。
- 属性:
-
工作中常用的正则
- 邮箱验证:
var reg = /^([\w+])+@\w+([.]\w+)+$/
- 手机号验证:
var reg = /^1((3[0-9])|(8[0-9])|(5[^4])|(4[5789])|(7[35678]))\d{8}$/
- 中文验证:
var reg = /[\u4e00-\u9fa5]*/
- 邮箱验证:
网友评论