js正则学习笔记

作者: tiancai啊呆 | 来源:发表于2017-12-20 19:45 被阅读66次

    工作中不可避免的会用到正则表达式,现就正则做以下总结。

    • 正则简介
      正则表达式是一种表达文本模式(即字符串结构)的方法,常常用作按照“给定模式”匹配文本的工具。
      有两种创建方式,一种是使用字面量,以斜杠表示开始和结束。另一种是使用 RegExp 构造函数。
    • 正则匹配规则
      • 字面量字符
        字符只表示字面的含义,无其他特殊含义。例如/abc/就匹配字符串abc
      • 元字符
        字符有特殊含义,不代表字面的意思。主要有以下几种:
        ^表示字符串的开始位置。
        $ 表示字符串的结束位置。
        | 表示或关系。
        .表示除回车、换行 、行分隔符和段分隔符以外的所有字符。
        除此之外,还有\,*,+,?,(),[],{}等。
        此类字符如果要匹配它们本身,就需要在它们前面要加上反斜杠。
      • 字符类
        字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。
        如果方括号内的第一个字符是^,则表示除了字符类之中的字符,其他字符都可以匹配。
        对于连续序列的字符,连字符-用来提供简写形式,表示字符的连续范围。
        注意,字符类的连字符必须在头尾两个字符中间,才有特殊含义,否则就是字面含义。
        例如:/[0-9]/匹配0到9的数字;/[^0-9]/匹配除了0到9之外的所有字符。

    注意:大部分元字符在字符类中表示它们本身的含义,不代表特殊含义。

    • 预定义模式
      为了我们的方便,js将一些常用的字符类进行了包装,并提供了简写方式给我们,这就是预定义模式。
      \d:匹配0-9之间的任一数字,相当于[0-9]。
      \D:匹配所有0-9以外的字符,相当于[^0-9]。
      \w:匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]。
      \W:除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]。
      \s:匹配空格(包括制表符、空格符、断行符等),相等于[\t\r\n\v\f]。
      \S:匹配非空格的字符,相当于[^\t\r\n\v\f]。
      \b:匹配词的边界。
      \B:匹配非词边界,即在词的内部。

    • 重复类
      模式的精确匹配次数,使用大括号({})表示。{n}表示恰好重复n次,{n,}表示至少重复n次,{n,m}表示重复不少于n次,不多于m次。

    • 量词符
      ?问号表示某个模式出现0次或1次,等同于{0, 1}。
      * 星号表示某个模式出现0次或多次,等同于{0,}。
      +加号表示某个模式出现1次或多次,等同于{1,}。

    • 贪婪模式
      三个量词符,默认情况下都是最大可能匹配,即匹配直到下一个字符不满足匹配规则为止。
      如果想将贪婪模式改为非贪婪模式,可以在量词符后面加一个问号。

    • 修饰符
      修饰符表示模式的附加规则,放在正则模式的最尾部,可以单个使用,也可以多个一起使用。
      i:表示忽略大小写;g:表示全局匹配;m:表示多行模式。

    • 组匹配
      我们知道重复类只能给单个字符设置,那么假如我们要重复hello三遍该怎么写呢?此时就要用到组匹配。
      例如:var reg = /(hello){3}/。圆括号表示分组匹配。在正则表达式内部,可以用\n引用括号匹配的内容,n是从1开始的自然数,表示对应顺序的括号。
      (?:x)称为非捕获组,表示不返回该组匹配的内容,即匹配的结果中不计入这个括号。
      x(?=y)称为先行断言,表示x只有在y前面才匹配,y不会被计入返回结果。
      x(?!y)称为先行否定断言,表示x只有不在y前面才匹配,y不会被计入返回结果。

    • 正则对象属性与方法

      • 属性:
        ignoreCase:返回一个布尔值,表示是否设置了i修饰符,该属性只读。
        global:返回一个布尔值,表示是否设置了g修饰符,该属性只读。
        multiline:返回一个布尔值,表示是否设置了m修饰符,该属性只读。
        lastIndex:返回下一次开始搜索的位置。该属性可读写,但是只在设置了g修饰符时有意义。
        source:返回正则表达式的字符串形式(不包括反斜杠),该属性只读。
      • 方法:
        test():返回一个布尔值,表示当前模式是否能匹配参数字符串。
        exec():返回一个数组,成员是每一个匹配成功的子字符串,否则返回null。
        如果正则表示式包含圆括号(即含有“组匹配”),则返回的数组会包括多个成员。第一个成员是整个匹配成功的结果,后面的成员就是圆括号对应的匹配成功的组。该数组还包含以下两个属性,input表示整个原字串,index表示整个模式匹配成功的开始位置(从0开始计数)。
    • 工作中常用的正则

      • 邮箱验证:var reg = /^([\w+])+@\w+([.]\w+)+$/
      • 手机号验证:var reg = /^1((3[0-9])|(8[0-9])|(5[^4])|(4[5789])|(7[35678]))\d{8}$/
      • 中文验证:var reg = /[\u4e00-\u9fa5]*/

    相关文章

      网友评论

        本文标题:js正则学习笔记

        本文链接:https://www.haomeiwen.com/subject/ljopwxtx.html