美文网首页
正则表达式

正则表达式

作者: ITtian | 来源:发表于2018-01-25 21:57 被阅读13次

    js正则表达式总结

    • 正则表达式的字符匹配

      量词横向模糊匹配

      var regex = /ab{2,5}/g

      g 表示全局匹配,意味着找到目标字符串中所有匹配的子串,若是不加的话,则只会找到第一个匹配的子串

      {m,n} 表示连续出现最少m次,最多n次

      {m,} 表示最少出现m次

      ? 等价于{0,1} 表示出现1次或者不出现

      + 等价于{1,} 表示最少出现1次

      * 表示出现任意次,有可能不出现

      量词会有贪婪匹配和惰性匹配,
      一般情况下是贪婪匹配,尽量的想要的更多,比如{2,5}会尽量的去匹配5个,意味着想要一次性吃饱

      惰性匹配,虽然2到5次都行,但是当2个就够的时候,就不在往下尝试了,意味着有吃的就好,惰性匹配模式在量词后面加个?就好,

      {m,n}?
      {m,}?
      ??
      +?
      *?
      

      字符组
      虽然是叫做字符组,但只是其中的一个字符,例如[abc],表示匹配一个字符,它可以是"a","b","c"之一

      [abc]表示一个除"a","b","c"之外的任意一个字符,字符组的第一位放,表示求反的概念

      \d 就是[0-9] 表示一位数字
      \D 就是[^0-9] 表示除数字之外的任意字符
      \w 就是[0-9a-zA-Z_] 表示数字大小写字母和下划线,也称单词字符
      \W 就是[^0-9a-zA-Z_] 表示任意一个非单词字符
      \s 就是[ \t\v\n\r\f] 表示空白符
      \S 就是[^ \t\v\n\r\f] 表示任意一个非空白符
      . 通配符,任意一个字符
      

      也可以使用[\d\D],[\w\W],[\s\S],[^]表示任意一个字符

      多选分支

      多选分支可以支持多个子模式任选其一,形式如下:(p1|p2|p3)

      分支结构也是惰性的,当p1匹配上时,就不会再去尝试匹配p2,p3了

    • 正则表达式的位置匹配

      位置就是相邻字符之间的地方,在正则中共有6个位置字符

      ^ 匹配开头,在多行模式中匹配行开头
      $ 匹配结尾,在多行模式中匹配行结尾
      \b 是单词边界,单词与非单词之间的位置,具体就是\w和\W之间的位置,\w与^之间的位置,\w与$之间的位置
      \B 表示非单词边界,就是这个位置两边要么都是单词,要么都不是单词,具体就是\w与\w,\W与\W ^与\W \W与$之间的位置
      (?=p) p表示一个子模式,即这个模式之前的位置,也就是说这个位置之后就是这个子模式的匹配结果
      (?!p) 这个位置之后不是子模式
      
    • 正则表达式括号的作用

      括号在正则中的作用如下

      分组和分支结构
      捕获分组
      反向引用
      非捕获分组
      

      分组和分支结构

      /(ab)+/
      括号提供分组的功能,是+作用于“ab”这个整体

      /^I Love (Javascript|regular Expression)$/
      括号组成了一个分支结构

      引用分组
      有个引用分组,我们就可以进行数据提取,以及更强大的替换操作

      var regex = /(\d{4})-(\d{2})-(\d{2})/;
      var string = "2017-06-12";
      console.log( string.match(regex) );
      // ["2017-06-12", "2017", "06", "12", index: 0, input: "2017-06-12"]
      
      正则表达式后面没有g的话,会返回匹配的子串以及各个分组,
      但是有g的话,只会返回匹配的子串,不会返回分组
      var regex = /(\d{4})-(\d{2})-(\d{2})/g;
      // ["2017-06-12"]
      
      替换
      var result = string.replace(regex, "$2/$3/$1");
      
      反向引用
      可以保证后面的模式与前面的一致
      var regex = /\d{4}(-|\/|\.)\d{2}\1\d{2}/;
      
      非捕获分组
      只想要括号最原始的功能,但不会引用它,此时可以使用非捕获分组(?:p),等于(p)
      
      • 正则表达式的几种使用场景
        1,验证
        regex.test(string)
        string.search(regex)
        string.match(regex)
        regex.exec(string)
        2,切分
        string.split(regex)
        3,提取
        string.match(regex) 正则不要加g
        regex.exec(string)
        4,替换
        string.replace(regex,function(){})
        "1234 2345 3456".replace(/(\d)\d{2}(\d)/g, function(match, $1, $2, index, input) {
             console.log([match, $1, $2, index, input]);
        });
        // => ["1234", "1", "4", 0, "1234 2345 3456"]
        // => ["2345", "2", "5", 5, "1234 2345 3456"]
        // => ["3456", "3", "6", 10, "1234 2345 3456"]
        

    参考自JS正则表达式完整教程(略长)

    相关文章

      网友评论

          本文标题:正则表达式

          本文链接:https://www.haomeiwen.com/subject/qvpbaxtx.html