js正则表达式简单入门

作者: 甚时跃马归来 | 来源:发表于2019-08-13 20:28 被阅读1次

    正则表达式是一个用于操作字符串的很强大的工具,应用广泛,具有很高的价值。像我们很常见的表单校验功能,数据爬虫等都能用上。

    分类

    正则表达式中概念性的东西多而杂,不易于记忆和学习。为了易于学习,这几天我简单的给正则里的概念分类和整理了一下,这里记录一下。

    方法

    js中正则表达式对象的方法比较少,有3个

    • compile() 编译正则表达式
    • test() 检测字符串是否符合特定规则,返回true或者false
    • exec() 检索字符串中指定的值。返回找到的值,并确定其位置。

    结构

    结构涉及到的东西比较少,像双斜杠(//),表示定义正则表达式,你的正则表达式句子需要写在双斜杠中间;开头匹配符(^);结尾匹配符($)

      // 像 /ab/ 可以匹配到包含ab的字符串
      var str1 = 'hhhh你好啊ab再见222';
      var str2 = 'hhhhaaaab222';
      var str3 = 'hhhhhahhh2b';
      var reg = /ab/ ;
      console.log(reg.test(str1)); // 结果为true
      console.log(reg.test(str2)); // 结果为true
      console.log(reg.test(str3)); // 结果为false
    

    上面的结果都很好理解,一眼就看出来了,那么加上开头匹配符和结尾匹配符呢?
    例如像 /^abc$/ 匹配 'ab2efeafc' 和 'abc' 的结果。

        var reg = /^abc$/
        var str1 = 'ab2efeafc';
        var str2 = 'abc';
        console.log(reg.test(str1)); // false
        console.log(reg.test(str2)); // true
    
    

    到这里也很好理解,但需要注意的是: 无论是^也好,还是$,还是之后的限定符,它们的作用范围都是临近的1个表达式或者字符的。

    限定符

    限定符,意思就是前面的规则重复几遍。在这里需要注意的是,限定符的只能作用于它前面的1个字符或者1个表达式。
    例如: /ab{2}/ 这里到底是匹配 'abab' 还是 'abb' ?

        var reg = /ab{2}/;
        var str1 = 'abab';
        var str2 = 'abb';
        
        console.log(reg.test(str1)); // false
        console.log(reg.test(str2)); // true
        
    

    限定符有以下几种形式

    • (?) 号,表示匹配前面的字符或表达式重复0次或者1次
    • (*) 号,表示匹配前面的字符或表达式重复0次或者多次
    • (+) 号,表示匹配前面的字符或表达式至少重复1次
    • ({n,m}),表示匹配前面的字符或表达式重复n-m次,若是n>m则会报错。
    • ({n}),表示匹配前面的字符或者表达式n次。
        var reg = /ab?c/;
        var str1 = 'abcab';
        var str2 = 'abbc';
        var str3 = 'accb'
        
        console.log(reg.test(str1)); // true
        console.log(reg.test(str2)); // false
        console.log(reg.test(str3)); // true
    

    区域符

    所谓区域符,是指仅仅想匹配某一些指定的字符串。这里区域符有2个,[]和()。
    区域符很简单,比如想匹配 abc中的一个,用[abc],想匹配小写a-z中的一个,用[a-z],想匹配大写字母中的一个用[A-Z],相匹配数字可以这样写[0-9]
    又比如匹配 . * ? + \等特殊字符,可以用[\.\*\?\+\\]这样。

    元字符

    元字符,即拥有特殊含义的字符。比如匹配数字,可以用\d,匹配非数字用\D;匹配换行符用\n等。具体如下

    • (.) 号,匹配单个字符,除了换行和行结束符。
    • \d ,匹配数字。
    • \D ,匹配非数字。
    • \w ,匹配单词。
    • \W ,匹配非单词。
    • \s ,匹配空白符。
    • \n ,匹配换行符。
    • \f ,匹配换页符。
    • \r ,匹配回车符。
    • \t ,匹配制表符。
    • \v ,匹配垂直符。

    比如js中,去除字符串中的所有空格可以这样写,var newStr = oldStr.replace(/\s/g,"");
    想匹配数字可以用\d ,和[0-9]是等效的。

        // 例如简单匹配手机号可以这样写,12号段目前是没有的
        var reg = /^1[3456789]\d{9}$/;
        var phone1 = '12890908931'
        var phone2 = '13078765638'
        var phone3 = '130909028931'  // 12个字符
        var phone4 = '1879089789'  // 10个字符
        var phone5 = '14909038x9' // 中间有非数字
        
        console.log(reg.test(phone1)); // false
        console.log(reg.test(phone2)); // true
        console.log(reg.test(phone3)); // false
        console.log(reg.test(phone4)); // false
        console.log(reg.test(phone5)); // false
        
    

    转义字符

    在正则中,有些字符有特殊作用,像? + . / \ 等,如果想匹配这些字符呢?那就用反斜杠()转义一下。
    例如: \+ \. \\ \/等。

    总结

    学会上面那些,就算是正则入门啦,以后简单的规则校验也难不倒了,就算是稍微复杂点的正则也能看懂了。

    相关文章

      网友评论

        本文标题:js正则表达式简单入门

        本文链接:https://www.haomeiwen.com/subject/xwcijctx.html