美文网首页
正则表达式

正则表达式

作者: lyp82nkl | 来源:发表于2019-06-21 00:28 被阅读0次

    前言

    如何学习:30分钟入门正则表达式
    本文参(zhao)考(chao)RegExp 对象,该笔记只为速查

    定义

    正则表达式(regular expression)是用于匹配字符串中字符组合的模式。在 JavaScript中,正则表达式也是对象,其体系参照 Perl 5 建立。

    创建正则表达式的方法

    使用一个正则表达式字面量

    var re = /xxx/
    

    调用 RegExp 对象的构造函数

    var re = new RegExp('xxx')
    

    两种方法主要区别是:第一种方法在引擎编译代码时,就会新建正则表达式,第二种方法在运行时新建正则表达式,所以前者的效率较高。而且,前者比较便利和直观,所以实际应用中,基本上都采用字面量定义正则表达式。

    正则表达式的实例属性

    1. 修饰符(只读)
      RegExp.prototype.ignoreCase:返回一个布尔值,表示是否设置了i修饰符。用于忽略字符串大小写。
      RegExp.prototype.global:返回一个布尔值,表示是否设置了g修饰符。用于全局匹配。
      RegExp.prototype.multiline:返回一个布尔值,表示是否设置了m修饰符。用于设置匹配为多行模式。
    2. 其他属性
      RegExp.prototype.lastIndex:返回一个数值,表示下一次开始搜索的位置。该属性可读写,但是只在进行连续搜索时有意义,详细介绍请看后文。
      RegExp.prototype.source:返回正则表达式的字符串形式(不包括反斜杠),该属性只读。

    实例方法

    1. RegExp.prototype.test()

    test 方法返回布尔值,表示当前模式是否能匹配参数字符串

    /a/.test('and') // true
    
    2. RegExp.prototype.exec()

    exec方法,用来返回匹配结果
    如果发现匹配,就返回一个数组,成员是匹配成功的子字符串,否则返回null

    /a/.exec('adbca')
    

    如果正则表示式包含圆括号(即含有“组匹配”),则返回的数组会包括多个成员。第一个成员是整个匹配成功的结果,后面的成员就是圆括号对应的匹配成功的组。也就是说,第二个成员对应第一个括号,第三个成员对应第二个括号,以此类推。整个数组的length属性等于组匹配的数量再加1。

    String.prototype.match():返回一个数组,成员是所有匹配的子字符串。
    String.prototype.search():按照给定的正则表达式进行搜索,返回一个整数,表示匹配开始的位置。
    String.prototype.replace():按照给定的正则表达式进行替换,返回替换后的字符串。
    String.prototype.split():按照给定规则进行字符串分割,返回一个数组,包含分割后的各个成员。

    字面量字符和元字符

    元字符
    点字符(.)

    1. 匹配除回车(\r)、换行(\n) 、行分隔符(\u2028)和段分隔符(\u2029)以外的所有字符。
    2. 位置字符
    ^ 表示字符串的开始位置
    $ 表示字符串的结束位置
    
    1. 选择符(|)
      表示“或关系”
    2. 转义符
      匹配元字符本身可以在它们前面加反斜杠
      构造函数需要两次转义
    3. 特殊字符
    \cX 表示Ctrl-[X],其中的X是A-Z之中任一个英文字母,用来匹配控制字符。
    [\b] 匹配退格键(U+0008),不要与\b混淆。
    \n 匹配换行键。
    \r 匹配回车键。
    \t 匹配制表符 tab(U+0009)。
    \v 匹配垂直制表符(U+000B)。
    \f 匹配换页符(U+000C)。
    \0 匹配null字符(U+0000)。
    \xhh 匹配一个以两位十六进制数(\x00-\xFF)表示的字符。
    \uhhhh 匹配一个以四位十六进制数(\u0000-\uFFFF)表示的 Unicode 字符。
    

    字符类

    字符类(class)表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内,比如[^xyz] 表示x、y、z之中任选一个匹配。

    1. 脱字符(^):需在字符类第一位
      表示除了字符类之中的字符,其他字符都可以匹配。只有[^],就表示匹配一切字符,包括换行符。相比之下,点号作为元字符(.)是不包括换行符的。
    2. 连字符(-)
    [0-9.,]
    [0-9a-fA-F]
    [a-zA-Z0-9-]
    [1-31] // 不代表1到31,只代表1到3
    

    预定义模式:某些常见模式的简写方式

    \d 匹配0-9之间的任一数字,相当于[0-9]。
    \D 匹配所有0-9以外的字符,相当于[^0-9]。
    \w 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]。
    \W 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]。
    \s 匹配空格(包括换行符、制表符、空格符等),相等于[ \t\r\n\v\f]。
    \S 匹配非空格的字符,相当于[^ \t\r\n\v\f]。
    \b 匹配词的边界。
    \B 匹配非词边界,即在词的内部
    

    重复类

    模式的精确匹配次数,使用大括号({})表示。{n}表示恰好重复n次,{n,}表示至少重复n次,{n,m}表示重复不少于n次,不多于m次。

    量词符:设定某个模式出现的次数

    ? 问号表示某个模式出现0次或1次,等同于{0, 1}。
    * 星号表示某个模式出现0次或多次,等同于{0,}。
    + 加号表示某个模式出现1次或多次,等同于{1,}。
    

    贪婪模式

    var s = 'aaa';
    s.match(/a+/) // ["aaa"]
    
    贪婪模式改为非贪婪模式
    *?:表示某个模式出现0次或多次,匹配时采用非贪婪模式。
    +?:表示某个模式出现1次或多次,匹配时采用非贪婪模式。
    

    字符串去空格(replace)

    var str = '  #id div.class  ';
    str.trim() // "#id div.class"
    str.replace(/^\s+|\s+$/g, '') // "#id div.class"
    $&:匹配的子字符串。
    $`:匹配结果前面的文本。
    $’:匹配结果后面的文本。
    $n:匹配成功的第n组内容,n是从1开始的自然数。
    $$:指代美元符号$。
    

    正则表达式题目

    题目1: \d,\w,\s,[a-zA-Z0-9],\b,.,*,+,?,x{3},^,$分别是什么?

    下面是一些常见的元字符:

    . 匹配除 \n 以外的任何字符(注意元字符是小数点)。
    [abcde] 匹配 abcde 之中的任意一个字符
    [a-h] 匹配 a 到 h 之间的任意一个字符
    [^fgh] 不与 fgh 之中的任意一个字符匹配
    \w 匹配大小写英文字符及数字 0 到 9 之间的任意一个及下划线,相当于 [a-zA-Z0-9_]
    \W 不匹配大小写英文字符及数字 0 到 9 之间的任意一个,相当于 [^a-zA-Z0-9_]
    \s 匹配任何空白字符,相当于 [ \f\n\r\t\v]
    \S 匹配任何非空白字符,相当于 [^\s]
    \d 匹配任何 0 到 9 之间的单个数字,相当于 [0-9]
    \D 不匹配任何 0 到 9 之间的单个数字,相当于 [^0-9]
    [\u4e00-\u9fa5] 匹配任意单个汉字(这里用的是 Unicode 编码表示汉字的 )

    下面是一些常见的限定符 ( 下表中 n 和 m 都是表示整数,并且 0<n<m) :

    *匹配 0 到多个元字符,相当于 {0,}
    ? 匹配 0 到 1 个元字符,相当于 {0,1}
    {n} 匹配 n 个元字符
    {n,} 匹配至少 n 个元字符
    {n,m} 匹配 n 到 m 个元字符
    +匹配至少 1 个元字符,相当于 {1,}
    \b 匹配单词边界
    ^ 字符串必须以指定的字符开始
    $ 字符串必须以指定的字符结束

    [a-zA-Z0-9] 包含所有英文小写字母a-z和大写字母A-Z,以及数字0-9
    x{3} 量词,表示x出现3次

    题目2: 写一个函数trim(str),去除字符串两边的空白字符

    function trim(str){
       if(typeof str === 'string'){
        return str.replace(/^\s+|\s+$/g,'');
    }else{
       return '不是字符串';
    }
    }
    

    题目3: 写一个函数isEmail(str),判断用户输入的是不是邮箱

    function isEmail(str){
       var email = /^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/;
       return email.test(str);
    }
    

    题目4: 写一个函数isPhoneNum(str),判断用户输入的是不是手机号

     function isPhoneNum(str){
       var num = /^1[0-9]{10}$/;
       return num.test(str);
    }
    

    题目5: 写一个函数isValidUsername(str),判断用户输入的是不是合法的用户名(长度6-20个字符,只能包括字母、数字、下划线)

    function isVaildUsername(str){
     return /^\w{6,20}$/.test(str);
    }
    

    题目6: 写一个函数isValidPassword(str), 判断用户输入的是不是合法密码(长度6-20个字符,只包括大写字母、小写字母、数字、下划线,且至少至少包括两种)

    function isValidPassword(str){
    if(!/^\w{6,20}$/.test(str)){
            return false;
    }
    if(/^\d{6,20}$/.test(str)){
        return false;
    }
    if(/^[a-z]{6,20}$/.test(str)){
        return false;
    }
    if(/^[A-Z]{6,20}$/.test(str)){
        return false;
    }
    if(/^_{6,20}$/.test(str)){
        return false;
    }
    return true;
    }
    

    题目7: 写一个正则表达式,得到如下字符串里所有的颜色

    var reg = /#([0-9a-fA-F]{6}|[0-9a-fA-F]{3})(?=;)/g;
    var subj = "color: #121212; background-color: #AA00ef;     width: 12px; bad-colors: f#fddee "
    console.log( subj.match(re) )  // ['#121212', '#AA00ef']
    

    题目8: 下面代码输出什么? 为什么? 改写代码,让其输出[""hunger"", ""world""]

    var str = 'hello  "hunger" , hello "world"';
    var pat =  /".*"/g;
    str.match(pat);
    

    意思是:匹配以"开头"结束,且引号中为任意个除换行符和回车以外的任意字符,全局匹配。
    默认是贪婪模式,会尽可能多匹配,所以结果为

    [""hunger" , hello "world""]
    

    而要想得到[""hunger"", ""world""]的结果可以将正则改为如下代码:
    可以加上?变成非贪婪模式 尽可能少匹配

     var pat =  /".*?"/g;
    

    相关文章

      网友评论

          本文标题:正则表达式

          本文链接:https://www.haomeiwen.com/subject/ayteqctx.html