美文网首页
正则笔记

正则笔记

作者: gem_Y | 来源:发表于2020-11-14 23:20 被阅读0次

学习来源:腾讯课堂-Javascript正则表达式基础
学习代码:https://github.com/GemmaYin/RegExp

4-基础-字符串和RegExp的方法-regtest

    // reg.test(str) 返回true/false,表示是否匹配成功
    var str = 'aaaabc abcd addd sgd abbccb ac'
    var str2 = 'ssdsss'
    var reg = new RegExp("a(b*)c");
    console.log(reg.test(str)) // true
    console.log(reg.test(str2)) // false

5-基础-字符串和RegExp的方法-regtest

    // str.match(reg),与reg.exec相似,但是若使用g选项,则str.match一次性返回所有结果
    var str = 'aaaabc abcd addd sgd abbccb ac'

    console.log(str.match(/a(b*)c/)) // ["abc", "b", index: 3, input: "aaaabc abcd addd sgd abbccb ac"]
    console.log(str.match(/a(b*)c/g)) // ["abc", "abc", "abbc", "ac"]

7-基础-字符串和RegExp的方法-strreplace

    // str.search(reg),返回匹配成功的第一个位置
    var str = 'aaacabc abcd addd sgd abbccb ac'

// 老的方式:不会改变原来的值,而且只替换第一个
    var str2 = str.replace('c','x')
    console.log(str)  // aaacabc abcd addd sgd abbccb ac
    console.log(str2)  // aaaxabc abcd addd sgd abbccb ac

//  正则:str.replace(reg,newstr)用第一个参数reg去匹配,用第二个参数newstr去替换
    console.log(str.replace(/c/g,'x')) // aaaxabx abxd addd sgd abbxxb ax

8-基础-字符串和RegExp的方法-strsplit

    // str.search(reg),返回匹配成功的第一个位置
    var str = 'abcabbccdecdefg'

// 老的方式:按照字母b来切割
    console.log(str.split('b'))  // ["a", "ca", "", "ccdecdefg"]

//  正则:str.split(reg,[maxLength])用匹配的模式切割,第二个参数是限制返回结果的最大数量
    // 用一个b或者多个b来切割
    console.log(str.split(/b+/)) // ["a", "ca", "ccdecdefg"]

    var str2 = 'abc abbs     dd sss'
    //用一个或者多个空格来切
    console.log(str2.split(/\s+/)) // ["abc", "abbs", "dd", "sss"]
    // 最多返回两个
    console.log(str2.split(/\s+/,2)) // ["abc", "abbs"]

9-基础-i 选项

    // i表示忽略大小写
    var str = 'abc Abc abCD 123'

    console.log(str.match(/abc/g)) // ["abc"]
    console.log(str.match(/abc/gi)) // ["abc", "Abc", "abC"]
    console.log(str.match(/abc/ig)) // ["abc", "Abc", "abC"]

10-基础-次数

    var str1 = 'abc Abc abCD 123'

    // 1. {n} 前面的一个表达式正好出现n次  a正好出现2次
    console.log(str1.match(/a{2}b/gi)) // null
    console.log(str1.match(/a{1}b/gi)) // ["ab", "Ab", "ab"]

    // 2. {n,m} 前面的一个表达式至少出现n次,最多m次
    var str2 = 'aAcbc Abc abCD 123 fAaBCfd'
    console.log(str2.match(/a{1,2}b/gi)) // ["Ab", "ab", "AaB"]

    // 3. {n,} 匹配前面的一个表达式至少出现n次
    var str3 = 'aAcbc Abc aaaabCD 123'
    console.log(str2.match(/a{2,}b/gi)) // ["aaaab"]

    // + 表示 至少出现1次 ,等于 {1,}
    console.log(str3.match(/a{1,}b/gi)) // ["Ab", "aaaab"]
    console.log(str3.match(/a+b/gi)) // ["Ab", "aaaab"]

    // 4. ? 匹配前面的一个表达式 0次或1次,等价于{0,1}
    var str4 = 'aAcbc Abc aaaabCD 123'
    console.log(str4.match(/a?b/gi)) // ["b", "Ab", "ab"]

    // 如果 ? 紧跟在任何量词 (* + ? {})的后面,将会使量词变为非贪婪的,默认是贪婪的
    var str5 = "ad 2 34 cd55;s;d;d555";
    console.log(str5.match(/\d+/g)) // ["2", "34", "55", "555"]
    console.log(str5.match(/\d+?/g)) // ["2", "3", "4", "5", "5", "5", "5", "5"]

    // 5. * 匹配前一个表达式0次或多次,(有没有都行),等价于{0,}
    // var str5 = 'aAcbc Abc aaaabCD 123'
    // console.log(str5.match(/a*b/gi)) // ["b", "Ab", "aaaab"]

11-特殊字符-1

  /** 1.1 正常字符前面如果有\,表示这个字符是特殊的,而不是原来的含义。如:b表示b, 但\b表示单词边界
      /B 表示非边界
  **/
  let str = 'hello world helloword wordhello'
  console.log(str.match(/hello/g)) // ["hello", "hello", "hello"]
  console.log(str.match(/\bhello\b/g)) // ["hello"]
  console.log(str.match(/hello\b/g)) // ["hello", "hello"]
  console.log(str.match(/\Bhello/g)) // ["hello"]

  // 1.2 特殊字符前面加了\,则特殊字符变为普通字符。如:*表示0个或多个,但\*就表示星号*
  let str2 = 'a*bc'
  console.log(str2.match(/a\*/g)) // ["a*"]

  // 1.3 使用new RegExp 方式时,因其第一个参数是字符串,所以想使用\做转义时,要写\\
    var str3 = "ad 2 34 cd55;s;d;d555"
    var input = 'd'
    var reg2 = new RegExp('\\' + input + '+','g')
    document.write("<br>")
    document.write(str3.match(reg2))

  // 1.4 \d数字 \D非数字
    var str4 = '45abc78dddd'
    console.log(str4.match(/\d+/g)) //  ["45", "78"]
    console.log(str4.match(/\D+/g)) //  ["abc", "dddd"]

11-特殊字符-2

  // 1. ^ 匹配输入的开始,如果是多行模式,则可以匹配一行的开始

  // 2. $ 匹配输入的结束,如果是多行模式,则可以匹配一行的结束

  // 3. 当^作为第一个字符出现在一个字符集合模式时,它将会有不同的含义,如[^...]

  // 4. . 匹配除了换行以外的任何一个字符
  let str = 'abbc abc adfc afc'
  let str2 = 'abbc abc adfc vvv'
  console.log(str.match(/a.c/g)) // ["abc", "afc"]
  console.log(str.match(/a.+c/g)) // ["abbc abc adfc afc"]
  console.log(str2.match(/a.+c/g)) // ["abbc abc adfc"]

  // 5. (x)分组:匹配x并记住,()称为捕获括号
  // 5.1 不加括号只匹配一个字母,加括号可以匹配一组
  let str3 = 'fredd'
  console.log(str3.match(/d+/)) // ["dd", index: 3, input: "fredd", groups: undefined]
  let str4 = 'fredd fredd'
  console.log(str3.match(/(fred)+/)) // ["fred", "fred", index: 0, input: "fredd", groups: undefined]
  
  /** 5.2 使用括号里的模式对目标进行匹配,并且把结果存在\1...\n中,
    在接下来的模式表达式中可以使用\1...\n来代替前面匹配到的结果
  **/
  let str5 = 'foo bar foo bar'
  console.log(str5.match(/(foo) (bar) (foo) (bar)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
  console.log(str5.match(/(foo) (bar) \1 \2/)) // ["foo bar foo bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
  console.log(str5.match(/(foo) (bar) (\1) (\2)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]

  // foxxxfoo
  console.log(str5.match(/(.)o.*\1oo/)) //  ["foo bar foo", "f", index: 0, input: "foo bar foo bar", groups: undefined]

  console.log('abcabc'.match(/(.)b(.)/)) // ["abc", "a", "c", index: 0, input: "abcabc", groups: undefined]
  console.log('-----')
  console.log('abcabc'.match(/(.)b(.)(.)b(.)/)) // ["abcabc", "a", "c", "a", "c", index: 0, input: "abcabc", groups: undefined]
  console.log('abcabc'.match(/(.)b(.)\1b\2/)) // ["abcabc", "a", "c", index: 0, input: "abcabc", groups: undefined]
  
  console.log('abcfbc'.match(/(.)b(.)(.)b(.)/)) // ["abcfbc", "a", "c", "f", "c", index: 0, input: "abcfbc", groups: undefined]
  console.log('abcfbc'.match(/(.)b(.)\1b\2/)) // null

  // 5.3 replace 替换时使用分组信息不再是\ 而是 $n
  let str6 = 'hello worlde' // 目标: worlde hello
  // /w 表示 字母 数字 下划线 汉字
  console.log(str6.replace(/(\w+) (\w+)/, "$2 $1")) // worlde hello

  /** 5.4 分组捕获时如果再使用/g,则match操作不会捕获分组,
    如果必须使用/g 可以使用reg.exec(str)
  **/

  console.log(str6.match(/(l+)/g)) // ["ll", "l"]

  let reg = new RegExp("e", "g")
  console.log(reg.exec(str6)) // ["e", index: 1, input: "hello worlde", groups: undefined]
  console.log(reg.exec(str6)) // ["e", index: 11, input: "hello worlde", groups: undefined]
  console.log(reg.exec(str6)) // null

  let reg2 = new RegExp("(e)", "g")
  console.log(reg2.exec(str6)) // ["e", "e", index: 1, input: "hello worlde", groups: undefined]
  console.log(reg2.exec(str6)) // ["e", "e", index: 11, input: "hello worlde", groups: undefined]

  // 5.5 (?:x) 匹配但不记住,称为非捕获括号,因为分组只有9个
  let str1 = 'foo'
  console.log(str1.match(/(foo){1,2}/)) // ["foo", "foo", index: 0, input: "foo", groups: undefined]
  console.log(str1.match(/(?:foo){1,2}/)) // ["foo", index: 0, input: "foo", groups: undefined]

11-特殊字符-3

    // 1. x(?=y) 匹配x并且后面必须是y
    let str1 = 'foo fox'
    let str2 = 'fof fox'
    console.log(str1.match(/fo(?=o)/)) // ["fo", index: 0, input: "foo fox", groups: undefined]
    console.log(str2.match(/fo(?=x)/)) // ["fo", index: 4, input: "fof fox", groups: undefined]

    // 2. x(?!y) 匹配x并且后面必须不是y
    let str3 = 'fop fon'
    console.log(str3.match(/fo(?!p)/)) // ["fo", index: 4, input: "fop fon", groups: undefined]
    console.log(str3.match(/fo(?!n)/)) // ["fo", index: 0, input: "fop fon", groups: undefined]
    
    // 3. x|y 匹配x或者y
    console.log(str3.match(/fo(p|n)/)) // ["fop", "p", index: 0, input: "fop fon", groups: undefined]
    console.log(str3.match(/fo(p|n)/g)) // ["fop", "fon"]

    // 4. [] 或者
    // 4.1 [xyz] x或者y或者z
    let str4 = 'foao fax'
    console.log(str4.match(/f[oax]/g)) // ["fo", "fa"]

    // 4.2 范围:[0-9],[a-z],[a-zA-Z0-9]
    let str5 = 'a28bc'
    console.log(str5.match(/a[0-9]+b/g)) // ["a28b"]
    console.log(str5.match(/a[0-9]{1,2}[a-z]/g)) // ["a28b"]

    // 4.3 [12-89] 1或者2 到 8或者9
    let str6 = '029'
    console.log(str6.match(/[12-89]/)) // ["2", index: 1, input: "029", groups: undefined]

    // [^xyz] 中括号前^ 表示非,不是x不是y,不是z
    let str7 = 'abcde'
    console.log(str7.match(/a[^xy]c/)) // ["abc", index: 0, input: "abcde", groups: undefined]

12 .案例

  /** 1. 匹配电话 
    第一位:1  第二位: 34578 剩余九位数字
  **/
  let reg = /1[34578]\d{9}/
  console.log(reg.test('15789456123')) // true
  console.log(reg.test('1578945612c')) // false

  let str = '姓名:小尹 手机:15789456123 性别:女'
  console.log(str.replace(reg, '***')) // 姓名:小尹 手机:*** 性别:女

  // 2. 网页标签
  let str2 = 'sdsdsdf <div>gem@163.com</div> dss'
  let reg2 = /<(.+)>.*<\/\1>/
  let reg3 = /<(.+)>(.*)<\/\1>/
  console.log(str2.match(reg2)) // ["<div>gem@163.com</div>", "div", index: 8, input: "sdsdsdf <div>gem@163.com</div> dss", groups: undefined]
  console.log(str2.match(reg3)) // ["<div>gem@163.com</div>", "div", "gem@163.com", index: 8, input: "sdsdsdf <div>gem@163.com</div> dss", groups: undefined]

  // 3. 敏感词替换
  let str3 = '中国共产党中国人民解放军中国'
  console.log(str3.replace(/中国|军/g, '*')) // *共产党*人民解放**

  let result = str3.replace(/中国|军/g, input => {
    let t = ''
    for(let i = 0; i < input.length; i++) {
      t += '*'
    }
    return t
  })
  console.log(result) // **共产党**人民解放***

  // 4. 去首尾空格
  let str4 = ' 你好 怎么样 '
  console.log(str4.replace(/^\s+|\s+$/g, '')) // 你好 怎么样

  // 5. 千位分隔符
  let str5 = '1234567890123456'
  console.log(str5.replace(/(\d)(?=(?:\d{3})+$)/g, '$1,')) // 1,234,567,890,123,456

相关文章

  • 学习笔记 正则表达式

    2021.01.19 北京海淀 -2℃ 小雪转晴 正则表达式学习笔记 说明:该笔记参考“菜鸟教程”网站正则表达式...

  • 笔记:正则表达式

    正则表达式基础部分笔记

  • js高级(四)

    JavaScript高级第04天笔记 1.正则表达式概述 1.1什么是正则表达式 正则表达式( Regular E...

  • 正则表达式学习笔记

    正则表达式学习笔记 一篇记录了学习正则表达式的笔记。 1. 转义字符 在 HTMl 中转义字符以 & 符号开头,分...

  • JavaScript正则表达式

    JavaScript 正则表达式 @(笔记)[正则表达式] 第一章 课程简介 1-1 JS正则表达式简介及应用 课...

  • 爬虫基础系列正则表达式——爬取简书个人文章标题

    正则表达式简单介绍 正则表达式我在VBA中有详细的阐述《VBA正则笔记》,在python语言中,它的方法与VBA大...

  • 一个程序员的自我学习第一天

    《正则表达式必知必会》笔记 第一章:正则表达式入门 1:正则表达式是一些用来匹配和处理文本的字符串。正则...

  • Python学习随笔

    本笔记整理自中谷教育在线教育视频 学习笔记——正则表达式常用符号 这里学习过正则表达式后,简单做了一个爬虫程序,效...

  • 转:Ruby笔记–正则表达式

    Ruby笔记–正则表达式 Ruby对正则表达式支持非常好,下面将对我经常使用到的做一个总结,包括Ruby中正则的写...

  • 正则笔记

    正则生成 调用RegExp对象的构造函数 使用正则表达式字面值,将匹配模式封闭在两个斜杠中 正则的组成 标示字符 ...

网友评论

      本文标题:正则笔记

      本文链接:https://www.haomeiwen.com/subject/rohgbktx.html