正则笔记

作者: gem_Y | 来源:发表于2020-11-14 23:20 被阅读0次

学习笔记正则表达式
笔记：正则表达式
js高级（四）
正则表达式学习笔记
JavaScript正则表达式
爬虫基础系列正则表达式——爬取简书个人文章标题
一个程序员的自我学习第一天
Python学习随笔
转：Ruby笔记–正则表达式
正则笔记

学习来源：腾讯课堂-Javascript正则表达式基础
学习代码：https://github.com/GemmaYin/RegExp

4-基础-字符串和RegExp的方法-regtest

    // reg.test(str) 返回true/false,表示是否匹配成功
    var str = 'aaaabc abcd addd sgd abbccb ac'
    var str2 = 'ssdsss'
    var reg = new RegExp("a(b*)c");
    console.log(reg.test(str)) // true
    console.log(reg.test(str2)) // false

5-基础-字符串和RegExp的方法-regtest

    // str.match(reg),与reg.exec相似，但是若使用g选项，则str.match一次性返回所有结果
    var str = 'aaaabc abcd addd sgd abbccb ac'

    console.log(str.match(/a(b*)c/)) // ["abc", "b", index: 3, input: "aaaabc abcd addd sgd abbccb ac"]
    console.log(str.match(/a(b*)c/g)) // ["abc", "abc", "abbc", "ac"]

7-基础-字符串和RegExp的方法-strreplace

    // str.search(reg),返回匹配成功的第一个位置
    var str = 'aaacabc abcd addd sgd abbccb ac'

// 老的方式：不会改变原来的值,而且只替换第一个
    var str2 = str.replace('c','x')
    console.log(str)  // aaacabc abcd addd sgd abbccb ac
    console.log(str2)  // aaaxabc abcd addd sgd abbccb ac

//  正则：str.replace(reg,newstr)用第一个参数reg去匹配，用第二个参数newstr去替换
    console.log(str.replace(/c/g,'x')) // aaaxabx abxd addd sgd abbxxb ax

8-基础-字符串和RegExp的方法-strsplit

    // str.search(reg),返回匹配成功的第一个位置
    var str = 'abcabbccdecdefg'

// 老的方式：按照字母b来切割
    console.log(str.split('b'))  // ["a", "ca", "", "ccdecdefg"]

//  正则：str.split(reg,[maxLength])用匹配的模式切割，第二个参数是限制返回结果的最大数量
    // 用一个b或者多个b来切割
    console.log(str.split(/b+/)) // ["a", "ca", "ccdecdefg"]

    var str2 = 'abc abbs     dd sss'
    //用一个或者多个空格来切
    console.log(str2.split(/\s+/)) // ["abc", "abbs", "dd", "sss"]
    // 最多返回两个
    console.log(str2.split(/\s+/,2)) // ["abc", "abbs"]

9-基础-i 选项

    // i表示忽略大小写
    var str = 'abc Abc abCD 123'

    console.log(str.match(/abc/g)) // ["abc"]
    console.log(str.match(/abc/gi)) // ["abc", "Abc", "abC"]
    console.log(str.match(/abc/ig)) // ["abc", "Abc", "abC"]

10-基础-次数

    var str1 = 'abc Abc abCD 123'

    // 1. {n} 前面的一个表达式正好出现n次  a正好出现2次
    console.log(str1.match(/a{2}b/gi)) // null
    console.log(str1.match(/a{1}b/gi)) // ["ab", "Ab", "ab"]

    // 2. {n,m} 前面的一个表达式至少出现n次，最多m次
    var str2 = 'aAcbc Abc abCD 123 fAaBCfd'
    console.log(str2.match(/a{1,2}b/gi)) // ["Ab", "ab", "AaB"]

    // 3. {n,} 匹配前面的一个表达式至少出现n次
    var str3 = 'aAcbc Abc aaaabCD 123'
    console.log(str2.match(/a{2,}b/gi)) // ["aaaab"]

    // + 表示 至少出现1次 ，等于 {1,}
    console.log(str3.match(/a{1,}b/gi)) // ["Ab", "aaaab"]
    console.log(str3.match(/a+b/gi)) // ["Ab", "aaaab"]

    // 4. ? 匹配前面的一个表达式 0次或1次，等价于{0,1}
    var str4 = 'aAcbc Abc aaaabCD 123'
    console.log(str4.match(/a?b/gi)) // ["b", "Ab", "ab"]

    // 如果 ? 紧跟在任何量词 （* + ? {}）的后面，将会使量词变为非贪婪的，默认是贪婪的
    var str5 = "ad 2 34 cd55;s;d;d555";
    console.log(str5.match(/\d+/g)) // ["2", "34", "55", "555"]
    console.log(str5.match(/\d+?/g)) // ["2", "3", "4", "5", "5", "5", "5", "5"]

    // 5. * 匹配前一个表达式0次或多次，（有没有都行），等价于{0,}
    // var str5 = 'aAcbc Abc aaaabCD 123'
    // console.log(str5.match(/a*b/gi)) // ["b", "Ab", "aaaab"]

11-特殊字符-1

  /** 1.1 正常字符前面如果有\,表示这个字符是特殊的，而不是原来的含义。如：b表示b, 但\b表示单词边界
      /B 表示非边界
  **/
  let str = 'hello world helloword wordhello'
  console.log(str.match(/hello/g)) // ["hello", "hello", "hello"]
  console.log(str.match(/\bhello\b/g)) // ["hello"]
  console.log(str.match(/hello\b/g)) // ["hello", "hello"]
  console.log(str.match(/\Bhello/g)) // ["hello"]

  // 1.2 特殊字符前面加了\,则特殊字符变为普通字符。如：*表示0个或多个，但\*就表示星号*
  let str2 = 'a*bc'
  console.log(str2.match(/a\*/g)) // ["a*"]

  // 1.3 使用new RegExp 方式时，因其第一个参数是字符串，所以想使用\做转义时，要写\\
    var str3 = "ad 2 34 cd55;s;d;d555"
    var input = 'd'
    var reg2 = new RegExp('\\' + input + '+','g')
    document.write("<br>")
    document.write(str3.match(reg2))

  // 1.4 \d数字 \D非数字
    var str4 = '45abc78dddd'
    console.log(str4.match(/\d+/g)) //  ["45", "78"]
    console.log(str4.match(/\D+/g)) //  ["abc", "dddd"]

11-特殊字符-2

  // 1. ^ 匹配输入的开始，如果是多行模式，则可以匹配一行的开始

  // 2. $ 匹配输入的结束，如果是多行模式，则可以匹配一行的结束

  // 3. 当^作为第一个字符出现在一个字符集合模式时，它将会有不同的含义，如[^...]

  // 4. . 匹配除了换行以外的任何一个字符
  let str = 'abbc abc adfc afc'
  let str2 = 'abbc abc adfc vvv'
  console.log(str.match(/a.c/g)) // ["abc", "afc"]
  console.log(str.match(/a.+c/g)) // ["abbc abc adfc afc"]
  console.log(str2.match(/a.+c/g)) // ["abbc abc adfc"]

  // 5. (x)分组：匹配x并记住，()称为捕获括号
  // 5.1 不加括号只匹配一个字母，加括号可以匹配一组
  let str3 = 'fredd'
  console.log(str3.match(/d+/)) // ["dd", index: 3, input: "fredd", groups: undefined]
  let str4 = 'fredd fredd'
  console.log(str3.match(/(fred)+/)) // ["fred", "fred", index: 0, input: "fredd", groups: undefined]
  
  /** 5.2 使用括号里的模式对目标进行匹配，并且把结果存在\1...\n中，
    在接下来的模式表达式中可以使用\1...\n来代替前面匹配到的结果
  **/
  let str5 = 'foo bar foo bar'
  console.log(str5.match(/(foo) (bar) (foo) (bar)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
  console.log(str5.match(/(foo) (bar) \1 \2/)) // ["foo bar foo bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]
  console.log(str5.match(/(foo) (bar) (\1) (\2)/)) // ["foo bar foo bar", "foo", "bar", "foo", "bar", index: 0, input: "foo bar foo bar", groups: undefined]

  // foxxxfoo
  console.log(str5.match(/(.)o.*\1oo/)) //  ["foo bar foo", "f", index: 0, input: "foo bar foo bar", groups: undefined]

  console.log('abcabc'.match(/(.)b(.)/)) // ["abc", "a", "c", index: 0, input: "abcabc", groups: undefined]
  console.log('-----')
  console.log('abcabc'.match(/(.)b(.)(.)b(.)/)) // ["abcabc", "a", "c", "a", "c", index: 0, input: "abcabc", groups: undefined]
  console.log('abcabc'.match(/(.)b(.)\1b\2/)) // ["abcabc", "a", "c", index: 0, input: "abcabc", groups: undefined]
  
  console.log('abcfbc'.match(/(.)b(.)(.)b(.)/)) // ["abcfbc", "a", "c", "f", "c", index: 0, input: "abcfbc", groups: undefined]
  console.log('abcfbc'.match(/(.)b(.)\1b\2/)) // null

  // 5.3 replace 替换时使用分组信息不再是\ 而是 $n
  let str6 = 'hello worlde' // 目标: worlde hello
  // /w 表示 字母 数字 下划线 汉字
  console.log(str6.replace(/(\w+) (\w+)/, "$2 $1")) // worlde hello

  /** 5.4 分组捕获时如果再使用/g，则match操作不会捕获分组，
    如果必须使用/g 可以使用reg.exec(str)
  **/

  console.log(str6.match(/(l+)/g)) // ["ll", "l"]

  let reg = new RegExp("e", "g")
  console.log(reg.exec(str6)) // ["e", index: 1, input: "hello worlde", groups: undefined]
  console.log(reg.exec(str6)) // ["e", index: 11, input: "hello worlde", groups: undefined]
  console.log(reg.exec(str6)) // null

  let reg2 = new RegExp("(e)", "g")
  console.log(reg2.exec(str6)) // ["e", "e", index: 1, input: "hello worlde", groups: undefined]
  console.log(reg2.exec(str6)) // ["e", "e", index: 11, input: "hello worlde", groups: undefined]

  // 5.5 (?:x) 匹配但不记住，称为非捕获括号，因为分组只有9个
  let str1 = 'foo'
  console.log(str1.match(/(foo){1,2}/)) // ["foo", "foo", index: 0, input: "foo", groups: undefined]
  console.log(str1.match(/(?:foo){1,2}/)) // ["foo", index: 0, input: "foo", groups: undefined]

11-特殊字符-3

    // 1. x(?=y) 匹配x并且后面必须是y
    let str1 = 'foo fox'
    let str2 = 'fof fox'
    console.log(str1.match(/fo(?=o)/)) // ["fo", index: 0, input: "foo fox", groups: undefined]
    console.log(str2.match(/fo(?=x)/)) // ["fo", index: 4, input: "fof fox", groups: undefined]

    // 2. x(?!y) 匹配x并且后面必须不是y
    let str3 = 'fop fon'
    console.log(str3.match(/fo(?!p)/)) // ["fo", index: 4, input: "fop fon", groups: undefined]
    console.log(str3.match(/fo(?!n)/)) // ["fo", index: 0, input: "fop fon", groups: undefined]
    
    // 3. x|y 匹配x或者y
    console.log(str3.match(/fo(p|n)/)) // ["fop", "p", index: 0, input: "fop fon", groups: undefined]
    console.log(str3.match(/fo(p|n)/g)) // ["fop", "fon"]

    // 4. [] 或者
    // 4.1 [xyz] x或者y或者z
    let str4 = 'foao fax'
    console.log(str4.match(/f[oax]/g)) // ["fo", "fa"]

    // 4.2 范围：[0-9],[a-z],[a-zA-Z0-9]
    let str5 = 'a28bc'
    console.log(str5.match(/a[0-9]+b/g)) // ["a28b"]
    console.log(str5.match(/a[0-9]{1,2}[a-z]/g)) // ["a28b"]

    // 4.3 [12-89] 1或者2 到 8或者9
    let str6 = '029'
    console.log(str6.match(/[12-89]/)) // ["2", index: 1, input: "029", groups: undefined]

    // [^xyz] 中括号前^ 表示非，不是x不是y,不是z
    let str7 = 'abcde'
    console.log(str7.match(/a[^xy]c/)) // ["abc", index: 0, input: "abcde", groups: undefined]

12 .案例

  /** 1. 匹配电话 
    第一位：1  第二位: 34578 剩余九位数字
  **/
  let reg = /1[34578]\d{9}/
  console.log(reg.test('15789456123')) // true
  console.log(reg.test('1578945612c')) // false

  let str = '姓名：小尹 手机:15789456123 性别：女'
  console.log(str.replace(reg, '***')) // 姓名：小尹 手机:*** 性别：女

  // 2. 网页标签
  let str2 = 'sdsdsdf <div>gem@163.com</div> dss'
  let reg2 = /<(.+)>.*<\/\1>/
  let reg3 = /<(.+)>(.*)<\/\1>/
  console.log(str2.match(reg2)) // ["<div>gem@163.com</div>", "div", index: 8, input: "sdsdsdf <div>gem@163.com</div> dss", groups: undefined]
  console.log(str2.match(reg3)) // ["<div>gem@163.com</div>", "div", "gem@163.com", index: 8, input: "sdsdsdf <div>gem@163.com</div> dss", groups: undefined]

  // 3. 敏感词替换
  let str3 = '中国共产党中国人民解放军中国'
  console.log(str3.replace(/中国|军/g, '*')) // *共产党*人民解放**

  let result = str3.replace(/中国|军/g, input => {
    let t = ''
    for(let i = 0; i < input.length; i++) {
      t += '*'
    }
    return t
  })
  console.log(result) // **共产党**人民解放***

  // 4. 去首尾空格
  let str4 = ' 你好 怎么样 '
  console.log(str4.replace(/^\s+|\s+$/g, '')) // 你好 怎么样

  // 5. 千位分隔符
  let str5 = '1234567890123456'
  console.log(str5.replace(/(\d)(?=(?:\d{3})+$)/g, '$1,')) // 1,234,567,890,123,456

学习笔记正则表达式
2021.01.19 北京海淀 -2℃ 小雪转晴正则表达式学习笔记说明：该笔记参考“菜鸟教程”网站正则表达式...
笔记：正则表达式
正则表达式基础部分笔记
js高级（四）
JavaScript高级第04天笔记 1.正则表达式概述 1.1什么是正则表达式正则表达式（ Regular E...
正则表达式学习笔记
正则表达式学习笔记一篇记录了学习正则表达式的笔记。 1. 转义字符在 HTMl 中转义字符以 & 符号开头，分...
JavaScript正则表达式
JavaScript 正则表达式 @(笔记)[正则表达式] 第一章课程简介 1-1 JS正则表达式简介及应用课...
爬虫基础系列正则表达式——爬取简书个人文章标题
正则表达式简单介绍正则表达式我在VBA中有详细的阐述《VBA正则笔记》，在python语言中，它的方法与VBA大...
一个程序员的自我学习第一天
《正则表达式必知必会》笔记第一章：正则表达式入门 1：正则表达式是一些用来匹配和处理文本的字符串。正则...
Python学习随笔
本笔记整理自中谷教育在线教育视频学习笔记——正则表达式常用符号这里学习过正则表达式后，简单做了一个爬虫程序，效...
转：Ruby笔记–正则表达式
Ruby笔记–正则表达式 Ruby对正则表达式支持非常好，下面将对我经常使用到的做一个总结，包括Ruby中正则的写...
正则笔记
正则生成调用RegExp对象的构造函数使用正则表达式字面值，将匹配模式封闭在两个斜杠中正则的组成标示字符 ...

正则笔记

4-基础-字符串和RegExp的方法-regtest

5-基础-字符串和RegExp的方法-regtest

7-基础-字符串和RegExp的方法-strreplace

8-基础-字符串和RegExp的方法-strsplit

9-基础-i 选项

10-基础-次数

11-特殊字符-1

11-特殊字符-2

11-特殊字符-3

12 .案例

相关文章

学习笔记正则表达式

笔记：正则表达式

js高级（四）

正则表达式学习笔记

JavaScript正则表达式

爬虫基础系列正则表达式——爬取简书个人文章标题

一个程序员的自我学习第一天

Python学习随笔

转：Ruby笔记–正则表达式

正则笔记

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读