美文网首页
正则表达式学习笔记

正则表达式学习笔记

作者: 篮筐轰炸机5号 | 来源:发表于2018-12-02 10:29 被阅读0次

简介

正则表达式是一种描绘字符串样貌的语言,用来匹配字符串。它不属于某种特定编程语言,其身影几乎无所不在,甚至是VIM等编辑器的重要组成部分。使用正则表达式能显得高端、优雅,因为它难。

下面总结下学习心得。

基本套路:

正则描述字符串的基本方法是:

元素名 + 数量

例如,匹配1个或多个’A':A+
其中,字符'A'原封不动,“+”是一个“限定符”,描述数量,代表一个或多个。

再例如,匹配连续3个数字:\d{3}
其中,\d是一个“元字符”,代表一个数字,限定符{3}指定数量为3个。

(元字符指有特殊含义的字符,限定符指指示数量的字符)

掌握了这个基本原则,就能看懂一半正则表达式了。

元素名

普通字符

普通字符直接写,例如abc,就能匹配字符串abcde中的abc。

元字符

想表达特殊含义需要用元字符,常用的有:

代码 说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字

指定范围

想表达某个范围用方括号包起来[],中括号视为一个整体,代表一个字符

代码 说明
[ABC] ABC中的一个
[A-Z] 从A到Z中的一个
[0-9a-zA-Z_] 等价于\w
[^abcd] 反义字符组,匹配任意不在括号内的字符。也可以写成[^a-d]

(^出现在方括号里是转义的意思,其它地方用来描述“开始位置”)

转义:

有时很不巧,需要匹配元字符本身,就需要转义,即元字符前面加反斜杠'\'

比如查找一对[],应为:\[\]

如果查找\本身,应为:\\

数量

常用限定符

代码 说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

以上,有了元素名+数量的组合就能匹配大多模式了。

例如
\d{5,12},匹配“连续5到12个数字”,如1234567;
\w+[1-9]匹配“一个或多个字符+从1到9的一位数字”,如a1或abc9。

但有时需要描述得更精确些,例如指定只能出现在开始或结束位置等。

再精确点

位置

要描述有些字符只能在开头或结尾出现,就需要描述位置。

代码 说明
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束

匹配8位电话号码时,可以使用:^\d{8}$,限制了开始结束,整个字符串都要与其匹配,这样就过滤掉了a12345678,或12345678bcd。

分组:

小括号()依然是传统意义上的分组。

例如,(\d{1,3}\.){3}\d{1,3}是一个简单的IP地址匹配表达式。

除了分组外,()还有“捕获”的功能,配合指示符使用可以表示匹配项,\1\9代表第n个括号分组匹配的文本。

例如:
\b(\w+)\b\s+\1\b可以用来匹配重复的单词,像go go, 或者kitty kitty。其中\1代表第一个括号匹配的内容。

(注意:\1\9必须与()一起服用)

分支:

也就是正则表达式中的“或”,用“|”表示。

123|abc匹配字符串123或abc

注意不要再用多余的方括号[]了!常见错误,匹配(555)或555,写成:[(\(\d{3}\))|\d{3}]。正确写法是:(\(\d{3}\))|\d{3}

以上是正则表达式的基本套路。

参考资料:

正则还有很多知识,可以参考:

正则表达式30分钟入门教程

Learn Regular Expressions (RegEx) with Ease

Javascript RegExp参考文档

测试工具:

在线测试工具

小结

一点经验是,复杂的正则表达式可以先拿出纸笔写一写,因为手写可以有层次分明的括号和间隔,看起来能稍微清晰点。

相关文章

  • 学习笔记 正则表达式

    2021.01.19 北京海淀 -2℃ 小雪转晴 正则表达式学习笔记 说明:该笔记参考“菜鸟教程”网站正则表达式...

  • 正则表达式学习笔记

    正则表达式学习笔记 一篇记录了学习正则表达式的笔记。 1. 转义字符 在 HTMl 中转义字符以 & 符号开头,分...

  • Python学习随笔

    本笔记整理自中谷教育在线教育视频 学习笔记——正则表达式常用符号 这里学习过正则表达式后,简单做了一个爬虫程序,效...

  • Python ☞ day 11

    Python学习笔记之 正则表达式 re模块概述:Python自1.5以后增加了re的模块,提供了正则表达式模式...

  • python正则表达式学习拾遗

    本篇学习笔记参考re——正则表达式 所作,不明白之处可以参阅上述的官方文档。因为是个人学习笔记,所以并不会完全介绍...

  • 正则表达式

    python学习笔记-正则表达式 标签 : python 特殊符号和字符 re模块:核心函数和方法

  • 正则表达式学习笔记

    [TOC] 正则表达式学习笔记 1. cheatsheet 2. 介绍 2.1 character 有时我们希望m...

  • python爬虫day-13(正则表达式)

    个人学习笔记,方便自己查阅,仅供参考,欢迎交流 正则表达式 1.简单示例 开源中国提供的正则表达式测试网址:htt...

  • 笔记:正则表达式

    正则表达式基础部分笔记

  • 正则表达式

    正则表达式在开发中不会频繁使用,但是需要使用的时候就需要去查阅,这里做一下学习笔记 正则表达式的作用 匹配 分割 ...

网友评论

      本文标题:正则表达式学习笔记

      本文链接:https://www.haomeiwen.com/subject/wxibqqtx.html