美文网首页Swift开发Web前端之路让前端飞
极简 regex 正则表达式速成指南

极简 regex 正则表达式速成指南

作者: NET颜同学 | 来源:发表于2017-06-10 15:24 被阅读180次

什么是正则表达式

是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串

  • 咳咳!说人话

用来匹配目标字符串的符号(你有更优雅的描述,欢迎打脸)

  • 谁适合学习正则表达式

不论你从事什么职业,如果你经常要进行文本操作,大量的重复性劳动你觉得很没意思,那么赶快学习正则表达式吧。如果你是并且还不熟悉正则表达式,那么别人会鄙视你。你还在等什么呢?

转义符

  • 如要匹配英文句号点 . 可用转义表示 \.
  • 描述本身 \\ 等

元字符

表达式 说明
. 匹配除换行符以外的任意字符
^ 匹配字符串的开始
$ 匹配字符串的结束
\s 匹配任意的空白符
\d 匹配数字
\w 匹配字母或数字或下划线或汉字
\b 匹配单词的开始或结束

反义

有时需要查找不属于某个能简单定义的字符类的字符。比如想查找除了数字以外,其它任意字符都行的情况

表达式 说明
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\W 匹配任意不是字母,数字,下划线,汉字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符

重复

表达式 说明
* 重复零次或多次
+ 重复一次或多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或多次
{n,m} 重复n到m次

字符类

在方括号中指定一个字符 "范围"。如 [0-9] 等同于 \d

分支条件

分枝条件相当于条件 "或",如果满足其中任意一种规则都应该当成匹配,方法是用 | 把不同的规则分隔开
如: 0\d{2}-\d{8}|0\d{3}-\d{7}

分组

使用小括号来指定子表达式(也叫做分组),然后你就可以指定这个子表达式的重复次数

  • \d{1,3} 匹配1到3位的数字
  • (\d{1,3}\.){3} 匹配三位数字加上一个英文句号,重复3次

后向引用

后向引用用于重复搜索前面某个分组匹配的文本

表达式 说明
(exp) 匹配 exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配 exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp) 匹配 exp,不捕获匹配的文本,也不给此分组分配组号
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp>) 匹配前面不是exp的位置
(?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

? : (

是不是还没懂?让我们来做一些例子吧

  • 以下案例为基础案例,可用于学习

匹配 img 开头 .jpg .png 结尾的字符串(爬取图片时很有用)

"img.*(\.jpg|\.png)"

只匹配汉字

"[\u4e00-\u9fa5]"

长度为8位以上的用户密码(可以是字母数字下划线和.(点))

"[0-9a-zA-Z_\.]{8,}"

匹配电子邮箱

"\w.+@\w.+\.\w+"

匹配手机号

"(13\d|14[57]|15[^4,\D]|17[678]|18\d)\d{8}|170[059]\d{7}"

匹配身份证号

"\d{17}[0-9Xx]"

匹配时间

"([012]\d):(\d{2}):(\d{2})"

匹配日期

"(\d{4})-([01]\d)-([012]\d)"

欢迎吐槽打脸 _

相关文章

  • 极简 regex 正则表达式速成指南

    什么是正则表达式 是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串 咳咳!说人话 用来匹配目标字...

  • 正则表达式

    Python正则表达式指南 - AstralWind - 博客园 正则表达式(RegEx)——快速参考 正则表达式...

  • 09.正则表达式re-1.正则表达式

    1、正则表达式概述 正则表达式(英语:Regular Expression,在代码中常简写为regex、regex...

  • 正则表达式

    正则表达式教程: https://deerchao.net/tutorials/regex/regex.htm

  • 正则表达式

    正则表达式学习:http://deerchao.net/tutorials/regex/regex.htm 课程任...

  • 正则表达式相关工具

    正则表达式测试网站https://regex101.com/#python[https://regex101.co...

  • 第2章 NLP前置技术解析

    正则表达式 re.search(regex, string) string中匹配到regex返回match对象,否...

  • 正则表达式介绍

    什么是正则表达式? Regex(英语:Regular Expression,在代码中常简写为 regex 、 re...

  • 常见正则表达式

    元字符 参考链接:正则表达式[http://www.topgoer.cn/docs/regex/regex-1cv...

  • 工具以及网页

    正则表达式:https://regex101.com/#javascript

网友评论

  • 2d11943a9fe0:楼主写得很不错。但是时间那里有问题,分、秒只能是00-59,应该是[012]\\d(:[0-5]\\d){2}

本文标题:极简 regex 正则表达式速成指南

本文链接:https://www.haomeiwen.com/subject/gxtcqxtx.html