正则表达式

作者: Shorebloom_59f6 | 来源:发表于2018-10-16 15:47 被阅读0次

Linux命令行与Shell脚本编程大全-shell正则表达式
正则相关
正则表达式系列-1
正则表达式
Python基础入门 - 正则表达式与综合实战
Java正则表达式参考
正则表达式
Python爬虫(十)_正则表达式
python正则表达式
正则表达式

1. 限定符

+ 代表前面的字符至少出现1次(一次或多次)

例: 正则表达式rub+y 可以匹配到的字符串为
ruby ,rubby,rubbby,rub...by

* 代表前面的字符出现0次或多次

例：正则表达式rub*y 可以匹配到的字符串为
ruy,ruby ,rubby,rubbby,rub...by

? 代表前面的字符出现0次或1次

例：正则表达式rub？y 可以匹配到的字符串为
ruy, ruby

{n} n为非负整数,匹配确定的 n 次

例： r{2} 匹配到的字符串为
rr
即含有两个r的字符串都可以匹配到

{n,} n为非负整数,匹配出现前面字符n次或多次的串

例： r{2,} 可匹配
rr, rr* ...

{n,m} m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗号和两个数之间不能有空格。

例： r{1,3} 可匹配到的字符串为
r,rr,rrr
r{0,1} 等价于r?

2. 贪婪和非贪婪的区别

贪婪匹配*、+限定符都是贪婪的，因为它们会尽可能多的匹配文字.

例：字符串： <H1>正则表达式</H1> 正则表达式：<.*>
匹配结果： <H1>正则表达式</H1>
该正则表达式匹配从开始小于符号 (<) 到关闭 H1 标记的大于符号 (>)之间的所有字符

非贪婪（最小匹配）

例：字符串： <H1>正则表达式</H1> 正则表达式：<.*?>
匹配结果：
<H1>
</H1>
该正则表达式匹配开始和结束标签。如果只想匹配开始的 H1 标签，表达式则是：<\w+?>

总结：通过在 *、+ 或 ? 限定符之后放置 ?，该表达式从"贪心"表达式转换为"非贪心"表达式或者最小匹配。

3. 定位符

定位符用来描述字符串或单词的边界，^ 和$ 分别指字符串的开始与结束，\b 描述单词的前或后边界，\B 表示非单词边界。
正则表达式的定位符有：

字符	描述
^	匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，^ 还会与 \n 或 \r 之后的位置匹配。
$	匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，$ 还会与 \n 或 \r 之前的位置匹配。
\b	匹配一个单词边界，即字与空格间的位置。
\B	非单词边界匹配。

注：不能将限定符与定位符一起使用。由于在紧靠换行或者单词边界的前面或后面不能有一个以上位置，因此不允许诸如 ^* 之类的表达式。
若要匹配一行文本开始处的文本，请在正则表达式的开始使用 ^ 字符。不要将 ^ 的这种用法与中括号表达式内的用法混淆。
若要匹配一行文本的结束处的文本，请在正则表达式的结束处使用 $ 字符。

4. 非打印字符

字符	描述
\cx	匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
\f	匹配一个换页符。等价于 \x0c 和 \cL。
\n	匹配一个换行符。等价于 \x0a 和 \cJ。
\r	匹配一个回车符。等价于 \x0d 和 \cM。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t	匹配一个制表符。等价于 \x09 和 \cI。
\v	匹配一个垂直制表符。等价于 \x0b 和 \cK。

5. 特殊字符

要匹配这些特殊字符，必须首先使字符"转义"，即，将反斜杠字符\ 放在它们前面。

特别字符	描述
$	匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性，则 $也匹配 '\n' 或 '\r'。要匹配$ 字符本身，请使用 $。
( )	标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 ( 和 )。
*	匹配前面的子表达式零次或多次。要匹配 * 字符，请使用 *。
+	匹配前面的子表达式一次或多次。要匹配 + 字符，请使用 +。
.	匹配除换行符 \n 之外的任何单字符。要匹配 . ，请使用 . 。
[	标记一个中括号表达式的开始。要匹配 [，请使用 [。
?	匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。要匹配 ? 字符，请使用 ?。
\	将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\' 匹配 ""，而 '(' 则匹配 "("。
^	匹配输入字符串的开始位置，除非在方括号表达式中使用，此时它表示不接受该字符集合。要匹配 ^ 字符本身，请使用 ^。
{	标记限定符表达式的开始。要匹配 {，请使用 {。
\|	指明两项之间的一个选择。要匹配 \|，请使用 \|。

6. 优先级

运算符	描述
\	转义符
(), (?:), (?=), []	圆括号和方括号
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, \任何元字符、任何字符	定位点和序列（即：位置和顺序）
\|	替换，"或"操作
字符具有高于替换运算符的优先级，使得"m	food"匹配"m"或"food"。若要匹配"mood"或"food"，请使用括号创建子表达式，从而产生"(m\|f)ood"。

网友评论

本文标题：正则表达式

本文链接：https://www.haomeiwen.com/subject/jpagaftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

正则表达式

1. 限定符

2. 贪婪和非贪婪的区别

3. 定位符

4. 非打印字符

5. 特殊字符

6. 优先级

相关文章

Linux命令行与Shell脚本编程大全-shell正则表达式

正则相关

正则表达式系列-1

正则表达式

Python基础入门 - 正则表达式与综合实战

Java正则表达式参考

正则表达式

Python爬虫(十)_正则表达式

python正则表达式

正则表达式

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读