正则表达式
正则表达式就是记录文本规则的代码
正则表达式常用的元字符
元字符(-) | 含义(<)
. | 匹配除换行意外的任何字符
\w | 匹配字母、数字、下划线、汉字
\s | 匹配任意的空白符
\d | 匹配数字
\b | 匹配单词的开始或结束
^ | 匹配字符串的开始
$ | 匹配字符串的结束
正则表达式常用的限定符
限定符(-) | 含义(<)
* | 重复零次或更多次
+ | 重复一次或更多次
? | 重复零次或一次
{n} | 重复N次或更多次
{n,m} | 重复N到M次
正则表达式举例:
这里推荐使用正则表达式的演练环境:https://tool.oschina.net/regex
假如有一串文本
test
test1
testtest
test test
test ab team
testabteam
test ab test
- 1.找出所有的test单词 :\btest\b
注释:\b匹配单词的开始和结束,\b单词\b的形式,可以检索出6个结果(以下加粗内容)
test
test1
testtest
test test
test ab team
testabteam
test ab test
- 2.找出test后面含有team的单词:\btest\b.*\bteam\b
注释:test和team都用\b夹着代表是单独的单词,所以testabteam无法检索出
test
test1
testtest
test test
test ab team
testabteam
test ab test
- 3.匹配以a开头的单词:\ba\w*\b
- 4.匹配0755-66666666格式的数字:\d{4}-\d{8}
- 5.匹配6个字符的单词:\b\w{6}\b
- 6.匹配1个或更多的数字:^\d+$
- 7.5-10位数字:^\d{5,10}$
网友评论