问题
假设我开了一个创业公司,现在邀请一批老伙伴加入公司,一起吃饼。这时候我收到了这些回复:
- ok, i will do it
- okie dokie
- Ahooy, Okay!!!
- why sure, i can go
- arrr, yes matey
- My answer me mate, is yes y
现在我要找到回复中肯定的词语。比如
- ok
- Okay
- sure
- yes
- y
应该怎么做呢?
单词边界
从最简单的开始,先匹配ok。
/ok/
结果第二行的okie也被匹配了,这是什么鬼,我们不应该匹配第2行。还记得《正则表达式2》里面讲的部分匹配的问题,但是这里不能用那个解决方案,因为ok后面还有很多东西呢。所以这里介绍一个边界元字符(Boundary metacharacter)\b
。
这样写就可以正确匹配ok单词了
/\bok\b/
\b
确保匹配整个单词
匹配多个和“可以选择的”
现在ok匹配上了,我们需要匹配Okay了。直接把Okay放在后面可以的。
/\bok\b|\bokay\b/
这样可以的。但是如果有更多的可能性呢,这样就不好了,我们换一种吧。如果能让ay
是可选的,就可以简化了吧。这里介绍?
.看看下面代码
/\bok(ay)?\b/i
这样就可以匹配ok和okay了,?
表示出现0次或者1次,就是可以选择的意思
Or破坏了单词边界
下面我们来看看如何匹配sure,很显然可以想到。
/\bok(ay)?|sure\b/i
这个可以匹配sure,可是也可以匹配ensure,因为左边没有\b
了。解决的方法是用group
/\b(ok(ay)?|sure)\b/i
结局
剩下的yes和y应该很好解决了,看一下代码吧
/\b(ok(ay)?|sure|y(es)?)\b/i
奖励
正则表达式太牛逼了,忍不住我再学习点。
如何表达非
前面我们都是去匹配,那么我们不想匹配一些东西怎么办,比如,要匹配所有不是数字的?看看这个:
/[a-z\s,]+/i
这样写不错,但是还可以这样
/[^\d]+/i
等等,^
不是表示一行以模式开头吗?嗯,在[]中它表示否定。不要混淆了。/^[^\d]+$/
看这个里面两个^
是不同的意思。
相反意思的元字符
元字符 | 描述 |
---|---|
\w | 查找单词字符 |
\W | 查找非单词字符 |
\d | 查找数字 |
\D | 查找非数字字符 |
\b | 匹配单词边界 |
\B | 匹配非单词边界 |
呵呵,其实直接用/^\D+$/
就可以查找所有非数字了。
限制数字
我们知道[]
里面的表达式只能匹配一个字符,?
表示出现0次或者1次,就是可以选择的意思,+
表示出现1次或者大于1次,那么有没有其他的量词呢:
量词 | 描述 |
---|---|
n+ | 匹配任何包含至少一个 n 的字符串。 |
n* | 匹配任何包含零个或多个 n 的字符串。 |
n? | 匹配任何包含零个或一个 n 的字符串。 |
n{X} | 匹配包含 X 个 n 的序列的字符串。 |
n{X,Y} | 匹配包含 X 或 Y 个 n 的序列的字符串。 |
n{X,} | 匹配包含至少 X 个 n 的序列的字符串。 |
n$ | 匹配任何结尾为 n 的字符串。 |
^n | 匹配任何开头为 n 的字符串。 |
?=n | 匹配任何其后紧接指定字符串 n 的字符串。 |
?!n | 匹配任何其后没有紧接指定字符串 n 的字符串。 |
举个例子吧:
/[a-z]{1,3}/
上面这个表达式可以匹配:'t','te','tes'
,但是'test'
就不能匹配了,最多1个祖父到三个字符。
语法
{最少匹配的数目, 最多匹配的数目}
网友评论