MySQL正则表达式

作者: 寻找大海的鱼 | 来源:发表于2020-01-03 22:47 被阅读0次

一.简介

正则表达式的作用是匹配文本，将一个模式(正则表达式)与一个文本串进行比较。MySQL用where子句对正则表达式提供支持，允许指定正则表达式过滤select检索出的数据。

二.基本字符匹配

输入

select name from product where name regexp '1';

输出

输出.png

分析

除关键字like被regexp替代外，这条语句看上去像like语句。它告诉MYSQL:REGEXP后所跟的东西作为正则表达式处理。
为什么要费力地使用正则表达式?在刚才的例子中，正则表达式确实没有带来太多好处(可能还会降低性能)，不过，请考虑下面的例子：

输入

select name from product where name regexp '.22';

输出

输出.png

分析

这里使用了正则表达式 .22。.是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符，因此，322和122都匹配且返回。

Like与REGEXP 在LIKE和REGEXP之间有一个重要的差别。
请看以下两条语句：
select name 
from product
where name like '322';

select name 
from product
where name regexp '322';

如果执行上述两条语句，会发现第一条语句不返回数据，而第二条语句返回一行。为什么？
这是因为like匹配整个列。如果被匹配的文本在列值中出现，like将不会找到它，相应的行也不被返回(除非使用通配符)。而regexp在列值内进行匹配，如果被匹配的文本在列值中出现，regexp将会找到它，相应的行将被返回。这是一个非常重要的差别。
那么，regexp能不能用来匹配整个列值(从而起与like相同的作用)？答案是肯定的，使用^和$定位符即可。

匹配不区分大小写  MySQL中的正则表达式匹配(自版本3.23.4后)不区分大小写(即，大小写都匹配)。为区分大小写，可使用BINARY关键字，如where name regexp binary 'Product.22'.

三.进行OR匹配

为搜索两个串之一(或者为这个串，或者为另一个串)，使用|，如下所示：

输入

select name from product where name regexp '122|322';

输出

输出.png

分析

语句中使用了正则表达式122|322。|为正则表达式的OR操作符。它表示匹配其中之一，因此122和322都匹配并返回。
使用|从功能上类似于select语句中使用OR语句，多个OR条件可并入单个正则表达式。

两个以上的OR条件 可以给出两个以上的OR条件。例如，‘122|322|422’将匹配122或322或422

四.匹配几个字符之一

匹配任何单一字符。但是，如果你只想匹配特定的字符，怎么办？可通过指定一组【和】括起来的字符来完成，如下所示：

输入

select name from product where name regexp '[123] pro';

输出

输出.png

分析

这里，使用了正则表达式[123] pro。[123]定义一组字符，它的意思是匹配1或2或3，因此，1 pro和2 pro都匹配且返回(没有3 pro)。
正如所见，[]是另一种形式的OR语句。事实上，正则表达式[123] pro为[1|2|3] pro的缩写，也可以使用后者。但是，需要是[]来定义OR语句查找什么。为更好理解这一点，可以查看下面的例子:

输入

select name from product where name regexp '1|2|3 pro';

输出

输出.png

分析

这并不是期望的输出。两个要求的行被检索出来，但还检索出了另外3行。之所以这样是由于MySQL假定你的意思是'1'或'2'或'3 pro'。除非把字符|括在一个集合中，否则它将应用于整个串。
字符集合也可以被否定，即，它们将匹配除指定字符外的任何东西。为否定一个字符集，在集合的开始处放置一个^{即可。因此，尽管[123]匹配字符1、2或3，但[}123]却匹配除这些字符外的任何东西。

五.匹配范围

集合可用来定义要匹配的一个或多个字符。例如，下面的集合将匹配数字0到9：
[0123456789]
为简化这种类型的集合，可使用-来定义一个范围。下面的式子功能上等同于上述数字列表：
[0-9]
范围不限于完整的集合，[1-3]和[6-9]也是合法的范围。此外，范围不一定只是数值的，[a-z]匹配任意字母字符。
例子如下

输入

select name from product where name regexp '[1-4] pro';

输出

输出.png

分析

这里使用正则表达式[1-4] pro。[1-4]定义了一个范围，这个表达式意思是匹配1到4.因此返回3个匹配行。由于3 pro匹配，所以返回y3 pro apple。

六.匹配特殊字符

正则表达式语言由具有特定含义的特殊字符构成。我们已经看到“.”、“[]”、“|”和“-”等，还有其他一些字符。请问，如果你需要匹配这些字符，应该怎么办呢？例如，如果要找出包含“.”字符的值，怎么搜索？请看下面的例子：

输入

select name from product where name regexp '.';

输出

输出.png

分析

这并不是期望的输出，.匹配任意字符，因此每个行都被检索出来
为了匹配特殊字符，必须使用\\为前导。\\-表示查找-，\\.表示查找.。

输入

select name from product where name regexp '\\.';

输出

输出.png

分析

这才是期望的输出。\\.匹配.，所以只检索出一行。这种处理就是所谓的转义，正则表达式内具有特殊意义的所有字符都必须以这种方式转义。这包括“.”、“|”、“[]”以及至今为止使用过的其他特殊字符。
\\也用来引用元符号(具有特殊含义的字符)，如下面所列。

元字符	说明
\\f	换页
\\n	换行
\\r	回车
\\t	制表
\\v	纵向制表

匹配\   为了匹配反斜杠(\)字符本身，需要使用\\\

\或\\?   多数正则表达式实现使用单个反斜杠转义特殊字符，以便能使用这些字符本身。但MySQL要求两个反斜杠(MySQL自己解释一个，正则表达式解释另一个)

七.匹配字符类

存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。为更方便工作，可以使用预定义的字符集，称为字符类。下面列出字符类以及它们的含义。

元字符	说明
[:alnum:]	任意字母和数字(同[a-zA-Z0-9])
[:alpha:]	任意字符(同[a-zA-Z])
[:blank:]	空格和制表(同[\\t])
[:cntrl:]	ASCII控制字符(ASCII 0到31和127)
[:digit:]	任意数字(同[0-9])
[:graph:]	与[:print:]相同，但不包括空格
[:lower:]	任意小写字母(同[a-z])
[:print:]	任意可打印字符
[:punct:]	既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:]	包括空格在内的任意空白字符(同[\\f\\n\\r\\t\\v])
[:upper:]	任意大写字母(同[A-Z])
[:xdigit:]	任意十六进制数字(同[a-fA-F0-9])

八.匹配多个实例

目前为止使用的所有正则表达式都试图匹配单次出现。如果存在一个匹配，该行被检索出来，如果不存在，检索不出任何行。但有时需要对匹配的数目进行更强的控制。例如，你可能需要寻找所有的数，不管数中包含多少数字，或者你可能想寻找一个单词并且还能适应一个尾随的s(如果存在)，等等。
这可以使用下面的正则表达式重复元字符来完成。

元字符	说明
*	0个或多个匹配
+	1个或多个匹配(等于{1，})
?	0个或1个匹配(等于{0,1})
{n}	指定数目的匹配
{n，}	不少于指定数目的匹配
{n，m}	匹配数目的范围(m不超过255)

下面举几个例子。

输入

select name from product where name regexp '\\([0-9] sticks?\\)';

输出

输出.png

分析

正则表达式\$[0-9] sticks?\$需要解说一下。\$匹配)，[0-9]匹配任意数字(这个例子中为1和5)，sticks?匹配stick和sticks(s后的?使s可选，因为?匹配它前面的任何字符的0次或1次出现)，\$匹配)。没有?，匹配stick和sticks会非常困难。
以下是另一个例子。匹配连在一起的3位数字:

输入

select name from product where name regexp '[[:digit:]]{3}';

输出

输出.png

分析

如前所述，[:digit:]匹配任意数字，因而它为数字的一个集合。{3}确切地要求它前面的字符(任意数字)出现3次，所以[[:digit:]]{3}匹配连在一起的任意三位数字。
上面的式子也可以改成下面这种形式

select name from product where name regexp '[0-9][0-9][0-9]';

九.定位符

上述的所有例子都是匹配一个串中任意位置的文本。为了匹配特定位置的文本，需要下面的定位符。

元字符	说明
^	文本的开始
$	文本的结尾
[[:<:]]	词的开始
[[:>:]]	词的结尾

例如，如果你想找出以一个数(包括以小数点开始的数)开始的所有产品，怎么办？简单搜索[0-9\\.] (或[[:digit:]\\.])不行，因为它将在文本内任意位置查找匹配。解决办法就是使用^定位符，如下所示:

输入

select name from product where name regexp '^[0-9\\.]';

输出

输出.png

分析

^{匹配串的开始。因此，}[0-9\\.]只在.或任意数字为串中第一个字符时才匹配它们。没有^，则还要多检索出4个别的行(那些中间有数字的行)。

^的双重用途  ^有两种用法。
在集合中(用[和]都定义)，用它来否定该集合，否则，用来指串的开始处。

网友评论

本文标题：MySQL正则表达式

本文链接：https://www.haomeiwen.com/subject/wiyzoctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

MySQL正则表达式

一.简介

二.基本字符匹配

输入

输出

分析

输入

输出

分析

三.进行OR匹配

输入

输出

分析

四.匹配几个字符之一

输入

输出

分析

输入

输出

分析

五.匹配范围

输入

输出

分析

六.匹配特殊字符

输入

输出

分析

输入

输出

分析

七.匹配字符类

八.匹配多个实例

输入

输出

分析

输入

输出

分析

九.定位符

输入

输出

分析

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读