美文网首页
MySQL中CHAR and VARCHAR

MySQL中CHAR and VARCHAR

作者: 大哥你先走 | 来源:发表于2020-11-26 11:14 被阅读0次

MySQL版本:8.0版本

CHARVARCHAR类型相似,但在存储、检索方式、最大长度和是否保留末尾空格四个方面存在差异。

长度:

  • CHAR(0-255)

    类型为CHAR的列的长度是固定的,可以在创建表时指定该长度。比如列的定义为CHAR(30),则该列最多可以存储30个字符。

  • VARCHAR(0-65535)

    类型为VARCHAR的列的长度是可变的,在创建表时指定的长度为最大长度,最大长度的值受行最大长度的限制和使用的编码字符。比如列的类型为VARCHAR(512),则该列最多可以存储512个字符。

存储:

  • CHAR

    由于CHAR类型的列的长度是固定的,如果插入的值的长度小于定义的长度,则会在插入值的末尾添加空格以确保值的长度恰好等于定义的长度。如果没有开启严格SQL模式,如果插入值的长度超过列允许的最大长度,值将会被截断以确保满足长度要求并产生一个告警。通过开启严格的SQL模式,对非空字符的截断将产生一个错误而不是告警并抑制值的插入。

  • VARCHAR

    VARCHAR是变长字符串;VARCHAR存储时不会使用空格填充;VARCHAR存储包括两部分:1或2字节的前缀(表示数据的长度)和数据。如果存储的数据的字节数不超过255则使用1个字节的前缀;如果存储的长度超过255字节则使用2字节长度的前缀。无论使用哪种SQL模式,截断超过VARCHAR类型的空格都将产生一个告警。

检索方式:

  • CHAR

    当检索CHAR列的值时,如果没有开启PAD_CHAR_TO_FULL_LENGTH SQL模式,则会移除尾部的空格。

  • VARCHAR

    根据标准SQL,在存储和检索值时保留尾部空格。

样例:

下面的表格通过存储不同的字符串到CHAR(4)和VARCHAR(4)类型的列中展示了CHAR和VARCHAR之间的不同。

Value CHAR(4) Storage Required VARCHAR(4) Storage Required
'' ' ' 4 bytes '' 1 byte
'ab' 'ab ' 4 bytes 'ab' 3 bytes
'abcd' 'abcd' 4 bytes 'abcd' 5 bytes
'abcdefgh' 'abcd' 4 bytes 'abcd' 5 bytes

表格最终一行是实际存储占用的空间(未开启严格SQL模式),如果启用严格SQL模式,超过列长度的值将不会被存储并产生一个错误。

InnoDB将长度大于或等于768字节的固定长度字段编码为可变长度字段,这样可以使用off-page存储。例如如果字符占用超过3个字节,那么一个类型为CHAR(255)的列的长度可能超过768字节。

将同一个给定值存储在CHAR(4)和VARCHAR(4)列中,则从这些列检索的值并不总是相同的,因为检索时会从CHAR列中删末尾空格。以下示例说明了这种差异:

mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));
Query OK, 0 rows affected (0.01 sec)

mysql> INSERT INTO vc VALUES ('ab  ', 'ab  ');
Query OK, 1 row affected (0.00 sec)

mysql> SELECT CONCAT('(', v, ')'), CONCAT('(', c, ')') FROM vc;
+---------------------+---------------------+
| CONCAT('(', v, ')') | CONCAT('(', c, ')') |
+---------------------+---------------------+
| (ab  )              | (ab)                |
+---------------------+---------------------+
1 row in set (0.06 sec)

CHAR,VARCHAR和TEXT列中的值根据分配给该列的字符集排序规则进行排序和比较。

字符串比较规则

MySQL排序规则有一个名为 PAD SPACE的属性,但基于UCA 9.0.0及更高版本的Unicode排序规则除外(属性的值为NO PAD)。

可以从INFORMATION_SCHEMA.COLLATIONS表中获取每种排序规则的pad属性:

SELECT * FROM COLLATIONS

对于非二进制字符串(CHAR,VARCHAR,TEXT),字符串排序规则中的pad属性决定字符串末尾的空格在字符串比较中的处理方式。拥有NO PAD 值的字符串排序规则将尾部的空格视作其他字符,参与到字符串的比较中。拥有PAD SPACE 值的字符串排序规则将忽略字符串尾部的空格,这些空格不参与字符的比较。服务器SQL模式对尾随空格的比较行为没有影响。

对于字符串尾部空格被截断而且不参与字符串比较的情况,如果一个字段上拥有唯一索引,如果插入该类的值仅存在尾部的空格数不同的差异,这将产生一个重复key的错误。

相关文章

网友评论

      本文标题:MySQL中CHAR and VARCHAR

      本文链接:https://www.haomeiwen.com/subject/kecaiktx.html