项目中,项目之前使用的utf8的编码集,但是项目测试过程中,发现需要支持emoji表情,所以考虑将utf8编码更改为utf8mb4。
emoji表情是1个字符占4个字节,而utf8编码只支持1-3个字节的字符,所以utf8编码下,如果直接存储表情,数据库存储会失败。
首先我们看下哪些地方可能需要我们修改编码:
1、库(database)的编码
2、表(table)的编码
3、字段(column)的编码
4、程序中,数据库的连接url
5、mysql的配置文件my.conf中
我们可以先查询下当前数据库的编码信息:
SHOW VARIABLES LIKE 'character_set_%'
1,我们将库的编码修改
datebase charset=utf8mb4
datebase collation=utf8mb4_unicode_ci
2,将表的编码修改
character set=utf8mb4
collation=utf8mb4_unicode_ci
3,将需要支持emoji表情字段的编码修改
Charset=utf8mb4
Collation=utf8mb4_unicode_ci
然后尝试做存储,发现目前还不行,从存储到数据库中,全是??号,然后尝试修改datasource url,将characterEncoding修改为utf8mb4,然后重新启动项目,发现启动失败,查询原因,得知,目前mysql jdbc driver还不支持utf8mb4。
然后尝试最后一步,修改mysql的配置文件my.conf
[client]
# 客户端来源数据的默认字符集
default-character-set = utf8mb4
[mysqld]
# 服务端默认字符集
character-set-server=utf8mb4
# 连接层默认字符集
collation-server=utf8mb4_unicode_ci
[mysql]
# 数据库默认字符集
default-character-set = utf8mb4
修改完毕后,记得重新启动mysql服务
/etc/init.d/mysql restart
然后进行测试,生效。
网友评论