mysql设置utf8编码导致无法存储emoji表情解决方案

作者: kevin0016 | 来源:发表于2019-04-15 15:24 被阅读0次

Mysql存储Emoji表情[为何utf8不能存储以及如何使My
mysql设置utf8编码导致无法存储emoji表情解决方案
Laravel项目中使用mysql存储emoji表情乱码的问题
java mysql utf8编码问题Incorrect str
Emoji 表情报错
mysql 字符集编码utf-8问题，保存表情包问题 Error
Windows 下 MySQL中文及emoji插入问题
Postgres 存储表情编码问题
Emoji表情转UTF-8编解码、过滤
MySQL支持存储emoji表情

mysql中的”utf8“最大只支持3 个bytes，而真正的utf8编码(大家都使用的标准)，最大支持4个bytes。正是由于mysql的utf8少一个byte，导致中文的一些特殊字符和emoji都无法正常的显示。mysql真正的utf8其实是utf8mb4，这是在5.5版本之后加入的。而目前的“utf8”其实是utf8mb3。mb就是 max bytes的意思（猜测）。所以尽量不要使用默认的utf8，使用utf8mb4才是正确的选择。
但是一些老项目默认数据库格式为utf8，可能就需要通过Java的方式进行转换，此处提供一个工具类进行编码转换

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class enCoderUtils {
    /**
     * 将str中的emoji表情转为byte数组
     *
     * @param str
     * @return
     */
    public static String resolveToByteFromEmoji(String str) {
        Pattern pattern = Pattern
                .compile("[^(\u2E80-\u9FFF\\w\\s`~!@#\\$%\\^&\\*\\(\\)_+-？（）——=\\[\\]{}\\|;。，、《》”：；“！……’:'\"<,>\\.?/\\\\*)]");
        Matcher matcher = pattern.matcher(str);
        StringBuffer sb2 = new StringBuffer();
        while (matcher.find()) {
            matcher.appendReplacement(sb2, resolveToByte(matcher.group(0)));
        }
        matcher.appendTail(sb2);
        return sb2.toString();
    }

    /**
     * 将str中的byte数组类型的emoji表情转为正常显示的emoji表情
     *
     * @param str
     * @return
     */
    public static String resolveToEmojiFromByte(String str) {
        Pattern pattern2 = Pattern.compile("<:([[-]\\d*[,]]+):>");
        Matcher matcher2 = pattern2.matcher(str);
        StringBuffer sb3 = new StringBuffer();
        while (matcher2.find()) {
            matcher2.appendReplacement(sb3, resolveToEmoji(matcher2.group(0)));
        }
        matcher2.appendTail(sb3);
        return sb3.toString();
    }

    private static String resolveToByte(String str) {
        byte[] b = str.getBytes();
        StringBuffer sb = new StringBuffer();
        sb.append("<:");
        for (int i = 0; i < b.length; i++) {
            if (i < b.length - 1) {
                sb.append(Byte.valueOf(b[i]).toString() + ",");
            } else {
                sb.append(Byte.valueOf(b[i]).toString());
            }
        }
        sb.append(":>");
        return sb.toString();
    }

    private static String resolveToEmoji(String str) {
        str = str.replaceAll("<:", "").replaceAll(":>", "");
        String[] s = str.split(",");
        byte[] b = new byte[s.length];
        for (int i = 0; i < s.length; i++) {
            b[i] = Byte.valueOf(s[i]);
        }
        return new String(b);
    }
}