EmojiUtil

作者: __简单点__ | 来源:发表于2020-12-03 14:13 被阅读0次

EmojiUtil

package com.bear.mobile.util;

import org.apache.commons.lang.StringUtils;

public class EmojiUtil {

// 转义时标识

private static final char unicode_separator ='&';

private static final char unicode_prefix ='u';

private static final char separator =':';

private static boolean isEmojiCharacter(int codePoint) {

return (codePoint >=0x2600 && codePoint <=0x27BF)// 杂项符号与符号字体

|| codePoint ==0x303D

|| codePoint ==0x2049

|| codePoint ==0x203C

|| (codePoint >=0x2000 && codePoint <=0x200F)//

|| (codePoint >=0x2028 && codePoint <=0x202F)//

|| codePoint ==0x205F //

|| (codePoint >=0x2065 && codePoint <=0x206F)//

/* 标点符号占用区域*/

|| (codePoint >=0x2100 && codePoint <=0x214F)// 字母符号

|| (codePoint >=0x2300 && codePoint <=0x23FF)// 各种技术符号

|| (codePoint >=0x2B00 && codePoint <=0x2BFF)// 箭头A

|| (codePoint >=0x2900 && codePoint <=0x297F)// 箭头B

|| (codePoint >=0x3200 && codePoint <=0x32FF)// 中文符号

|| (codePoint >=0xD800 && codePoint <=0xDFFF)// 高低位替代符保留区域

|| (codePoint >=0xE000 && codePoint <=0xF8FF)// 私有保留区域

|| (codePoint >=0xFE00 && codePoint <=0xFE0F)// 变异选择器

|| codePoint >=0x10000; // Plane在第二平面以上的，char都不可以存，全部都转

}

/**

* 将带有emoji字符的字符串转换成可见字符标识

*/

public static Stringescape(String src) {

if (StringUtils.isBlank(src)) {

return src;

}

int cpCount = src.codePointCount(0, src.length());

int firCodeIndex = src.offsetByCodePoints(0, 0);

int lstCodeIndex = src.offsetByCodePoints(0, cpCount -1);

StringBuilder sb =new StringBuilder(src.length());

for (int index = firCodeIndex; index <= lstCodeIndex; index ++) {

int codepoint = src.codePointAt(index);

if (isEmojiCharacter(codepoint)) {

String hash = Integer.toHexString(codepoint);

sb.append(unicode_separator).append(hash.length())

.append(unicode_prefix).append(separator).append(hash);

// hash 长度，4位1个字节

index += (hash.length() -1)/4;

}else {

sb.append((char) codepoint);

}

return sb.toString();

}

/** 解析可见字符标识字符串 */

public static Stringreverse(String src) {

// 查找对应编码的标识位

if (StringUtils.isBlank(src)) {

return src;

}

StringBuilder sb =new StringBuilder(src.length());

char[] sourceChar = src.toCharArray();

int index =0;

while (index < sourceChar.length) {

if (sourceChar[index] ==unicode_separator) {

if (index +6 >= sourceChar.length) {

sb.append(sourceChar[index]);

index++;

continue;

}

// 自已的格式，与通用unicode格式不能互转

if (sourceChar[index +1] >='4' && sourceChar[index +1] <='6'

&& sourceChar[index +2] ==unicode_prefix

&& sourceChar[index +3] ==separator) {

int length = Integer.parseInt(String.valueOf(sourceChar[index +1]));

char[] hexchars =new char[length]; // 创建一个4至六位的数组，来存储uncode码的HEX值

for (int j =0; j < length; j++) {

char ch = sourceChar[index +4 + j];// 4位识别码

if ((ch >='0' && ch <='9') || (ch >='a' && ch <='f')) {

hexchars[j] = ch;

}else {// 字符范围不对

sb.append(sourceChar[index]);

index++;

break;

}

sb.append(Character.toChars(Integer.parseInt(new String(hexchars), 16)));

index += (4 + length);// 4位前缀+4-6位字符码

}else if (sourceChar[index +1] ==unicode_prefix) {// 通用字符的反转

// 因为第二平面之上的，已经采用了我们自己转码格式，所以这里是固定的长度4

char[] hexchars =new char[4];

for (int j =0; j <4; j++) {

char ch = sourceChar[index +2 + j]; // 两位识别码要去掉

if ((ch >='0' && ch <='9') || (ch >='a' && ch <='f')) {

hexchars[j] = ch; // 4位识别码

}else {// 字符范围不对

sb.append(sourceChar[index]);

index++;

break;

}

sb.append(Character.toChars(Integer.parseInt(String.valueOf(hexchars), 16)));

index += (2 +4);// 2位前缀+4位字符码

}

}else {

sb.append(sourceChar[index]);

index++;

continue;

}

}else {

sb.append(sourceChar[index]);

index++;

continue;

}

return sb.toString();

}

public static Stringfilter(String src) {

if (src ==null) {

return null;

}

int cpCount = src.codePointCount(0, src.length());

int firCodeIndex = src.offsetByCodePoints(0, 0);

int lstCodeIndex = src.offsetByCodePoints(0, cpCount -1);

StringBuilder sb =new StringBuilder(src.length());

for (int index = firCodeIndex; index <= lstCodeIndex;) {

int codepoint = src.codePointAt(index);

if (!isEmojiCharacter(codepoint)) {

System.err.println("codepoint:" + Integer.toHexString(codepoint));

sb.append((char) codepoint);

}

index += ((Character.isSupplementaryCodePoint(codepoint)) ?2 :1);

}

return sb.toString();

}

网友评论

本文标题：EmojiUtil

本文链接：https://www.haomeiwen.com/subject/ijumwktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

EmojiUtil

相关文章

EmojiUtil

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读