Android之初识Emoji

作者: 键盘上的麒麟臂 | 来源:发表于2018-03-16 10:55 被阅读308次

    在开发中突然需要传Emoji,然而直接传的话会报错,而之前开发时又没接触够Emoji,所以打算好好研究一下。

    1.Emoji的形式

    我想先打印出来看看Emoji是怎么样的,我就设断,看看输入Emoji之后的字符串是怎样的,结果发生了十分有意思的事情。
    在调试监听的时候显示的是豆腐块


    但是编译器里面又能显示图


    再试试在Log中打印,直接就不显示

    做到这里,已经不禁让我怀疑人生,我发现我对String一无所知,瞬间真的有一种不知道要怎么弄的感觉。
    如果哪位大神知道,请告诉我为什么String显示Emoji时会这样,谢谢。

    虽然我不知道Emoji在String中到底是怎么样的,但是我可以用charAt()方法去查看它的地址,发现charAt()后打印出这个(我用了另一个Emoji)


    实在看不出,再试试charArray



    CN是中国图标的emoji
    最后得到的结果是


    看得出分割时一般会把一个表情分割成2个char,国旗分割成4个,还有一个的,也看不出什么。

    这什么玩意,还是不知道,上网查了下,这个叫Unicode 编码,这就很有意思了,那我就去看看编码的一些基础的知识。

    2.编码

    我就算没认真学过,都知道有个编码叫utf-8,那它和Unicode 编码有什么关系呢。

    1个字节为8位,就是说1个字节可以用8位二进制来表示。而8位二进制一共有256种情况,也就是2的8次方。
    所以刚开始就出现了ASCII码,它用每个情况表示一个符号,ASCII 码一共定义了 128 个字符。

    但是想想,世界上这么多种符号,仅仅英文的话ASCII 码是能解决,但是汉字都不止256种了,所以产生了Unicode 编码,它就相当是ASCII 的一个扩展,但是,有会出现了一些问题,所以出现了UTF-8编码(我这只是简单的说)就当是规范了Unicode 编码。

    所以Emoji得到的是Unicode编码,那么我就猜测一下为什么在AS中有时出现乱码,有时出现图案,因为在debug中在编辑器里面的是展示Unicode码的,所以能正常显示图片,而Logcat中的编码方式是utf-8,所以显示乱码。

    不管怎么样,关键是这个Edittext.toString()得到的String是不是有Emoji的啊
    既然打印和打断点不行,那我就只能画点时间搞个Demo了。
    我做两个Edittext和一个Button,点击按钮时从第一个Edit获取String然后显示到第二个Edit

    从结果可以看出,String里面是有包含Emoji的只是不能正常打印出来而已。

    3.上传到服务器

    既然能保证String含有Emoji,那么下一步就是怎么上传到服务器,直接把这个String上传到服务器是会报错的。

    (1)转成Base64
    先把字符串转成Base64再上传,这是我在网上看到的一篇文章,先测试下转码后再解码能不能得到之前的形式。

    btn.setOnClickListener(new View.OnClickListener() {
                @Override
                public void onClick(View view) {
                    String str = edtUp.getText().toString();
                    // 转码
                    String str_count=  Base64.encodeToString(str.getBytes(),Base64.DEFAULT);
                    // 解码
                    String str2 = new String(Base64.decode(str_count.getBytes(), Base64.DEFAULT));
    
                    edtDown.setText(str2);
                }
            });
    

    可以看出可以使用Base64转码和解码是能成功得到Emoji的。转之后就是一个字符串,数据是能保存的,那接下来我就试试能不能把Emoji上传到数据库然后在返回正常显示。

    测试中......测试内容保密......

    最后得到结果并展示到textview


    可以看出这样的做成是可以的,就不用再写什么先转换再拼接了。

    4.屏蔽

    直接上传emoji会出错,据说是因为



    那这样的话,解决这个的问题其实还是数据库去改进,但是......你觉得你说一句“这个是后台的问题,你们来改”,后台人员就会改吗?他只会说“你们前端先想办法解决一下。”没错,受欺负的永远是前端,那怎么办,那我们只好想办法屏蔽咯。

    (1)网上有很多判断的方法,但是我真的不敢用,有些评论说某些不完整,搞得我都不知道哪些是能用的,哪些是判断不完整的。
    但是我又找不到其它解决的办法,总觉得屏蔽真麻烦,最直接的办法还是后台给改了,但是人家肯定不愿意弄,那我就贴上代码(真的很担心这个判断会不会又漏)

     /**
         *  屏蔽emoji
         */
        public static String deleteEmoji(String str){
            StringBuffer sb = new StringBuffer();
            char[] charArray = str.toCharArray();
            for (int i = 0; i < charArray.length; i++) {
                if (!isEmojiCharacter(charArray[i])) {
                    sb.append(charArray[i]);
                }
            }
            return sb.toString();
        }
    
    /**
         *  todo 这是网上找的判断区间,不知道完不完整,暂时先用
         * @param codePoint
         * @return
         */
        private static boolean isEmojiCharacter(char codePoint) {
            return !((codePoint == 0x0) ||
                    (codePoint == 0x9) ||
                    (codePoint == 0xA) ||
                    (codePoint == 0xD) ||
                    ((codePoint >= 0x20) && (codePoint <= 0xD7FF)) ||
                    ((codePoint >= 0xE000) && (codePoint <= 0xFFFD)) ||
                    ((codePoint >= 0x10000) && (codePoint <= 0x10FFFF)));
        }
    

    这样操作就能得到屏蔽表情的字符串。

    5.总结

    关于emoji我是第一次尝试,这回主要做的任务是怎么将emoji传到后台并正常获取显示。表面上我是实现这个功能了,为什么说是表面上呢,因为我传的是Base64,如果真要这么做的话,必须和所有端都统一,不然你传Base64,其它端不解码展示Base64那就很麻烦。

    我想真正寻求的最优解是我这传的是字符串,别的机子要是能正常显示就显示,不能正常显示就隐藏,但是发现目前我还真不知道要怎么弄,直接传的String后台是无法接收的,好像是因为数据库是3位而emoji大部分都是4位。

    还有一点就是自己写一个Emoji页面来展示这个没做,现在用的Emoji是输入法提供的,但是有些APP会有自己弄的Emoji页面,这个之后再说吧,总之这次最大的收获就是基本认识了Emoji,有种一层迷雾散开的感觉,虽然并没解决最根本的需求问题,但也不亏。


    补充

    1.开源框架

    之后我又发现一个开源的emoji操作的框架
    https://github.com/vdurmont/emoji-java
    这个框架的API还是挺好了解的,就是那个判断字符串中是否包含emoji的判断没用,但是可以用获取emoji数据取长度来判断

     List<String> emojis =  EmojiParser.extractEmojis(str);
    if (emojis.size() > 0) {
          ......
    }
    
    2.使用屏蔽的场景

    上面我已经讲了在数据库不支持的情况怎么上传emoji,现在我打算补充下屏蔽emoji的使用场景。
    (1)比如输入名称/标题等等这些场景如果输入emoji的话,就好就是提示用户无法输入特殊符号(仿美团的做法)
    (2)比如评论,回复这些长的内容输入emoji而要屏蔽的话,可以在上传时候删除掉其中的emoji,用我发的框架的做法就是

     EmojiParser.removeAllEmojis(str)
    

    相关文章

      网友评论

      • MiBoy:你的logcat和 终端不支持输出emoji
      • 墙角的牵牛花:讲的好清楚。另外,我这边的后台工程师,每次只是在数据库,做一下配置,就可以妥妥的接收emoji了。我这边都不用操心这个事。
        键盘上的麒麟臂:@墙角的牵牛花 嗯,一般就是应该后台做操作,但是并不是所有后台都像你那边那么好:joy:

      本文标题:Android之初识Emoji

      本文链接:https://www.haomeiwen.com/subject/gmshqftx.html