美文网首页
Unicode和汉字转化

Unicode和汉字转化

作者: 祥子_HelloWorld | 来源:发表于2019-07-31 15:46 被阅读0次
    介绍

    \uxxxx这种格式是Unicode写法,表示一个字符,其中xxxx表示一个16进制数字,范围所0~65535. Unicode十六进制数只能包含数字0~9、大写字母A~F或者小写字母A~F。需要注意到是:Unicode的大小端问题,一般都是小端在前,例如 \u5c0f 表示汉语中的 '小'字,转换成10进制就是9215,所以在byte数组中应该是1592.

    汉字转Unicode
     private string Unicode2Chinese(string strUnicode)
    {
        string[] splitString = new string[1];
        splitString[0] = "\\u";
        string[] unicodeArray = strUnicode.Split(splitString, StringSplitOptions.RemoveEmptyEntries);
        StringBuilder sb = new StringBuilder();
    
        foreach (string item in unicodeArray)
        {
            byte[] codes = new byte[2];
            int code1, code2;
            code1 = Convert.ToInt32(item.Substring(0, 2), 16);
            code2 = Convert.ToInt32(item.Substring(2), 16);
            codes[0] = (byte)code2;//必须是小端在前
            codes[1] = (byte)code1;
            sb.Append(Encoding.Unicode.GetString(codes));
        }
    
        return sb.ToString();
    }
    
    Unicode转汉字
    private string Chinese2Unicode(string strChinese)
    {
        string strUnicodes = string.Empty;
        foreach (char item in strChinese.ToCharArray())
        {
            strUnicodes += "\\u" + ((int)item).ToString("x"); //16进制
        }
        return strUnicodes;
    }
    

    程序截图:


    相关文章

      网友评论

          本文标题:Unicode和汉字转化

          本文链接:https://www.haomeiwen.com/subject/vhdtdctx.html