unicode 是一个把所有世界上的文字符号都统一包含的字符集,每一字符就是 码点/码位(code point)
比如 字符 a
在十六进制下是 61
, 汉字 好
是59d7
utf (Unicode Transformation Formats) 则是专门用于处理unicode的字符编码(Character encoding)
其中utf-32是固定32位长度的,完全与unicode的code point一一对应, 但是英文字母很短,汉字却很长,比如前面的a
跟好
的区别, 如果都用32位表示 就会造成传输空间浪费。
utf-8是一种可变长度字符编码。
网友评论