ASCII
含义
美国信息交换标准代码(American Standard Code for Information Interchange)
由来
最早的计算机在设计时采用8个比特(bit)作为一个字节(byte)。一个字节能表示的最大的整数就是255(2^8-1=255),而ASCII编码,占用0 - 127用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。在英文中128个符号编码可以满足所有情况,但不足满足所有语言,所以Unicode、GB等编码方案相继而生。
Unicode
含义
Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。
由来
为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求,这样就不会再有乱码问题了。
实现方式
目前的Unicode字符分为17组编排,0x0000 至 0x10FFFF,每组称为平面(Plane),而每平面拥有65536个码位,共1114112个。这十七个平面中,第0平面(Basic Multilingual Plane,简写 BMP)U+0000~U+FFFF最为重要。
UTF-8、UTF-16、UTF-32都是Unicode的实现方式。UTF是“Unicode Transformation Format”的缩写,可以翻译成Unicode字符集转换格式,即怎样将Unicode定义的数字转换成程序数据。
UCS
含义
通用字符集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。UCS-2用两个字节编码,UCS-4用4个字节编码。
范围
U+0000-U+FFFF
GB
由来
如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国在ASCII基础上制定了GB2312编码,用来把中文编进去。GB2312是最早的版本。
分类
GB2312、GBK、GB18030
ISO-8859
欧洲国家的标准
BIG5
支持ASCII字符和繁体中文
网友评论