美文网首页
什么是字符编码

什么是字符编码

作者: 莱昂纳德刚 | 来源:发表于2017-03-06 15:47 被阅读0次

字符编码,编码的意思是指将数据通过一定方式表达或储存。所以字符编码就是字符的表现、储存方式,也就是字符集的实现方式。

对于一个字符集来说要正确编码转码一个字符需要三个关键元素:字库表(character repertoire)、编码字符集(coded character set)、字符编码(character encoding form)。其中字库表是一个相当于所有可读或者可显示字符的数据库,字库表决定了整个字符集能够展现表示的所有字符的范围。编码字符集,即用一个编码值code point来表示一个字符在字库中的位置。字符编码,将编码字符集和实际存储数值之间的转换关系。一般来说都会直接将code point的值作为编码后的值直接存储。例如在ASCII中A在表中排第65位,而编码后A的数值是0100 0001也即十进制的65的二进制转换结果。

字符编码 每个字符字节数
ASCII 1
UCS-2(Unicode) 2
UCS-4(Unicode) 4
UTF-8(Unicode) 1 - 6
UTF-16(Unicode) 2 - 4
GBK/GB2312(中文) 1 - 2
GB18030(CJK) 1 - 4

从上表可以看出,不同的字符编码用不同的方式表达字符集。

所以,根据所需要的字节数不同,把恒用2个字节表示一个字符的字符集(编码),叫做双字节字符集(Double-Byte Character Set,DBCS),其他的叫做多字节字符集(Multi-Byte Character Set,MBCS)。如上表中只有UCS-2才是DBCS字符集。

常见的字符集:

  • Unicode:也叫统一字符集,它包含了几乎世界上所有的已经发现且需要使用的字符(如中文、日文、英文、德文等)。
  • ASCII:早期的计算机系统只能处理英文,所以ASCII也就成为了计算机的缺省字符集,包含了英文所需要的所有字符。
  • GB2312:中文字符集,包含ASCII字符集。ASCII部分用单字节表示,剩余部分用双字节表示。
  • GBK:GB2312的扩展,但完整包含了GB2312的所有内容。
  • GB18030:GBK字符集的超集,常叫大汉字字符集,也叫CJK(Chinese,Japanese,Korea)字符集,包含了中、日、韩三国语言中的所有字符。

相关文章

  • 字符编码

    一. 什么是字符编码? 字符编码(英语:Character encoding)也称字集码,是把字符集中的字符编码为...

  • 字符串

    1.字符的编码 Python中的字符采用的是Unicode编码 1.什么是编码 :数字和字符是一一对应的,其中字符...

  • 《什么是字符编码》

    什么是进制 进制:几进制就是满几进一通常有二进制(0,1<10,11><100,101><110,111>),十进...

  • 什么是字符编码

    字符编码,编码的意思是指将数据通过一定方式表达或储存。所以字符编码就是字符的表现、储存方式,也就是字符集的实现方式...

  • 什么是字符编码?

    字符编码,又称字集码。字符编码是把字符集中的字符编码为指定集合中某一对象,以便文本在计算机中存储和通过通信网络的传...

  • 什么是字符编码

    基础知识 计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通...

  • 什么是字符编码

    在计算机中,所有信息最终都是用二进制来表示的。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合...

  • 什么是字符编码

    在了解什么是字符编码之前,首先要了解什么是字符集? 我们在计算机屏幕上看到的是实体化的文字,而在计算机存储介质中存...

  • 什么是字符编码

    字符编码就是一套规则,使用该规则能够将自然语言的字符(如元素表、字母表)的一个集合,与其他东西的集合(如号码...

  • 什么是字符编码

    什么是字符编码 字符集 简单的说字符集就是一张表,一张存储了文字和二进制对应的表。我们知道计算机存储信息都是以二进...

网友评论

      本文标题:什么是字符编码

      本文链接:https://www.haomeiwen.com/subject/mbfugttx.html