美文网首页
字符集和字符编码扫盲

字符集和字符编码扫盲

作者: C语言中文社区 | 来源:发表于2019-04-15 21:38 被阅读0次

    字符是各种文字和符号的总称,包括各个国家文字、标点符号、图形符号、数字等。
    字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集有:ASCII 字符集、ISO 8859 字符集、GB2312 字符集、BIG5 字符集、GB18030 字符集、Unicode字符集等。
    字符编码就是以二进制的数字来对应字符集的字符。
    常见的编码字符集(简称字符集)如下所示:
    Unicode:也叫统一字符集,它包含了几乎世界上所有的已经发现且需要使用的字符
    (如中文、日文、英文、德文等)。
    ASCII:ASCII 既是编码字符集,又是字符编码。早期的计算机系统只能处理英文,所以ASCII 也就成为了计算机的缺省字符集,包含了英文所需要的所有字符。
    GB2312:中文字符集,包含ASCII 字符集。ASCII 部分用单字节表示,剩余部分用双字节表示。
    GBK:GB2312 的扩展,但完整包含了GB2312 的所有内容。
    GB18030:GBK 字符集的超集,常叫大汉字字符集,也叫CJK(Chinese,Japanese,Korea)字符集,包含了中、日、韩三国语。
    注意:Unicode 字符集有多种编码方式,如UTF-8、UTF-16 等;ASCII 只有一种;大多数MBCS(包括GB2312)也只有一种。

    相关文章

      网友评论

          本文标题:字符集和字符编码扫盲

          本文链接:https://www.haomeiwen.com/subject/wsfmwqtx.html