美文网首页
文本编码UNICODE、UTF-8、ANSI、ASCII、GB2

文本编码UNICODE、UTF-8、ANSI、ASCII、GB2

作者: 李里里Riss | 来源:发表于2017-03-23 14:25 被阅读0次

    编码是对全世界的文字的存储记录格式

    ANSI

    ANSI——美国国家标准学会
    计算机早期出现,规定的字符串以1字节为单位,开始对字符进行编码工作。

    美标

    ASCII

    ASCII是“美国信息交换标准编码”的英文字头缩写,可以称为美标。
    计算机出现在美国,美国制定ASCII码,1字节。
    0~127表示:大小写字母、控制符等。
    128~255表示:没有规范,但被扩展为其他小语言字符、表格等等,成为“扩展字符集”。
    后来各国家制定自己的ANSI,废除了该部分的字符。

    国标

    中国汉字需要上网,制定了自己使用的汉字编码方案

    GB2312

    GB2312是对ANSII的中文扩展,汉字2个字节,英文1个字节,
    特点是:连续两个大于127的字符表示汉字。第一个字节(高字节)0xA10xF7,低字节0xA10xFE。收录了大约7000多简体汉字,包括数学符号、罗马希腊的字母、日本假名,还包括ANSII的文本字符2字节版,称为全角,原来127号以下的成为半角

    GBK

    GB2312里没有收录繁体字,香港和湾湾人民有意见,于是GBK编码出现,其实就是对GB2312的扩展。包含了GB2312的所有内容,新增20000个新汉字(包括繁体)和符号。
    所有GBK兼容GBK2312。

    GB18030

    对GBK扩展,加入几千少数名族的文字。

    BIG5

    BIG5码是针对繁体汉字的汉字编码,在台湾、香港电脑系统中得到普遍应用。

    Unicode

    相关文章

      网友评论

          本文标题:文本编码UNICODE、UTF-8、ANSI、ASCII、GB2

          本文链接:https://www.haomeiwen.com/subject/argnnttx.html