美文网首页
计算机编码发展

计算机编码发展

作者: paterL | 来源:发表于2023-03-25 19:55 被阅读0次

你也许见过跟别的字格格不入的孤寡文字,打开过全是看不懂的字符的文档,全是框框的游戏对话,点击过跟真网址一模一样的钓鱼网站。所有的这些都跟电脑显示文字的原理有关。

电脑显示文字涉及到三个重要的概念:字符、字符集、字符编码。一个汉子一个拉丁字母,一个数字都是一个字符;这些字符集合起来叫做字符集,通常来说,一个字符集里没有相同的字符。而这些字符计算机一个也不认识,为了让计算机认识这些字符,我们就需要把这些字符用0和1表示出来,把字符转换成0和1的规则就是字符编码。

计算机存储数据的基本单位是字节,也就是byte,一个字节有8个二进制位组成,也就是8个bit,共有256种状态,也就是一个字节可以存储256个字符,而英文字符只有26个,所以在上世纪60年代,美国先作出了美国信息交换码简称ASCLL,共收录了128个字符。但当各国进入信息化社会的时候,就出现了问题,各国搞的EASCLL后面的128个字符都不太一样,这样就导致了在同一码位上的字符可能不一致,所以同一个文本放到不同的计算机中打开可能显示结果不一样。但当信息化来的中日韩三国时,字符太多,就会导致一个字符集存不完这些字符,就我国发布的GB 2312-80中就包含了6763个常用简体汉字,所以GB 2312用两个字节长度来编码一个字符,这样理论上就可以容纳65536个字符,但GB 2312-80中只是最最常用的汉字,有一些姓氏根本没在其中,还有繁体字,导致这些字根本打不出来。在今天新的字符集已经包含了部分生僻字,但显示出来跟正常字体不一样。很多字体都还只适配GB 2312中的字符,后来微软设计了汉字内码拓展规范 GBK。又后来人类出现了万国码UNICODE,如今UNICODE已经有了1114112个码位。

以上出现了很多的编码格式,但是用不同的编码格式就会导致乱码的产生,例如用GBK编码发送,而 另一个人是使用UTF-8去解码,就会出现乱码问题。

相关文章

  • python中的encode()和decode()函数

    【一】编码历史 计算机的发展中,有ASCII码,GBK,Unicode,utf-8编码。 美国人发明了计算机,用八...

  • 计算机编码发展简史

    编码方式是编程中经常遇到的问题,如果编码/解码不同就会造成乱码的现象,好好了解一下编码的知识还是有用的。 经常见到...

  • 计算机编码发展史

    你也许见过跟别的字格格不入的孤寡文字,打开过全是看不懂的字符的文档,全是框框的游戏对话,点击过跟真网址一模一样的钓...

  • 第3天,Python字符编码/文件操作/函数

    一、字符编码 1、字符编码发展史 阶段一:现代计算机起源于美国,最早诞生的也是基于英文考虑的ASCII码;ASCI...

  • Python2与Python3的编码问题

    一. 什么是编码 将明文转换为计算机可以识别的的编码文本称为“编码”, 反之从计算机可识别的编码文本转回明文为“解...

  • 2019-05-08 数据通信基础

    数据通信是计算机网络发展的前提,没有数据通信的发展就没有计算机网络的今天 计算机内部的数字数据通过数据编码技术转换...

  • [python基础]-05 字符串和编码

    1.字符串编码历史及发展 1.1 计算机运作原理 计算机只能处理二进制数据:即0或者1,如果要处理的是文本,计算机...

  • OC 字符串编码-中英文字符串混合长度

    1.各种编码格式 原理以及发展历史 1.1 ASCII码 早起计算机发展初期,肯定是以字母为标准的,没考虑世界上其...

  • 前端 | 入门 | 前端需要知道的计算机编码

    计算机编码介绍 计算机,不能直接存储文字,存储的是编码。 计算机只能处理二进制的数据,其它数据,比如:0-9、a-...

  • 跟我一起学Python(二)

    一、编码 ASCII编码、Unicode编码、可变长编码”的UTF-8编码之间的由来 由于计算机是美国人发明的,因...

网友评论

      本文标题:计算机编码发展

      本文链接:https://www.haomeiwen.com/subject/iemnrdtx.html