美文网首页
Linux 学习基础 -- 数据表示方式

Linux 学习基础 -- 数据表示方式

作者: 熊猫人和熊猫猫 | 来源:发表于2019-04-13 19:41 被阅读0次

    数据表示方式

    1. 数字系统

    早期的计算机使用的是利用通电与否的特性的真空管,如果通电就是1,没有通电就是0,后来沿用至今,我们称这种只有0/1的环境称为二进制,英文称为 binary。所谓二进制也就是逢2进1;十进制就是逢10进1。下面举例十进制向二进制的转换:


    十进制转二进制的方法

    2. 文字编码系统

    既然计算机都只有记录0/1而已,甚至记录的数据都是使用byte/bit等单位来记录的,文字该怎么记录呢?这就需要“编码系统”处理了(在查看文件时是否经常会看到“UTF8”这个东东?接下来马上就帮你答疑解惑)
    编码系统:可以想象成一个“字码对照表”,文字数据会由编码对照表将文字转成数字后,再存入文件当中。如图:

    数据参考编码表的示意图

    常用的英文编码表为ASCII系统,在这个系统中,每个符号(英文、数字或符号等)都会占用1 bytes 的记录(别忘了1 bytes=8 bits),因此总共会有2的8次方即256种变化。
    中文字当中的编码系统最早最常用的是 big5 这个编码表,每个中文会占用2 bytes,理论上最多有2的16次方即65536个中文字,但由于并非所有的位都用来成为对照,因而并非可达那么多的中文字码。也正是因为如此,我们从网上下载一些很早之前的文件,打开容易出现乱码的缘故。
    为了解决这个问题,由国际组织ISO/IEC跳出来制定了所谓的Unicode编码系统,我们常常称呼的UTF8或万国码的编码就是它。因为这个编码系统打破了所有国家的不同编码,因此目前因特网社会大多朝向这个编码系统再走。

    相关文章

      网友评论

          本文标题:Linux 学习基础 -- 数据表示方式

          本文链接:https://www.haomeiwen.com/subject/kaprwqtx.html