数据表示方式
1. 数字系统
早期的计算机使用的是利用通电与否的特性的真空管,如果通电就是1,没有通电就是0,后来沿用至今,我们称这种只有0/1的环境称为二进制,英文称为 binary。所谓二进制也就是逢2进1;十进制就是逢10进1。下面举例十进制向二进制的转换:
十进制转二进制的方法
2. 文字编码系统
既然计算机都只有记录0/1而已,甚至记录的数据都是使用byte/bit等单位来记录的,文字该怎么记录呢?这就需要“编码系统”处理了(在查看文件时是否经常会看到“UTF8”这个东东?接下来马上就帮你答疑解惑)
编码系统:可以想象成一个“字码对照表”,文字数据会由编码对照表将文字转成数字后,再存入文件当中。如图:
常用的英文编码表为ASCII系统,在这个系统中,每个符号(英文、数字或符号等)都会占用1 bytes 的记录(别忘了1 bytes=8 bits),因此总共会有2的8次方即256种变化。
中文字当中的编码系统最早最常用的是 big5 这个编码表,每个中文会占用2 bytes,理论上最多有2的16次方即65536个中文字,但由于并非所有的位都用来成为对照,因而并非可达那么多的中文字码。也正是因为如此,我们从网上下载一些很早之前的文件,打开容易出现乱码的缘故。
为了解决这个问题,由国际组织ISO/IEC跳出来制定了所谓的Unicode编码系统,我们常常称呼的UTF8或万国码的编码就是它。因为这个编码系统打破了所有国家的不同编码,因此目前因特网社会大多朝向这个编码系统再走。
网友评论