正如上篇所讨论的,计算机就是数据处理器,但是在讨论数据处理之前,我们应该先知道数据的本质。
数据的类型
常用数据主要包括文本、数字、图像、音频、视频。
计算机内部的数据
计算机外数据格式多种多样,但为了方便处理,在计算机中所有数据在都是以二进制的格式(位模式)存储。
位
位(bit,binary digit,二进制数字),是存储在计算机中的最小单位:它只能是0或1 。位代表设备的某种状态,惯例是1表示开关闭合状态,0表示开关断开状态。
单个的位并不能解决数据表示问题。为了表示数据的不同类型,我们使用位模式,他是一个序列,有时也被称为位流。
计算机存储器并不知道它所存储的位流是哪种类型的数据,计算机存储器仅仅将数据以位模式存储,至于解释位模式是数字类型还是图片类型是由输入/输出设备或程序来完成(当数据输入计算机时他们被编码,展示给用户时他们被解码)。
字节
通常长度为8位的位模式被称为字节。
表示数据
文本
文本在位模式中会以一定的规范表示,这种规范被称为编码格式。
ASCII 美国国家标准协会(ANSI)开发的一种被称为美国信息交换标准码(ASCII)的编码格式。此编码格式使用7位表示每个符号。即此格式可以定义127种不同的符号,该格式由以下突出特点:
- ASCII使用7位模式,规范从0000000到1111111
- 第一个模式(0000000)表示空字符 ' '
- 最后一个模式(1111111)表示删除字符
- 有31种控制字符(不可打印字符)
- 数字字符(0-9)编码在字母字符之前。
- 有专用的打印字符
- 大写字母(A-Z)编码在小写字符(a-z)之前
- 大小写字符仅用一位来区分。例如A(1000001)a(1100001),即使用右起第六位区分。
- 在大小写字符之间,有6种特殊字符
Unicode ASCII所能表示的符号仅限于英语。为此,需要更大容量的代码,这种编码格式使用16位并能表示多达65536个符号。
ISO 国际化标准组织设计的一种使用32位的编码格式能够表示4294967296个符号,足以表示当今世界上所有符号。
数字
在计算机中,数字是用二进制系统表示的。并没有使上述的文本编码格式来保存数字是因为并不适用于数字之间的计算。
图像
图像在计算机中由两种表示方法:位图图形或矢量图形。
1.位图图形
这种模式中,图像被分成像素矩阵,每个像素是一个小点。像素的大小取决于分辨率,分辨率越高,需要的内存也越大。
2.矢量图
位图图形存在的问题是一幅特定的图像采用精确位模式表示后必须存储在计算机中。如果想调整图像的大小,就必须改变像素的大小,这将产生波纹状或颗粒状的图像。
矢量图并不存储位模式,它是将图像分解成曲线和直线的组合,其中每一条曲线或直线由数学公式表示,这种公式的组合被存储在计算机中。当要显示或打印图像时,将图像的尺寸作为输入传给系统。系统根据新的尺寸重新设计图像并用相同的公式画出图像。
音频
音频表示声音和音乐。音频的本质是模拟数据,他是连续性的(模拟的),并不是离散的(数学的)。
视频
视频是图像(帧)在时间上的表示。电影就是一系列的帧,一张一张地播放而形成的运动图像。
十六进制和八进制
十六进制有十六个符号组成(0-9 + A-F),每个十六进制由四个位表示
八进制有八个符号组成(0-7),每个八进制由三个位表示
网友评论