二进制的原码、反码、补码、移码

作者: 逝去丶浅秋 | 来源:发表于2020-05-17 21:13 被阅读0次

之前了解一些原码、反码、补码，但是一直有疑问，为什么会有原码、反码、补码？所以决定研究一下。

计算机中参与运算的数有两大类：无符号数和有符号数。此篇主要看一下有符号数。在了解原码、反码、补码前需要先了解机器数和真值。

一、机器数

对于有符号数而言，使用“0”表示正，“1”表示负，这种把符号“数字化”的数称为机器数，也就是一个数在计算机中的二进制表示。

例如：+1100 在机器中表示为 0 1100；-1100 在机器中表示为1 1100

整数的符号位和值用逗号隔开，小数的小数点用点来隔开。
例如：+3转换成二进制就是00000011，-3就是10000011，这就是机器数。

二、真值

带符号位的机器数对应的真正数值就是真值。例如：1000 0011的真值是-3，而不是131，它的最高位是符号位。

下面开始说原码、反码、补码。

计算机里存储的实际都是数的补码，显示的时候转换为源码。原码和反码都有一定的缺陷。原码虽然表示简单明了，并易于和真值转换，但是在加减法运算时会有很多麻烦，运算步骤复杂费时，还需要计算机提供减法器来支持。而补码却能够满足这些要求，计算机只需要加法器就可以。

三、原码

原码是机器数中最简单的一种表示形式，包括符号位和数值位。

原码：符号位加上真值的绝对值，即第一位表示符号位，其余为表示值。原码是人脑最容易理解和计算的表示方式。

[+1]原 = 0000 0001
[-1]原 = 1000 0001

整数原码的定义：

式中，x为真值，n为整数的位数（位数不包括符号位，下同）。
例如：
当x=1110时，[x]_原=0,1110；
当x=-1110时，[x]_原=2⁴-(-1110)=1 1110，2 的4次方就相当于是符号位。

计算过程解释：
对于x的取值范围（例中的4位二进制来说）：
2^n的值为：2^4=16
最大值为：1111 = 1*2^3 + 1*2^2 + 1*2^1 + 1*2^0 =8+4+2+1=15
最小值为：0000=0

当x为负数时，计算过程如下：
[x]原=2^4 - (-1110) = 2^4 + 1110 = 1 0000 + 1110 = 1 1110

小数原码的定义为：

式中，x为真值。
例如:
当x=0.1101时，[x]_原=0.1101;
当x=-0.1101时，[x]_原=1-(-0.1101)=1.1101;

原码的问题：
以正负1来说明问题，先来看1+(-1)的计算过程：

1 + (-1)=[0000 0001]原+[1000 0001]原=[1000 0010]原=-2

1+(-1)=0，但是用原码来算结果却是-2，原码的加法没有问题，但是减法却出现了问题。

四、补码

为了解决原码做减法时出现的问题，出现了反码，我们用其他的方式来表示负数，使减法的问题用加法去解决。

补数的思想：
要了解补码的思想就要知道“模”、“同余”、“补数”的概念。

在日常生活中，常会遇到“补数”的概念。计算机组成原理(唐朔飞)中举了一个时钟的例子，现在是6点钟，要到达3点钟的话该怎么办呢？我们可以顺时针方向将时针移动9小时，或是逆时针移动3小时，我们都可以到达3点钟，假设顺时针转为正，逆时针转为负，则有：

6 - 3 = 6 + 9，3和15都代表3点钟

钟表时针转一圈能代表12个小时，在数学上称12为模，写作mod 12，对于mod 12而言，+9和-3互为补数，3和15是同余关系，记作3≡15 (mod 12)，3 + 12 = 15.

其实就相当于没到12点就丢失，从0点重新开始。

对于时钟运算，减去一个数，是可以等同于加上另外一个正数，例如：6 - 3 = 6 - 3 + 12 = 6 + 9
其实相当于6-3加上模，即相当于是时钟多走了一圈，所以3和15是等价的。

将补数的概念用到计算机中，便出现了补码这种机器数。

补码:正数的反码是其本身，负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1. (即在反码的基础上+1)，这里只是便于计算才这样说。

对于补码，相当于是模加上真值，就如同上面的6+(-3)，-3就是真值。
整数补码的定义为：

式中，x为真值，n为整数的位数（对于8位二进制数，那么这里的n就为7，第一位是符号位）。

整数补码定义中mod 2ⁿ⁺¹的由来：
以8位二进制为例，整数的位数是n=7,8位二进制可以表示的最小值是：0000 0000，最大值是：1111 1111，从0到255，即可以表示2⁸=256个数字，所以整数补码的模是2ⁿ⁺¹，即mod 2ⁿ⁺¹。

原码中的-0在补码中是什么？
对于-0，根据补码的定义,[-0]_补=100000-10000=10000,其实在补码中-0是不存在的，这也是补码出现的原因之一，这里的10000只是一种表示方式，所以补码比原码能多表示一个数，这个数就是-2ⁿ。

例如：
当x=+1010时，[x]_补=0,1010;
当x=-1101时，[x]_补=2ⁿ⁺¹ + x = 2₅ - 1101 = 100000 - 1101 = 1,0011

负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1，计算方式的由来：
分析：假如x=-1011，[x]_补=2⁵-1011，我们把2⁵改写成100000=11111+00001，可以得到：

[x]_补 = 2⁵ + x = 11111 + x + 00001

因为x是负数，我们可以用-x₁x₂x₃x₄来表示，单项的x_i不是0就是1，上面式子可以改写为：

[x]_补 = 2⁵ + x = 11111 - x₁x₂x₃x₄ + 00001

因为1减去1得0，减去0得1，负数-x₁x₂x₃x₄的原码为1,x₁x₂x₃x₄，所以式子中11111 - x₁x₂x₃x₄就相当于是对原码的取反操作，最后再+00001，所以得到上面负数求补码的计算方式。

小数补码的定义为：

式中，x为真值，n为小数的位数。

小数补码定义中mod 2的由来：

小数的最大值为：1.1111，当增加1时(1.1111+1)，得到小数补码的模是2，所以小数补码是：mod 2。

例如：
当x=+0.0110时，[x]_补=0.1001;
当x=-0.0110时，[x]_补=2 + x = 10.0000 - 0.0110 = 1.1010
当x=0时，
[+0.0000]_补=0.0000;
[-0.0000]_补=2 + (-0.0000) = 10.0000 - 0.0000 = 0.0000;
显然[+0]_补=[-0]_补=0.0000，即补码中的“零”只有一种表示形式。

补码的符号位扩展：
1、补码的正负小数符号位扩展就是在末尾加0即可，例如：1.1101扩展为1.1101 0000
2、补码的正数符号位扩展在最高位前面加0即可，例如：0101扩展为0000 0101
3、补码的负数符号位扩展在最高位前面加1既可以，例如：1010扩展为1111 1010

五、反码

反码通常用来作为由原码求补码或者由补码求原码的中间过渡。
反码：正数的反码是其本身，负数的反码是在其原码的基础上，符号位不变，其余各个位取反。这个方法只是利于计算，但是并不代表反码的真正含义，可以把它忘记

[+1] = [00000001]原 = [00000001]反
[-1] = [10000001]原 = [11111110]反

整数反码的定义为：

式中，x为真值，n为整数的位数。
例如：
当x=+1101时，[x]_反=0,1101（用逗号将符号位和数值部分隔开）
当x=-1101时，[x]_反=(x⁴⁺¹ - 1)+x=1,1111-1101=1,0010

小数反码的定义为：

式中，x为真值，n为小数的位数。
例如：
当x=+0.0110时，[x]_反=0.0110；
当x=-0.0110时，[x]_反=(2-2^-4)+x=1.1111-0.0110=1.1001;
当=0时，
[+0.0000]_反=0.0000；
[-0.0000]_反=(10.0000-0.0001)-0.0000=1.1111;
由上可见[+0]_反和[-0]_反是有两种表现方式。

反码的问题：
反码中0有两种表示方式，0000 0000和1111 1111，这导致在实际计算中每当跨过0一次，就有一个单位的误差，所以需要+1，即补码的方式。

六、移码

因为补码符号位和数值一起编码，所以很难从补码上直接判断出其真值的大小，而用移码就可以很直观的看判断出来。

移码的定义：

式中，x为真值，n为整数的位数。
例如：
当x=10100时，[x]_移=2⁵+10100=1,10100
当x=-10100时，[x]_移=2⁵-10100=0,01100
可以直接看出10100>-10100

利用移码的这一特点，当浮点数的阶码用移码表示时，就能很方便的判断阶码的大小。

移码相当于补码的符号位取反。

对于补码来说是存在符号位的，使用移码就相当于把补码的负数部分往上移动，使得最小值变为0，而不是负数。

移码更详细的用处以后再研究。

写在最后：

如果文章中有错误或是表达不准确的地方，欢迎大家评论中指正，以便我完善。
文章我也会根据所学到新的知识不断更新。

二进制的原码、反码、补码、移码

一、机器数

二、真值

三、原码

四、补码

五、反码

六、移码

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读