筑基系列-计算机基础知识小抄版

作者: JayDroid | 来源:发表于2021-08-01 16:20 被阅读0次

A-晓理动码_光头哥.png

1.背景篇

1.1 计算机发展史

电子管计算机 (1946-1957)
- 埃尼阿克(ENIAC)
晶体管计算机(1957-1964)
- 贝尔实验室、MIT林肯实验室的TX-0、PDP-1配备4k内存和显示器
集成电路计算机 (1964-1980)
- 德州仪器的工程师发明了集成电路(IC)、IBM(7094,1401) 、System/360 操作系统
超大规模集成电路计算机 (1980-现在)
- 乔布斯 Apple 和 Apple二代
未来的计算机
- 生物计算机
- 量子计算机

1.2 CPU发展史

摩尔定律
- 定义：当价格不变时，集成电路中可容纳的晶体管数目约每隔 18～24 个月就会增加一倍，性能也将提升一倍。
- 这一定律揭示了信息技术发展的速度，但到今天，摩尔定律失效了。因为随着芯片越来越小，在尺寸和散热等方面已经挑战了人类的极限，芯片中无法再放入更多的电子元件了。
- 所以计算能力又开始以另一种方式发展，那就是多核心，比如一个普普通通的 NVIDA 显卡中就拥有了几百个核心，这样就可以进行大量的并发计算；另外，一个分布式的大数据集群，里面就可能有上千个核心。
单核CPU发展史
- （1971～ 1973） 500KHz频率的微型计算机（字长8位）
- （1978～ 1985） 500MHz频率的微型计算机（字长16位）
- （1985～ 2000）高于1GHz频率的微型计算机（字长32位）
- （1973～ 1978）高于1MHz频率的微型计算机（字长8位）
- （2000～现在）高于2GHz频率的微型计算机（字长为64位）
多核CPU发展史
- （2005） Intel奔腾系列双核CPU、 AMD速龙系列
- （2006） Intel酷睿四核CPU
- Intel酷睿系列十六核CPU
- Intel至强系列五十六核CPU
CPU数字能量是如何产生的
- 时间是最重要的输入：晶振
- 电能供给给芯片，芯片中的一种电子元件晶振（也就是石英晶体）通电后产生震荡
- 震荡会产生频率稳定的脉冲信号，通常这是一种高频的脉冲信号，每秒可达百万次
- 然后通过谐振效应发放这个信号，形成方波
- 再通过电子元件调整这种脉冲的频率，把脉冲信号转换为需要的频率，这就形成了驱动芯片工作的时钟信号
- 最后，时钟信号驱动着芯片工作，就像人体的脉搏一样，每一次脉冲到来，都让芯片的状态发生一次变化，最终存储器中的指令被一行行执行

1.3 32 位 VS 64 位

32、64 位可以表示操作系统、软件、 CPU等
32位的容量：2^32 = 4 × 2^30 = 4𝐺𝐵
64位的容量：2^64 = 2^34 × 2^30 = 2^34𝐺𝐵=224T𝐵=2^14EB=24EB
如果是 CPU，那么有 32 位 CPU，也有 64 位 CPU
- 如果 CPU 每次可以计算 4 个 byte，那么我们称作 32 位 CPU
- 如果 CPU 每次可以计算 8 个 byte，那么我们称作 64 位 CPU
- 这里的 32 和 64，称作 CPU 的位宽
- 64 位 CPU 可以执行更大数字的运算，这个优势在普通应用上不明显，但是对于数值计算较多的应用就非常明显。
- 64 位 CPU 可以寻址更大的内存空间
如果 32 位/64 位说的是程序，那么说的是指令是 64 位还是 32 位的。
- 32 位指令在 64 位机器上执行，困难不大，可以兼容。
- 如果是 64 位指令，在 32 位机器上执行就困难了，32 位的寄存器都存不下指令的参数。
如果 32 位/64 位说的是操作系统
- 操作系统也是一种程序，如果是 64 位操作系统，也就是操作系统中程序的指令都是 64 位指令，因此不能安装在 32 位机器上。

1.4 计算机的分类

超级计算机
- 功能最强
- 运算速度的单位是TFlop/s（1TFlop/s=每秒一万亿次浮点计算）
- Intel(R) Core(TM) i7-6700K CPU @ 4.00GHz： 44.87 GFlop/s（ 0.04487TFlop/s）
- 世界排名：Summit IBM（美国) > 神威太湖之光(中国) > Sierra IBM（美国）
- 中国排名：神威太湖之光 > 天河二号> 天河一号
大型机 (又称大型机、大型主机、主机等)
- IBM Z9
- 大型机造价高昂
- 去“IOE”行动 (I(IBM) O(Oracle) E(EMC)) --阿里云
迷你计算机（服务器）
- 普通服务器已经代替了传统的大型机，成为大规模企业计算的中枢
工作站
- 高端的通用微型计算机，提供比个人计算机更强大的性能
- 类似于普通台式电脑，体积较大，但性能强劲
微型计算机
- 麻雀虽小、五脏俱全
- 从构成的本质上来讲，个人计算机与前面的分类无异

1.5 计算机的体系与结构

阿兰.图灵
- 英国(1912-1954) 数学家成逻辑学家网密肯进分析家和理论生物学家，被誉为计算机科学和人工智能之父。
- 图灵机
- 图灵测试
- 图灵完备
- 可判定性
图灵机
- 图灵机拥有一条无限长的纸带，纸带上是一个格子挨着一个格子，格子中可以写字符，你可以把纸带看作内存，而这些字符可以看作是内存中的数据或者程序。
- 图灵机有一个读写头，读写头可以读取任意格子上的字符，也可以改写任意格子的字符。
- 读写头上面的盒子里是一些精密的零件，包括图灵机的存储、控制单元和运算单元。
- 图灵通过数学证明了，一个问题如果可以拆解成图灵机的可执行步骤，那问题就是可计算的。
- 另一方面，图灵机定义了计算机的组成以及工作原理，但是没有给出具体的实现。
冯诺依曼体系
- 将程序指令和数据一起存储的计算机设计概念结构,现代计算机都是冯诺依曼机
- 能够长期记忆程序、数据、中间结果及最终运算结果的能力
- 能够把需要的程序和数据送至计算机中
- 能够具备算术、逻辑运算和数据传送等数据加工处理的能力
- 能够按照要求将处理结果输出给用户
- 冯诺依曼瓶颈：CPU和存储器速率之间的问题无法调和导致CPU经常空转等待数据传输
冯诺依曼机组成结构
- 输入设备
  - 鼠标、键盘
- 输出设备
  - 显示器
- 存储器
  - CPU、内存、硬盘
- 控制器
  - CPU
- 运算器
  - CPU

1.6 程序翻译与解释

人类语言与计算机语言需要进行语言之间的转换
程序翻译
- L1是描述程序逻辑的高级语言
- L0是计算机实际执行的低级语言
- 编译器：高级语言对应的编译器
- 程序翻译就是编译器将L1语言翻译并生成L0语言
- 翻译过程生成新的L0程序
- 通过编译器执行的相关语言
  - C/C++
  - Object-C
  - Go
程序解释
- L1是描述程序逻辑的高级语言
- L0是计算机实际执行的低级语言
- 解释器：使用L0语言实现的程序
- 程序解释的过程就是解释器将L1语言解释为L0语言
- 解释过程不生成新的L0程序
- 相关语言
  - Python
  - Php
  - Javascript
混合型语言
- Java （java程序翻译成字节码，字节码解释成机器码）
- C#

1.7 计算机的层次

硬件逻辑层
- 门、触发器等逻辑电路组成
- 属于电子工程的领域
微程序机器层
- 编程语言是微指令集
- 微指令所组成的微程序直接交由硬件执行
- 一般是硬件厂商公司处理该层
传统机器层
- 编程语言是CPU指令集（机器指令）
- 一条机器指令对应一个微程序，一个微程序对应一组微指令
- 编程语言和硬件是直接相关
- 不同架构的CPU使用不同的CPU指令集（英特尔、AMD、x86/X86_64）
操作系统层
- 向上提供了简易的操作界面
- 向下对接了指令系统，管理硬件资源
- 操作系统层是在软件和硬件之间的适配层
汇编语言层
- 编程语言是汇编语言（PUSH DS/PUSH DS）
- 汇编语言可以翻译成可直接执行的机器语言
- 完成翻译的过程的程序就是汇编器
高级语言层
- 高级语言的类别非常多，由几百种
- 常见的高级语言有： Python、 Java、 C/C++、 Golang等
应用层
- 满足计算机针对某种用途而专门设计
- WPS、IDE

1.8 计算机的计算单位

容量单位
- 在物理层面，高低电平记录信息
- 理论上只认识0/1两种状态，0/1称为bit（比特位）
- 0/1能够表示的内容太少了，需要更大的容量表示方法
- 更大的容量单位：字节、千字节、兆字节、吉字节、太字节、拍字节、艾字节
- 为什么网上买的移动硬盘500G，格式化之后就只剩465G了？
  - 硬盘商一般用10进位标记容量 𝟓𝟎𝟎 ∗ 𝟏𝟎𝟎𝟎^{3/𝟏𝟎𝟐𝟒}3约等于𝟒𝟔𝟓
  - 厂商采用十进制更好沟通

容量单位	bit	Byte	KB	MB	GB	TB	PB	EB
名字	比特位	字节	千字节（kilobyte）	兆字节=百万字节（megabyte）	吉字节=十亿字节（GigaByte）	太字节=万亿字节(terabyte)	拍字节=千万亿字节（petabyte）	艾字节=2^60字节（ExaByte）
换算	-	8bits	1024B	1024K	1024M	1024G	1024T	1024P
常见设备	门电路		寄存器	高速缓存	内存/硬盘	硬盘	云硬盘	数据仓库

速度单位
- 网络速度
  - 100M带宽=100M/s
  - 为什么电信拉的100M光纤，测试峰值速度只有12M每秒？
    - 网络常用单位为(Mbps)
    - bps(bits per second):每秒传送位数
    - 100M/s = 100Mbps = 100Mbit/s
    - 100Mbit/s=(100/8)MB/s=12.5MB/s
- 计算速度
  - CPU的速度一般体现为CPU的时钟频率
  - CPU的时钟频率的单位一般是赫兹Hz（hertz）
  - 目前主流CPU的时钟频率都在2GHz以上
  - Hz其实就是秒分之，并不只是描述计算机领域所专有的单位
  - Hz它是每秒中的周期性变动重复次数的计量
  - 在CPU中就表示高低电瓶在每秒中变化的次数，2GHz = 2*1000^3Hz = 每秒20亿次

1.9 计算机的字符与编码集

早期英美的ASCII码
- 美国信息交换标准码（American Standard Code for Information Interchange）
- 使用7个bits就可以完全表示ASCII码
- 包含95个可打印字符，33个不可打印字符（包括控制字符）
- 很多应用或者国家中的符号都无法表示
- 无法表示数学符号：“÷ ≠ ≥ ≈ π”
- 𝟑𝟑 + 𝟗𝟓 = 𝟏𝟐𝟖 = 𝟐^7
  image
Externed ASCII码
- 第一次对ASCII码进行扩充， 7bits => 8bits
- 常见数学运算符
- 带音标的欧洲字符
- 其他常用符、表格符等
  
  [图片上传失败...(image-99a975-1627805702081)]
国际化
- 欧洲、中亚、东亚、拉丁美洲国家的语言多样性
- 语言体系不一样，不以有限字符组合的语言
- 中国、韩国、日本等的语言最为复杂
- 中文编码集
  - GB2312
    - 《信息交换用汉字编码字符集——基本集》
    - 一共收录了 7445 个字符
    - 包括 6763 个汉字和 682 个其它符号
    - 不兼容国际标准
  - GBK
    - 向下兼容GB2312，向上支持国际ISO标准
    - 《汉字内码扩展规范》
    - 收录了21003个汉字，支持全部中日韩汉字
    - 国际电脑不安装GBK编码就会显示乱码
    - 国内的Windows系统默认使用GBK编码
- Unicode
  - Unicode：统一码、万国码、单一码，兼容全球的字符集
  - Unicode定义了世界通用的符号集， UTF-*实现了编码
  - UTF-8以字节为单位对Unicode进行编码

2.组成篇

2.1 计算机的总线

总线的概述
- USB = Universal Serial Bus ，通用串行总线
  - 提供了对外连接的接口
  - 不同设备可以通过USB接口进行连接
  - 连接的标准，促使外围设备接口的统一
- 总线的分类
  - 片内总线
    - 芯片内部的总线
    - 寄存器与寄存器之间
    - 寄存器与控制器、运算器之间
  - 系统总线
    - CPU、主内存、 IO设备、各组件之间的信息传输线
    - 数据总线
      - 双向传输各个部件的数据信息
      - 一般与CPU位数相同（32位、 64位）
      - 数据总线的位数（总线宽度）是数据总线的重要参数，64位总线一次可传输8个字节的数据
    - 地址总线
      - 指定源数据或目的数据在内存中的地址
      - 地址总线位数=n，寻址范围： 0~𝟐^n
      - 地址总线的位数与存储单元有关
    - 控制总线
      - 控制总线是用来发出各种控制信号的传输线
      - 控制信号经由控制总线从一个组件发给另外一个组件
      - 控制总线可以监视不同组件之间的状态（就绪/未就绪）
总线的仲裁
- 为了解决总线使用权的冲突问题
- 总线的仲裁的方法
  - 链式查询-串联
    - 所有设备都可想仲裁器发出使用权申请，仲裁器在分配使用权时是按照链式顺序逐个询问，轮到谁就是谁
    - 好处：电路复杂度低，仲裁方式简单
    - 坏处：优先级低的设备难以获得总线使用权
    - 坏处：优先级低的设备难以获得总线使用权
  - 计时器定时查询-并联
    - 仲裁控制器对设备编号并使用计数器累计计数
    - 接收到仲裁信号后，往所有设备同时发出计数值
    - 计数值与设备编号一致则获得总线使用权
  - 独立请求-循环
    - 每个设备均有总线独立连接仲裁器
    - 设备可单独向仲裁器发送请求和接收请求
    - 当同时收到多个请求信号，仲裁器有权按优先级分配使用权
    - 好处：响应速度快，优先顺序可动态改变
    - 好处：响应速度快，优先顺序可动态改变

2.2 计算机的输入输出设备

常见输入输出设备
- 输入设备
  - 字符输入设备
    - 键盘：
      - 薄膜键盘
      - 机械键盘（根据段落感、声音、压力、键程的不同分为：黑轴、红轴、青轴、茶轴）
      - 电容键盘
  - 图像输入设备
    - 鼠标
    - 数位板：常用于绘图设计创作，输入板和压感笔
    - 扫描仪：将图形信息转换为数字信号
- 输出设备
  - 显示器
    - CRT显示器
    - 液晶显示器
  - 打印机
  - 投影仪
输入输出接口的通用设计
- 通用设计考虑的问题：读取数据、向设备发送数据、设备有没有被占用？、设备是否已经启动？、设备是否已经连接？
- 数据线
  - 是I/O设备与主机之间进行数据交换的传送线
  - 单向传输数据线
  - 双向传输数据线
- 状态线
  - IO设备状态向主机报告的信号线
  - 查询设备是否已经正常连接并就绪
  - 查询设备是否已经被占用
- 命令线
  - CPU向设备发送命令的信号线
  - 发送读写信号
  - 发送启动停止信号
- 设备选择线
  - 主机选择I/O设备进行操作的信号线
  - 对连在总线上的设备进行选择
CPU与IO设备的通信
- CPU速度与IO设备速度不一致
- 程序中断
  - 当外围IO设备就绪时，向CPU发出中断信号
  - CPU有专门的电路响应中断信号
  - 中断的意义
    - 提供低速设备通知CPU的一种异步的方式
    - CPU可以高速运转同时兼顾低速设备的响应
    - 提高工作效率(polling的问题)
    - 故障恢复(异常处理、紧急事件等)
    - 简化编程模型(try/cache, 计时器等)
- 例如通过电脑打印资料的过程
  - 中断相应过程
    
    [图片上传失败...(image-b69194-1627805702081)]
  - 中断请求类型
    - 硬件设备发给主板(打印机、键盘、鼠标等)
    - 硬件中断: CPU异常(除以0), 时钟信号等
    - 软件中断:发出(异常、切换到内核态等)
  - 中断向量表
    - (一般在内存中) 一块块区域，存储了中断类型和中断响应程序的对应关系。每一行叫做一个中断向量。
      
      中断类型 ISR地址描述
      
      00 0x0000 除以0
      
      01 0x0004 单步
      
      09 0x0024 键盘
      
      18 0x0048 打印机
      
      100 0x0190 自定义
  - 中断QA
    - 32位机器上的中断响应路径(ISR) 只有4个字节，怎么实现复杂的程序?
    - 按键程序中断响应路径到操作系统再到应用，但是到底哪些键被按了怎么知道?
    - 中断响应后，如何恢复到中断执行前的状态?
    - 既然出错了?为什么不出错了直接跳转到错误处理位置?
- DMA（direct memory access）直接存储器存取
  - DMA直接连接主存与IO设备
  - DMA直接连接主存与IO设备
  - 当主存与IO设备交换信息时，不需要中断CPU
  - 可以提高CPU的效率
  - 硬盘和外置显卡中都有DMA设备

中断类型	ISR地址	描述
00	0x0000	除以0
01	0x0004	单步
09	0x0024	键盘
18	0x0048	打印机
100	0x0190	自定义

2.3 计算机存储器

存储器的分类
- 按存储介质分类
  - 半导体存储器：内存条、 U盘、固态硬盘
  - 磁存储器：磁带、磁盘
- 按存取方式分类
  - 随机存储器(RAM)：随机读取与位置无关
  - 串行存储器：与位置有关按顺序查找
  - 只读存储器(ROM）：只读不写
存储器指标
- 读写速度：7200转
- 存储容量：2T
- 价格：容量+价格=>位价：每比特位价格
层次结构
- 高速缓存：速度快，位格高
- 主存：速度适中，位格适中
- 辅存：速度慢，位格低
- 缓存-主存层次
  - 原理：局部性原理
  - 实现：在CPU与主存之间增加一层速度快（容量小）的Cache
  - 目的：解决主存速度不足的问题
- 主存-辅存层次
  - 原理：局部性原理
  - 实现：主存之外增加辅助存储器（磁盘、 SD卡、 U盘等）
  - 目的：解决主存容量不足的问题
- 局部性原理
  - 局部性原理是指CPU访问存储器时，无论是存取指令还是存取数据，所访问的存储单元都趋于聚集在一个较小的连续区域中。

2.4 主存储器与辅助存储器

计算机断电，内存数据丢失
计算机断电，磁盘数据不会丢失
主存
- RAM（随机存取存储器： Random Access Memory）
- RAM 通过电容存储数据，必须隔一段时间刷新一次
- 如果掉电，那么一段时间后将丢失所有数据
- 内存与CPU如何交互的
[图片上传失败...(image-e4c649-1627805702081)]
- 32位系统：2^32 = 4 × 2^30 = 4𝐺𝐵
- 64位系统：2^64 = 2^34 × 2^30 = 2^34𝐺𝐵=224T𝐵=2^14EB=24EB
- 32位的系统最大支持4GB的内存寻址范围，每一个字节都对应一个内存地址。内存地址由 0 开始编号，比如第 1 个地址是 0，第 2 个地址是 1，然后自增排列，最后一个地址是内存中的字节数减 1。
- 工作原理
  - 字：是指存放在一个存储单元中的二进制代码组合
  - 字块：存储在连续的存储单元中而被看作是一个单元的一组字
  - 假设一个字有32位，一个字块共B个字，主存共M个字块
    - B×M = 主存总字数；B×M×32 = 主存总容量(bits)
  - 字的地址包含两个部分，前m位指定字块的地址，后b位指定字在字块中的地址
    - 2^𝑚 = 𝑀 , 前m位能表示出的寻址范围是0--2^𝑚
    - 2^𝒃 = 𝐵，后b位能表示出的寻址范围是0--2^b
辅存：磁盘
- 表面是可磁化的硬磁特性材料
- 移动磁头径向运动读取磁道信息
- 磁道、扇区、磁头位置、磁头方向
- 寻道调度算法
  - 先来先服务算法
    - 按顺序访问进程的磁道读写需求
  - 最短寻道时间优先
    - 与磁头当前位置有关
    - 优先访问离磁头最近的磁道
  - 扫描算法（电梯算法）
    - 每次只往一个方向移动
    - 到达一个方向需要服务的尽头再反方向移动
  - 循环扫描算法
    - 每次只往一个方向移动
    - 一个方向到头后再从头开始从同一个方向开始移动

2.5 高速缓存

为了解决CPU与主存的速度不匹配的问题
缓存与主存的关系
- 存储的逻辑结构类似
- 缓存的容量较小
- 缓存的速度更快
在主存缓存层次结构中的工作原理
- CPU需要的数据在缓存里：直接获取
- CPU需要的数据不在缓存里：需要去主存拿，替换策略
  - 需要性能良好的缓存替换策略
- 命中率：从缓存取数据的命中率
  - 命中率是衡量缓存的重要性能指标
  - 理论上CPU每次都能从高速缓存取数据的时候，命中率为1
  - 访问主存次数： N𝑚，访问Cache次数： N𝑐
  - 命中率ℎ =𝑁𝑐/(𝑁𝑐＋𝑁𝑚)
- 访问效率： 𝑒
  - 访问主存时间： 𝑡𝑚 ，访问缓存时间：𝑡𝑐
  - 访问Cache-主存系统平均时间： 𝑡𝑎 = ℎ×𝑡𝑐 + (1 − ℎ)×𝑡𝑚
  - 𝑒 =𝑡𝑐/𝑡𝑎
高速缓存替换策略
- 随机算法
- 先进先出算法(FIFO)
  - 把高速缓存看做是一个先进先出的队列
  - 优先替换最先进入队列的字块
- 最不经常使用算法(LFU)
  - 优先淘汰最不经常使用的字块
  - 需要额外的空间记录字块的使用频率
- 最近最少使用算法(LRU)
  - 优先淘汰一段时间内没有使用的字块
  - 如果正在使用的字块在缓存就将其移到表头，保证链表头部节点是最近使用的
  - 有多种实现方法，一般使用双向链表

2.6 计算机的指令系统

计算机指令
- 计算机通过指令指挥计算机工作。
- CPU被时钟驱动，不断的读取PC指针指向的指令，并增加PC指针，从内存中读取指令并执行。(如此周而复始)
- 不同的CPU架构使用不同指令。目前使用最广泛的是RISC(Reduced instruction set computer,精简指令集)
机器指令的形式
- 机器指令主要由两部分组成：操作码、地址码
- 操作码指明指令所要完成的操作
- 操作码的位数反映了机器的操作种类，如果操作码有8位就有2^8 = 256种操作
- 地址码直接给出操作数或者操作数的地址
- 分三地址指令、二地址指令和一地址指令与零地址指令
  - 零地址指令
    - 在机器指令中无地址码
    - 空操作、停机操作、中断返回操作等
  - 一地址指令
    - (addr1)OP→ (addr1)：自己对自己的操作
    - (addr1)OP(ACC) → (addr1)：自增操作
  - 二地址指令
    - (addr1)OP(addr2) → (addr1)或(addr2)：结果放在addr1或addr2)
  - 三地址指令
    - 一个操作码和三个地址码
    - (addr1)OP(addr2) → (addr3)：结果放在addr3，例如： 1+2=3
操作类型
- 数据传输
  - 寄存器之间、寄存器与存储单元、存储单元之间传送
  - 数据读写、交换地址数据、清零置一等操作
load/store指令用来从内存中读/写入内存。通常会有多个版本的实现，助记符是:
- load类: Iw,Ib,Ih
- store类: sw,sb,sh
- 算术逻辑
  - 操作数之间的加减乘除运算
    - 加减乘除等：addi, subi, divi, multi
  - 操作数的与或非等逻辑位运算
    - 位运算指令：and/or/xor
移位操作
- 数据左移（乘2）、数据右移（除2）
- 完成数据在算术逻辑单元的必要操作
- 控制指令
  - 等待指令、停机指令、空操作指令、中断指令等
寻址方式
- 指令寻址
  - 顺序寻址
  - 跳跃寻址
    
    地址指令
    
    101 MOV R0,R1
    
    102 ADD R1,R2
    
    103 JMP 102
- 数据寻址
  - 立即寻址
    - 指令直接获得操作数
    - 无需访问存储器
    - 优点：速度快
    - 缺点：地址码位数限制操作数表示范围
  - 直接寻址
    - 直接给出操作数在主存的地址
    - 寻找操作数简单，无需计算数据地址
    - 优点：寻找操作数简单
    - 缺点：地址码位数限制操作数表示范围
  - 间接寻址
    - 指令地址码给出的是操作数地址的地址
    - 需要访问一次或多次主存来获取操作数
    - 优点：操作数寻址范围大
    - 缺点：速度较慢

地址	指令
101	MOV R0,R1
102	ADD R1,R2
103	JMP 102

2.7 计算机的控制器

控制器是协调和控制计算机运行的
程序计数器
- 程序计数器用来存储下一条指令的地址
- 循环从程序计数器中拿出指令
- 当指令被拿出时，指向下一条指令
时序发生器
- 电气工程领域，用于发送时序脉冲
- CPU依据不同的时序脉冲有节奏的进行工作
指令译码器
- 指令译码器是控制器的主要部件之一
- 计算机指令由操作码和地址码组成
- 翻译操作码对应的操作以及控制传输地址码对应的数据
指令寄存器
- 指令寄存器也是控制器的主要部件之一
- 从主存或高速缓存取计算机指令
主存地址寄存器
- 保存当前CPU正要访问的内存单元的地址
主存数据寄存器
- 保存当前CPU正要读或写的主存数据
通用寄存器
- 用于暂时存放或传送数据或指令
- 可保存ALU的运算中间结果
- 容量比一般专用寄存器要大

2.8 计算机的运算器

运算器是用来进行数据运算加工的
数据缓冲器
- 分为输入缓冲和输出缓冲
- 输入缓冲暂时存放外设送过来的数据
- 输出缓冲暂时存放送往外设的数据
ALU
- ALU：算术逻辑单元，是运算器的主要组成
- 常见的位运算（左右移、与或非等）
- 算术运算（加减乘除等）
通用寄存器
- 用于暂时存放或传送数据或指令
- 可保存ALU的运算中间结果
- 容量比一般专用寄存器要大
状态字寄存器
- 存放运算状态（条件码、进位、溢出、结果正负等）
- 存放运算控制信息（调试跟踪标记位、允许中断位等）
总线

2.9 计算机指令的执行过程

指令执行过程
- 取指令
  - 从缓存取指令
  - 送到指令寄存器
- 分析指令
  - 指令译码器译码
  - 发出控制信号
  - 程序计数器+1
- 执行指令
- 装载数据到寄存器
- ALU处理数据
- 记录运算状态
- 送出运算结果
[图片上传失败...(image-1822e8-1627805702081)]
CPU的流水线设计
- 提高CPU的综合利用率
- 类似工厂的装配线
- 工厂的装配线使得多个产品可以同时被加工
- 在同一个时刻，不同产品均位于不同的加工阶段
- 串行执行m条指令： 𝑇1 = 3t × 𝑚
- 流水线执行m条指令： 𝑇2 = 𝑡 × (𝑚 + 2)
- 流水线执行效率:H=𝑇2/𝑇1= 𝑡 × (𝑚 + 2)/3t × 𝑚=1/3+1/3m, m很大的情况下是串行执行的3倍效率
指令时间片时间片时间片时间片时间片

1 取指令分析指令执行指令

2 取指令分析指令执行指令

3 取指令分析指令执行指令

指令	时间片	时间片	时间片	时间片	时间片
1	取指令	分析指令	执行指令
2		取指令	分析指令	执行指令
3			取指令	分析指令	执行指令

3.计算篇

3.1 进制运算的基础

什么是进制
- 进位制是一种记数方式，亦称进位计数法或位值计数法
- 有限种数字符号来表示无限的数值
- 使用的数字符号的数目称为这种进位制的基数或底数
- 计算机喜欢二进制，但是二进制表达太长了
- 使用大进制位可以解决这个问题
- 八进制、十六进制满足2的n次方的要求
- 二进制
  - 1024=0b1000000000
- 八进制
  - 1024=0o2000
- 十进制： [0-9]
- 十六进制
  - MAC地址：[0-9]和A、 B、 C、 D、 E、 F
  - 1024=0x400
- 二十进制
  - 玛雅文明的玛雅数字
  - 因努伊特的因努伊特数字
- 六十进制
  - 时间、坐标、角度等量化数据
进制的表示法
- 正整数N，基数为r，位数为n
- N=𝑑𝑛−1×r𝑛−1 +𝑑𝑛−2× r𝑛−2 + ⋯ + 𝑑1×𝑟 + 𝑑0
- N= 1024 = 1 ×10^3 +0×10^3+ 2 × 10^1 + 4× 10^0
- 𝑁 = 10000000000 = 1 × 2^10
二进制转十进制的方法
- 按权展开法
- 𝑁 = 01100101 = 1 × 2^6 + 1 × 2^5 + 1 ×2^2 + 1 = 101
- 小数的按权展开法
- 𝑁 = 0.11001 = 1×2^−1 + 1×2^−2 + 1× 2^−5 = 0.78125=25/32
十进制转二进制的方法
- （整数）重复相除法
- 重复除以2 ，得商，取余数，最后一个余数为最高位
- （小数）重复相乘法
- 重复乘以2，得积，取1，第一个余数为最高位

3.2 原码&反码&补码

使用0表示正数，使用1表示负数，最高位表示符号位，其它都是数字位
+237=011101101， -237=111101101
两个字节16位表示+237 【0】 0 0 0 0 0 0 0 1 1 1 0 1 1 0 1
原码表示法
- 使用0表示正数、 1表示负数
- 规定符号位位于数值第一位
- 表达简单明了，是人类最容易理解的表示法
- 0有两种表示方法： 00、 10
- 原码进行运算非常复杂，特别是两个操作数符号不同的时候
  - 判断两个操作数绝对值大小
  - 使用绝对值大的数减去绝对值小的数
  - 对于符号值，以绝对值大的为准
- 希望找到不同符号操作数更加简单的运算方法
- 希望找到使用正数代替负数的方法
- 使用加法操作代替减法操作，从而消除减法
补码表示法
- 整数的补码
  - 如果 x∈[0, 2^𝑛) X=x ，n是数字位的个数
  - 如果 x∈[−2^𝑛, 0) X=2^(𝑛+1) + 𝑥
    - 例如：n=4， x=13，计算x的二进制原码和补码
      - 原码： x=0,1101
      - 补码： x=0,1101
    - 例如：n=4，x=-13，计算x的二进制原码和补码
      - 原码： x=1,1101
      - 补码： 2^(𝑛+1) + 𝑥= 2^(4+1() − 13 = 100000 − 1101 = 10011
- 小数的补码
  - 如果 x∈[0, 1) X=x
  - 如果 x∈[−1, 0) X=2+x
  - 规律：小数的反码等于原码除符号位外按位取反，补码等于反码+1
- 在计算补码的过程中，还是使用了减法
- 需要寻找使用正数代替负数的方法
反码表示法
- 反码的目的是找出原码和补码之间的规律，消除转换过程中的减法
- 如果 x∈[0, 2^𝑛) X=x ，n是数字位的个数
- 如果 x∈[−2^𝑛, 0) X=（2^(𝑛+1)-1） + 𝑥
- 规律：负数的反码等于原码除符号位外按位取反，负数的补码等于反码+1
  - -13，原码：1,1101 ，反码：1,0011 ，补码：1,0010
  - -7，原码： 1,0111，反码： 1,1001，补码： 1,1000
  - -1，原码： 1,0001 ，反码：1,1111，补码： 1,1110
- x=-13，计算x的二进制原码和反码
  - 原码： x=1,1101
  - 反码： (2𝑛+1−1) + 𝑥 = (2^4+1−1) − 13 = 011111 − 1101 = 1,0010
  - 反码： x=1,0010

[图片上传失败...(image-904cfc-1627805702081)]

3.3 定点数与浮点数

定点数的表示方法
- 小数点固定在某个位置的数称之为定点数
- 纯小数：符号位【小数点】数值位
- 纯整数：符号位数值位【小数点】
- 其它小数需要乘以比例因子以满足定点数保存格式，10.01 需要左移两位或者右移两位
- 计算机中的存储形式见下表，小数点不显示
数值符号位数值位

0.1011 0 1011

-0.1011 1 1011

1011 0 1011

-1011 1 1011
浮点数的表示方法
- 计算机处理的很大程度上不是纯小数或纯整数
- 数据范围很大，定点数难以表达
- 浮点数的表示格式
  - 类比科学计数法：123450000000 = 1.2345 × 10^11 ， 1.2345：尾数，10：基数，11：阶码
  - 𝑁 = 𝑆 × 𝑟^𝑗 ，S：尾数， r：基数， j：阶码
  - 阶码符号位|阶码数值位|尾数符号位|尾数数值位
  - 尾数规定使用纯小数
  - 11.0101 = 0.110101 × 2^10
  - 11.0101 = 0.0110101 × 2^11
  - 计算机中的存储形式见下表，小数点不显示
  数字阶码符号位阶码数值位尾数符号位尾数数值位（8位）
  
  0.110101 × 2^10 0 10 0 1010100
  
  0.0110101 × 2^11 0 11 0 01101010

数值	符号位	数值位
0.1011	0	1011
-0.1011	1	1011
1011	0	1011
-1011	1	1011

数字	阶码符号位	阶码数值位	尾数符号位	尾数数值位（8位）
0.110101 × 2^10	0	10	0	1010100
0.0110101 × 2^11	0	11	0	01101010

浮点数的表示范围
- 假设阶码数值取m位，尾数数值取n位
- 阶码表示范围： [−(𝟐^𝒎 − 𝟏), 𝟐^𝒎 − 𝟏]
- 尾数表示范围： [−(𝟏 − 𝟐^−𝒏), −(𝟐^−𝒏)] [𝟐^−𝒏, 𝟏 − 𝟐−^𝒏]
- 单精度浮点数：使用4字节、 32位来表达浮点数(float)
- 双精度浮点数：使用8字节、 64位来表达浮点数(double)
[图片上传失败...(image-2f48a7-1627805702081)]
浮点数的规格化
- 尾数规定使用纯小数
- 尾数最高位必须是1
- 例如：11.0101 = 0.110101 × 2^10
两者的对比
- 当定点数与浮点数位数相同时，浮点数表示的范围更大
- 当浮点数尾数为规格化数时，浮点数的精度更高（尾数存8位，前面的0多了丢失的精度就更多）
- 浮点数运算包含阶码和尾数，浮点数的运算更为复杂
- 浮点数在数的表示范围、精度、溢出处理、编程等方面均优于定点数
- 浮点数在数的运算规则、运算速度、硬件成本方面不如定点数

3.4 定点数的加减法运算

整数加法：A 补 + B 补 = 𝐴 + 𝐵 补 (𝑚𝑜𝑑2^(𝑛+1))
小数加法：A 补 + B 补 = 𝐴 + 𝐵 补 (𝑚𝑜𝑑2)
数值位与符号位一同运算，并将符号位产生的进位自然丢掉
整数减法：A 补 − B 补 = 𝐴 + (−𝐵) 补 (𝑚𝑜𝑑2^(𝑛+1))
小数减法：A 补 − B 补 = 𝐴 + (−𝐵) 补 (𝑚𝑜𝑑2)
-B[补]等于B[补]连同符号位按位取反，末位加一，B 补 = 1,0010101， (−B) 补 = 0,1101011
负数的反码等于原码按位取反，补码等于反码+1
例如： A=-110010， B=001101，求A+B
- A[补] = 1,001110
- B 补 = B[原] = 0,001101
- A 补 + B 补 = (A + B) 补 =1,011011
- (A + B)原 = −100101
例如：A=11001000， B=-00110100，求A-B
- A 补 = A[原] = 0,11001000
- B 补 = 1,11001100
- (−B) 补 = 0,00110100
- A 补 − B 补 = A + (−B) 补=0,11111100
- A − B（原） = 111111100
双符号位判断溢出
- 双符号位判断法
  - 单符号位表示变成双符号位： 0=>00,1=>11
  - 双符号位产生的进位丢弃
  - 结果的双符号位不同则表示溢出

3.5 浮点数的加减法运算

𝑥 = 𝑆𝑥 × 𝑟^𝑗𝑥，𝑥 = 0.1101 × 2^01
𝑦 = 𝑆𝑦 × 𝑟^𝑗y，𝑦 = (−0.1010) × 2^11
対阶
- 対阶的目的是使得两个浮点数阶码一致，使得尾数可以进行运算
- 浮点数尾数运算简单
- 浮点数位数实际小数位与阶码有关
- 阶码按小阶看齐大阶的原则
数字阶码符号位阶码数值位尾数符号位尾数数值位（8位）

0.1101 × 2^01 00 0001 00 1101

(−0.1010) × 2^11 00 0011 01 1010
- 対阶操作：将x的数值右移两位，𝑥 = 0.001101 × 2^11
数字阶码符号位阶码数值位尾数符号位尾数数值位（8位）

0.001101 × 2^11 00 0011 00 0011(01)舍弃后两位

(−0.1010) × 2^11 00 0011 01 1010
尾数求和
- 使用补码进行运算
- 减法运算转化为加法运算： A - B = A + (-B)
- 𝑥[原] = 00.0011，𝑥[补] = 00.0011
- 𝑦[原] = 11.1010，𝑦[补] = 11.0110
- S = (𝑥 + 𝑦)[补] = 11.1001
数字阶码符号位阶码数值位尾数符号位尾数数值位（8位）

11.1001 00 0011 11 1001
尾数规格化
- ◆ 对补码进行规格化需要判断两种情况： S>0和S<0
- S[补] = 00.1xxxxxx(𝑆 > 0)
- S[补] = 11.0xxxxxx(𝑆 < 0)
- 如果不满足此格式，需要进行左移，同时阶码相应变化，以满足规格化
- S = (𝑥 + 𝑦)[补] = 11.1001，不满足约定格式
- S = (𝑥 + 𝑦)[补] = 11. (1)0010(左移舍弃，阶码数值位也要相应变化)
数字阶码符号位阶码数值位尾数符号位尾数数值位（8位）

11.0010 00 0010 11 0010
- S = 𝑥 + 𝑦 补 = 11.0010，𝑥 + 𝑦 原 = −0.1110
- 𝑥 + 𝑦 = −0.1110× 2^10
- 一般情况下都是左移，符号位不一致下需要右移(定点运算的溢出情况)
- 右移的话则需要进行舍入操作
舍入
- 0舍1入” 法（二进制的四舍五入）
- S 补 = 10.10110111，符号位不一致，右移舍弃尾数再+1， S 补 = 11.01011011(1)+1=11.01011100
- 右移阶码要+1
溢出判断
- 定点运算双符号位不一致为溢出
- 浮点运算尾数双符号位不一致不算溢出，因为尾数双符号位可以进行右规
- 浮点运算主要通过阶码的双符号位判断是否溢出
- 如果规格化后，阶码双符号位不一致，则认为是溢出

数字	阶码符号位	阶码数值位	尾数符号位	尾数数值位（8位）
0.1101 × 2^01	00	0001	00	1101
(−0.1010) × 2^11	00	0011	01	1010

数字	阶码符号位	阶码数值位	尾数符号位	尾数数值位（8位）
0.001101 × 2^11	00	0011	00	0011(01)舍弃后两位
(−0.1010) × 2^11	00	0011	01	1010

数字	阶码符号位	阶码数值位	尾数符号位	尾数数值位（8位）
11.1001	00	0011	11	1001

数字	阶码符号位	阶码数值位	尾数符号位	尾数数值位（8位）
11.0010	00	0010	11	0010

[图片上传失败...(image-424183-1627805702081)]

3.6 浮点数的乘除法运算

乘法：阶码相加，尾数求积
𝑥 × 𝑦 = (𝑆𝑥 × 𝑆𝑦) × 𝑟^(𝑗𝑥+𝑗y)
除法：阶码相减，尾数求商
𝑥/𝑦 = (𝑆𝑥/𝑆𝑦) × 𝑟^(𝑗𝑥−𝑗y)
阶码运算
尾数运算
尾数规格化
舍入
溢出判断
例如： 𝑥 = 0.11010011 × 2^1101， 𝑦 = 0.11101110 × 2^0001，假设阶码4位，尾数8位，计算x * y
- 𝑥 × 𝑦 = (𝑆𝑥 × 𝑆𝑦) ×^𝑟(𝑗𝑥+𝑗y)
- = (0.11010011 × 0.11101110) × 𝑟^(1101+0001)
- = 0.11000100(保留八位) × 𝑟^1110

4.关于我

一个专注基础知识的十二线小码农，本着 基础，体系，实践，分享 的学习理念，在自我提升的同时分享自己的心得体会，不断完善，周而复始。

个人网站 basedev.cn

Github

BaseDev系列只整理点到为止的知识纲领，不求甚解；欲知其所以然者还得回归书本且付诸实践