1.进程的定义
程序:就是一个指令序列
程序段、数据段、PCB(系统为每个运行的程序配置一个数据结构,称为进程控制块)三部分组成了进程实体(进程映像)。
程序段:程序代码即存放在此
数据段:程序运行时使用,产生的运算数据,如全局变量,局部变量,宏定义的常用就存放在数据段内
PCB(系统为每个运行的程序配置一个数据结构,称为进程控制块):
OS通过PCB来管理进程,因此PCB中应该包含操作系统对其进行管理所需的各种信息
PCB(进程管理者,OS所需的数据都在PCB中);程序段,数据段(程序本身的运行所需的数据)
PCB:{
进程描述信息: 进程标识符PID
用户标识符UID
进程控制和管理信息:进处理品当前状态
进程优先级
资源分配清单:程序段指针
数据段指针
键盘
鼠标
处理机相关信息:各种寄存器值(当进程切换时需要把进程当前的运行情况记录下来保存在PCB中,如程序计数器的值表示了
当前程序执行到哪一句)
}
PCB {
进程标识符
处理机状态
进程调度信息
进和控制信息
}
一般情况下,我们把进程实体(进程映像)就简称为进程.
例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,实质上是撤销进程实体中的PCB
PCB是进程存在的唯一标志
从不同的角度,进程可以有不同的定义,比较传统典型的定义有:
1.进程是程序的一次执行过程。
2.进程是一个程序及其数据在处理机上顺序执行时所发生的活动。
3.进程是具有独立功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
注:严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。
2.进程的组织
在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来
注:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题
进程的组级别方式:
链接方式:按照进生状态将PCB分为多个队列;操作系统持有指向各个队列的指针
索引方式:根据进生状态的不同,建立几张索引表;OS持有指缶各个索引表的指针
3.进程的特征:
动态性:进处理品的最基本特征
并发性
独立性:进程是系统进行资源分配。调度的独立单位
异步性:各进程以不可预知的速度向前推进,可能导致运行结果不确定性
结构性
4.进程状态及转换
就绪态-运行态:进程被调度
运行态-就绪态:时间片到 or CPU被其他高优先级的进程抢占
运行态-阻塞态:等待资源分配,或等待某事件发生(主动形为)
阻塞态-就绪态:资源分配到位,等待的事件发生(被动行为)
创建态-就绪态:系统完成创建进程相关的工作
运行态-终止态:进行运行结束,或运行过程中遇到不可修复的错误
运行态->阻塞态(进程系统调用的方式申请某种系统资源,或者请求等待某个事件发生) 是一种进行处身做出的主动行为
阻塞态->就绪态(申请的资源被分配,或等待的事件发生) 是进程自身能控制的,是一种被动行为
注意:
不能由阻塞态直接转换为运行态:进入阻塞态是进程主动请求的,必然需要进行在运行时才能发出这种请求
也不能由就绪态直接转换为阻塞态:处于就绪态的进程,并没有分配到处理机资源,因此不可能发出主动的形为
5.进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。
简化理解:反正进程控制就是要实现进程状态转换
如何实现进程控制
用原语实现
原语是一种特殊的程序,它的执行具有原子性。也就是说,这段程序的运行必须一气呵成,不可中断
原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断。
可以用“关中断指令”和“开中断指令”这两个特权指令实现原子性
正常情况:CPU每执行完一条指令都会例行检查是否有中断信号需要处理,如果有,则暂停运行当前这段程序,转而执行相应的中断处理程序。
CPU执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查。这样,关中断、开中断之间的这些指令序列就是不可被中断的,这就实现了“原子性”
进程控制相关的原语 {
更新PCB中的信息
a. 所有的进程控制原语一定都会修改进程状态标志
b. 剥夺当前运行进程的CPU使用权必然需要保存其运行环境
c. 某进程开始运行前必然要恢复期运行环境
将PCB插入合适的队列
分配 / 回收资源
}
进程创建:{
创建原语:申请空白PCB
为新进程分配所需资源
初始化PCB
将PCB插入就绪队列
引起进程创建的事件:
用户登录:分时系统中,用户登录成功,系统会建立为其建立一个新的进程
作业调度:多道批处理系统中,有新的作业放入内存,会为其建立一个新的进程
提供服务:用户向操作系统提出某些请求时,会新建一个进程处理该请求
应用请求:由用户进程主动请求创建一个子进程
}
进程的终止:{
撤销原语:从PCB集合中找到终止进程的PCB
若进程正在运行,立即剥夺CPU,将CPU分配给其他进程
终止其所的子进程
将该进程拥有的所有资源归还给父进程或操作系统
删除PCB
引起进程终止的事件:正常结束
异常结束
外界干预
}
6. 进程通信
进程通信就是指进程之间的信息交换
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立
为了保证安全,一个进程不能直接访问另一个进程的地址空间
但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法
进程通信:共享存储
基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。
基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式
进程通信:管道通信
管道是指用于连接读写进程的一个共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的缓冲区
管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
各进程要互斥地访问管道。
数据以字符流的形式写入管道,当管道写满时,写进程的write() 系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read() 系统调用将被阻塞。(缓冲区的特性)
如果没写满,就不允许读。如果没读空,就不允许写。(缓冲区的特性)
数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。
进程通信:消息传递
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息 / 接收消息”两个原语进行数据交换
直接消息传递:消息直接挂到接收进程的消息缓冲队列上
间接消息传递:消息要先发送到中间实体(信箱)中,因此也称“信箱通信方式”。Eg:计网中的电子邮件系统
7.线程
当切换进程时,需要保存 / 恢复进程运行环境,还需要切换内存地址空间(更新快表、更新缓存)开销很大
进程间并发,开销很大
当切换进程时,需要保存 / 恢复进程运行环境,还需要切换内存地址空间(更新快表、更新缓存)
线程间并发,开销更小
同一进程内的各个线程间并发,不需要切换进程运行环境和内存地址空间,省时省力
引入线程机制后,并发带来的系统开销降低,系统并发性提升
注意:从属于不同进程的线程间通信,也必须请求操作系统服务!
引入线程前,进程既是资源分配的基本单位,也是调度的基本单位。
引入线程后,进程是资源分配的基本单位,线程是调度的基本单位。线程也有运行态、就绪态、阻塞态
在多CPU环境下,各个线程也可以分派到不同的CPU上并行地执行。
线程几乎不拥有资源,只拥有极少量的资源(线程控制块TCB、寄存器信息、堆栈等)
8.处理机的调度
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是“调度”研究的问题。
在多道程序系统中,进程的数量往往是多于处理机的个数的,这样不可能同时并行地处理各个进程。处理机调度,就是从就绪队列中按照一定的算法选择一个进程并将处理机分配给它运行,以实现进程的并发执行
调度的三个层次
高级调度:由于内存空间有限,有时无法将用户提交的作业全部放入内存,因此就需要确定某种规则来决定将作业调入内存的顺序。
高级调度(作业调度)。
按一定的原则从外存上处于后备队列的作业中挑选一个(或多个)作业,给他们分配内存等必要资源,并建立相应的进程(建立PCB),以使它(们)获得竞争处理机的权利。
高级调度是辅存(外存)与内存之间的调度。每个作业只调入一次,调出一次。作业调入时会建立相应的PCB,作业调出时才撤销PCB。高级调度主要是指调入的问题,因为只有调入的时机需要操作系统来确定,但调出的时机必然是作业运行结束才调出
中级调度(内存调度)
引入了虚拟存储技术之后,可将暂时不能运行的进程调至外存等待。等它重新具备了运行条件且内存又稍有空闲时,再重新调入内存。
这么做的目的是为了提高内存利用率和系统吞吐量。
暂时调到外存等待的进程状态为挂起状态。值得注意的是,PCB并不会一起调到外存,而是会常驻内存。PCB中会记录进程数据在外存中的存放位置,进程状态等信息,操作系统通过内存中的PCB来保持对各个进程的监控、管理。被挂起的进程PCB会被放到的挂起队列中。
中级调度,就是要决定将哪个处于挂起状态的进程重新调入内存。
一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高
低级调度(进程调度)
低级调度,其主要任务是按照某种方法和策略从就绪队列中选取一个进程,将处理机分配给它。
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。
进程调度的频率很高,一般几十毫秒一次
补充知识:进程的挂起态与七状态模型
暂时调到外存等待的进程状态为挂起状态(挂起态,suspend)
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
五状态模型 -----> 七状态模型
注意“挂起”和“阻塞”的区别,两种就绪挂起状态都是暂时不能获得CPU的服务,但挂起态是将进程映像调到外存去了,而
阻塞态下进程映像还在内存中。
有的操作系统会把就绪挂起、阻塞挂起分为两个挂起队列,甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为阻塞挂起 多个队列
9.进程调度的时机
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机
临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
临界区:访问临界资源的那段代码。
内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)
有的系统中,只允许进程主动放弃处理机有的系统中,进程可以主动放弃处理机,当有更紧急的任务需要处理时,也会强行剥夺处理机(被动放弃)
进程在普通临界区中是可以进行调度、切换的。
进程调度的方式
非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态
实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统
剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进
可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统
进程的切换与过程
“狭义的进程调度”与“进程切换”的区别:
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
过程
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程主要完成了:
对原来运行进程各种数据的保存
对新的进程各种数据的恢复
(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少
10.调度算法的评价指标
CPU利用率
由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作
CPU利用率:指CPU “忙碌”的时间占总时间的比例。
利用率= 忙碌的时间/总时间利用率 = 忙碌的时间 / 总时间
利用率= 忙碌的时间/总时间
系统吞吐量
对于计算机来说,希望能用尽可能少的时间处理完尽可能多的作业
系统吞吐量:单位时间内完成作业的数量
系统吞吐量=总共完成了多少道作业 /总共花了多少时间系统吞吐量 = 总共完成了多少道作业 / 总共花了多少时间
系统吞吐量=总共完成了多少道作业/总共花了多少时间
Eg:某计算机系统处理完10道作业,共花费100秒,则系统吞吐量为?
10/100 = 0.1 道 / 秒
周转时间
对于计算机的用户来说,他很关心自己的作业从提交到完成花了多少时间。
周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
它包括四个部分:
作业在外存后备队列上等待作业调度(高级调度)的时间、
进程在就绪队列上等待进程调度(低级调度)的时间、
进程在CPU上执行的时间、
进程等待I/O操作完成的时间。
后三项在一个作业的整个处理过程中,可能发生多次
对于用户来说,更关心自己的单个作业的周转时间
(作业)周转时间=作业完成时间– 作业提交时间
对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值
平均周转时间=各作业周转时间之和/作业数平均周转时间 = 各作业周转时间之和/作业数
平均周转时间=各作业周转时间之和/作业数
周转时间
带权周转时间必然 ≥ 1
带权周转时间=作业周转时间/作业实际运行的时间 = (作业完成时间– 作业提交时间)/作业实际运行的时间
平均带权周转时间=各作业带权周转时间之和/作业数
带权周转时间与周转时间都是越小越好
等待时间
等待时间=周转时间-运行时间
计算机的用户希望自己的作业尽可能少的等待处理机
等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低
对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/O完成的期间其实进程也是在被服务的,所以不计入等待时间。
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间。
一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的,
因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体性能。
响应时间
对于计算机用户来说,会希望自己的提交的请求(比如通过键盘输入了一个调试命令)尽早地开始被系统服务、回应。
响应时间,指从用户提交请求到首次产生响应所用的时间
11.调度算法
各种调度算法的学习思路
算法思想
算法规则
这种调度算法是用于作业调度还是进程调度?
抢占式?非抢占式?
优点和缺点
是否会导致饥饿
饥饿:某进程/作业长期得不到服务.
先来先服务(FCFS, First Come First Serve)
按照作业/进程到达的先后顺序进行服务
用于作业/进程调度: 用于作业调度时,考虑的是哪个作业先到达后备队列;用于进程调度时,考虑的是哪个进程先到达就绪队列
非抢占式的算法
优点:公平、算法实现简单
缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对短作业不利(Eg :排队买奶茶…)
不会产生饥饿现象
短作业优先(SJF, Shortest Job First)
算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间
算法规则: 最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短)
即可用于作业调度,也可用于进程调度。用于进程调度时称为“短进程优先(SPF, Shortest Process First)算法”
SJF和SPF是非抢占式的算法。但是也有抢占式的版本——最短剩余时间优先算法(SRTN, Shortest Remaining Time Next)
短作业优先(SJF, Shortest Job First)
算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间
算法规则: 最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短)
即可用于作业调度,也可用于进程调度。用于进程调度时称为“短进程优先(SPF, Shortest Process First)算法”
SJF和SPF是非抢占式的算法。但是也有抢占式的版本——最短剩余时间优先算法(SRTN, Shortest Remaining Time Next)
公式:
1>周转时间=作业完成时间–作业提交时间
2>带权周转时间=作业周转时间/作业实际运行的时间 = (作业完成时间–作业提交时间)/作业实际运行的时间
2>带权周转时间=周转时间/实际运行的时间 = (完成时间–提交时间)/实际运行的时间
3>等待时间=周转时间-运行时间
等待时间=周转时间-运行时间-I/O操作的时间
(纯计算型的进程,一个进程到达后要么在等待,要么在运行。如果是又有计算,又有I/O操作的进程,
其等待时间就是周转时间-运行时间-I/O操作的时间)
4>平均周转时间=各作业周转时间之和/作业数
5>平均带权周转时间=各作业带权周转时间之和/作业数
6>平均等待时间=各作业等待时间/作业数
网友评论