为了有效地管理存储器并且少出错,现代系统提供了一种对主存的抽象概念,叫做虚拟存储器(VM)。虚拟存储器是硬件异常、硬件地址翻译、主存、磁盘文件和内核软件的完美交互,它为每个进程提供了一个大的、一致的和私有的地址空间。
通过一个很清晰的机制,虚拟存储器提供了三个重要的能力:
- 它将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式,它高效地使用了主存。
- 它为每个进程提供了一致的地址空间,从而简化了存储器管理。
- 它保护了每个进程的地址空间不被其它进程破坏。
使用虚拟寻址时,CPU通过生成一个虚拟地址(Virtual Address,VA)来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址。将一个虚拟地址转换成物理地址的任务叫做地址翻译(Addres Translation)。就像处理异常一样,地址翻译需要CPU硬件和操作系统之间的紧密合作。CPU芯片上叫做存储器管理单元(Memory Management Unit,MMU)的专用硬件,利用存放在主存中的查询表来动态翻译虚拟地址,该表的内容由操作系统管理。
主存中的每个字节都有一个选自虚拟地址空间的虚拟地址和一个选自物理地址空间的物理地址。
虚拟存储器(VM)被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成数组。每字节都有一个唯一的虚拟地址,这个唯一的虚拟地址是作为到数组的索引的。磁盘上数组的内容被缓存到主存中。和存储器层次结构中的其它缓存一样,磁盘(较低层)上的数据被分割成块,这些块作为磁盘和主存(较高层)之间的传输单元。VM系统通过将虚拟存储器分割为称为虚拟页(Virtual Page,VP)的大小固定的块来处理这个问题。每个虚拟页的大小为字节。类似地,物理存储器被分割为物理页(Physical Page,PP),大小也为P字节(物理页也称为页帧(page frame))。
在任意时刻,虚拟页面的集合都分为三个不相交的子集:
- 未分配的:VM系统还未分配(或者创建)的页。未分配的块没有任何数据和它们相关联,因此也就不占用任何磁盘空间。
- 缓存的:当前缓存在物理存储器中的已分配页。
- 未缓存的:没有缓存在物理存储器中的已分配页。
同任何缓存一样,虚拟存储器系统必须有某种方法来判定一个虚拟页是否存放在DRAM中的某个地方。如果是,系统还必须确定这个虚拟页存放在哪个物理页中。如果不命中,系统必须判断这个虚拟页存放在磁盘的哪个位置,在物理存储器中选择一个牺牲页,并将虚拟页从磁盘拷贝到DRAM中,替换这个牺牲页。
这些功能是由许多软硬件联合提供的,包括操作系统软件、MMU(存储器管理单元)中的地址翻译硬件和一个存放在物理存储器中叫做页表(page table)的数据结构,页表将虚拟页映射到物理页。每次地址翻译硬件将一个虚拟地址转换为物理地址时都会读取页表。操作系统负责维护页表的内容,以及在磁盘与DRAM之间来回传送页。
页表就是一个页表条目(Page Table Entry,PTE)的数组。虚拟地址空间中的每个页在页表中一个固定偏移量处都有一个PTE。
在虚拟存储器的习惯说法中,DRAM缓存不命中称为缺页(page fault)。缺页异常调用内核中的缺页异常处理程序,该程序会选择一个牺牲页,如果牺牲页的内容已被修改,内核就会将它拷贝回磁盘;接下来,内核从磁盘拷贝缺页所需的数据到存储器,随后返回;当异常处理程序返回时,它会重新启动导致缺页的指令,该指令会把导致缺页的虚拟地址重发送到地址翻译硬件;此时数据已经缓存在主存中了,那么页命中也能由地址翻译硬件正常处理了。
在虚拟存储器的习惯说法中,块被称为页。在磁盘和存储器之间传送页的活动叫做交换(swapping)或者页面调度(paging)。页从磁盘换入(或者页面掉入)DRAM和从DRAM换出(或者页面调出)磁盘。一直等待,直到有不命中发生时,才换入页面的这种策略称为按需页面调度(demand paging)。
按需页面调度和独立的虚拟地址空间的结合,对系统中存储器的使用和管理造成了深远的影响。特别地,VM简化了链接和加载、代码和数据共享,以及应用程序的存储器分配。
每次CPU生成一个地址时,地址翻译硬件都会读一个PTE(页表条目),所以通过在PTE上添加一些额外的许可位来控制对一个虚拟页面内容的访问十分简单。
用虚拟存储器来提供页面级的存储器保护示例中,每个PTE添加了三个许可位。SUP位表示进程是否必须运行在内核模式下才能访问该页。运行在内核模式中的进程可以访问任何页面,但是运行在用户模式中的进程只允许访问那些SUP为0的页面。READ位和WRITE位控制对页面的读和写访问。例如,如果进程i运行在用户模式下,那么它有读VP0和读写VP1的权限;然而,不允许它访问VP2。
地址翻译
使用页表的虚拟地址CPU中的一个控制寄存器,页表基址寄存器(Page Table Base Register,PTBR)指向当前页表。n位的虚拟地址包含两个部分:一个 p 位的虚拟页面偏移(Virtual Page Offset,VPO)和一个 n-p 位的虚拟页号(Virtual Page Number,VPN)。存储器管理单元(Memory Management Unit,MMU)利用虚拟页号来选择适当的页表条目(Page Table Entry,PTE)。将页表条目中物理页号(Physical Page Number,PPN)和虚拟地址中的虚拟页面偏移(VPO)串起来,就得到相应的物理地址。注意,因为物理和虚拟页面都是P字节的,所以物理页面偏移(Physical Page Offset,PPO)和VPO是相同的。
页面命中当页面命中时,CPU硬件执行步骤:
- 处理器生成一个虚拟地址,并把它传给MMU。
- MMU生成PTE地址,并向高速缓存/主存请求得到它。
- 高速缓存/主存向MMU返回PTE。
- MMU构造物理地址,并把它传送给高速缓存/主存。
- 高速缓存/主存返回所请求的数据字给处理器。
处理缺页要求硬件和操作系统内核协作完成:
- 处理器生成一个虚拟地址,并把它传给MMU。
- MMU生成PTE地址,并向高速缓存/主存请求得到它。
- 高速缓存/主存向MMU返回PTE。
- PTE中的有效位是零,所以MMU触发了一次异常,传递CPU中的控制到操作系统内核中的缺页异常处理程序。
- 缺页处理程序确定出物理存储器中的牺牲页,如果这个页面已经被修改了,则把它换出到磁盘。
- 缺页处理程序调入新的页面,并更新存储器中的PTE。
- 缺页处理程序返回到原来的进程,再次执行导致缺页的指令。CPU将引起缺页的虚拟地址重新发送给MMU,因为虚拟页面现在缓存在物理存储器中,所以就会命中。
每次CPU产生一个虚拟地址,MMU就必须查阅一个PTE,以便将虚拟地址翻译为物理地址。在最糟糕的情况下,这又会要求从存储器取一次数据,代价是几十到几百个周期。如果PTE碰巧缓存在L1中,那么开销就下降到1个或2个周期。然后,许多系统都试图消除这样的开销,它们在MMU中包括了一个关于PTE的小的缓存,称为翻译后备缓冲器(Translation Lookaside Buffer,TLB)。
TLB是一个小的、虚拟寻址的缓存,其中每一行都保存着一个由单个PTE组成的块。TLB通常有高度的相连性。当TLB命中时,所有的地址翻译步骤都是在芯片上的MMU中执行的,因此非常快。
动态存储器分配
虽然可以使用低级的mmap和munmap函数来创建和删除虚拟存储器的区域,但是C程序员还是觉得当运行是需要额外虚拟存储器时,用动态存储器分配器(dynamic memory allocator)更方便,也有更好的可移植性。
堆动态存储器分配器维护着一个进程的虚拟存储器区域,称为堆(heap)。它紧接在未初始化的.bss区域后开始,并向上生长(向更高的地址)。对于每个进程,内核维护着一个变量brk(读作break),它指向堆的顶部。
分配器将堆视为一组不同大小的块(block)的集合来维护。每个块就是一个连续的虚拟存储器片(chunk),要么是已分配的,要么是空闲的。已分配的块显示地保留为供应用程序使用。空闲块可用来分配。空闲块保持空闲,直到它显示地被应用所分配。一个已分配的块保持已分配状态,直到它被释放,这种释放要么是应用程序显示执行的,要么是存储器分配器自身隐式执行的。
分配器有两种基本风格,两种风格都要求应用显示地分配块。他们的不同之处在于由哪个实体来负责释放已分配的块:
显示分配器(explicit allocator),要求应用显示地释放任何已分配的块。C程序通过调用malloc函数来分配一个块,并通过调用free函数来释放一个块。
隐式分配器(implicit allocator),要求分配器检测一个已分配块何时不再被程序所使用,那么就释放这个块。隐式分配器也叫做垃圾收集器(garbage collector),而自动释放未使用的已分配的块的过程叫做垃圾收集(garbage collection)。
网友评论