1.引言
android基于Linux的kernel层,在处理性能优化的时候,往往都会涉及到linux的内存管理的知识,认识和熟悉linux内核管理,将有助于我们分析android的棘手的bug
2.正题
本章主要想讲几个知识点:
- 虚拟内存 、分页、分段
- 虚拟内存到物理内存
- android 进程的组成
- mmap 机制
- VSS/RSS/PSS/USS
- zswap 技术
2.1 虚拟内存
虚拟内存是计算机系统内存管理的一种技术。它使得应用程序认为它拥有连续的可用的内存(一个连续完整的地址空间),而实际上,它通常是被分隔成多个物理内存碎片,还有部分暂时存储在外部磁盘存储器上,在需要时进行数据交换。目前,大多数操作系统都使用了虚拟内存,如Windows家族的“虚拟内存”;Linux的“交换空间”等。
虚拟内存是一套技术机制,是一种抽象的概念,是一套流程:
这个机制的流程是:
-
将磁盘作为内存的拓展,例如从磁盘中划分4GB的大小
-
当运行内存不足的时候,操作系统会按照一定的算法,把优先级较低的数据块存放在磁盘上
-
后续假设程序需要磁盘中的数据块的时候,系统将产生“缺页”指令,然后把数据交换回内存
这些操作是操作系统自动完成,对上层完全透明。原本只能跑一个程序的内存,突然足以支撑8个,凭空多出来了7个程序的内存。故称为 “虚拟内存” 。虚拟内存是一种技术机制,不是“ 从磁盘中划分4GB的大小”
- 逻辑地址
逻辑地址是:程序编译之后的地址。这个地址是虚拟的。当程序加载到内存中的时候,这些虚拟地址会根据一些规则转化成“实际的物理地址”。故而 逻辑地址又称为“相对地址”。
逻辑地址由下面俩部分组成:
段选择子
段内偏移
- 段选择子(segment selector)
用于描述逻辑地址所处于的段,由2个字节构成
-
RPL:请求特权级别
-
TI:
TI=0查GDT表
TI=1查LDT表(Windows没有使用) -
INDEX: 处理器将索引值乘以8再加上GDT表的基址,就是要加载的段描述符
-
段内偏移(Offset)
通过段选择子,我们知道了此地址属于那一段,但是具体是哪个怎么知道呢? 就是根据段内偏移得到具体地址:
逻辑地址=段的起始地址+ 段内偏移
-
线性地址
线性地址是:逻辑地址通过分段机制转化而来的。假如没得分页机制,逻辑地址就会直接转换成物理地址。
那么为什么需要分页机制?
有时可用内存被分成许多小块,其中没有一块足够大以满足下一个内存需求,然而他们的总和却可以。这个问题被称为碎片(Fragmentation),许多内存分配策略都会受其影响。
分页是一种内存管理技术,它允许进程的物理内存不连续。它通过在称为页面(Page)的相同大小的块中分配内存来消除碎片问题,是目前比较优秀的内存管理技术。
通常每页数据为4kb,为了加快虚拟地址转物理地址。物理内存也会将内存分成一个又一个的页,且每页也会4kb。这我们称之为“页框”
分页机制的好处
- 优化内存,提高使用效率
- 加快虚拟地址转化成物理地址
下图是线性地址的构成:
image.png线性地址转物理地址的过程:页号+页内偏移
image.png逻辑地址通过段表 得到 线性地址。 线性地址可以通过 页表得到实际的物理地址。
2.2 android中进程的内存
以32位操作系统为例,可用的虚拟内存大小为4G。经典的示例图如下:
用户区3G的虚拟内存包含:数据段,堆,栈,代码段,以及mmp 映射内存
内核态为高地址区,总共是1G的大小。存放着整个内核的代码和所有的内核模块以及内核所维护的数据
内核区 是所有内存共享的
2.3 mmap机制
在学习binder的时候,mmap函数是会被频繁谈起的。为什么mmap机制能让binder 只复制一次。linux中mmap是怎么理解的呢?
什么是mmap技术
mmap是一种内存映射文件的方法,即将一个文件或者其它对象映射到进程的地址空间,实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系,函数原型如下
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);
实现这样的映射关系后,进程就可以采用指针的方式读写操作这一段内存,而系统会自动回写脏页面到对应的文件磁盘上,即完成了对文件的操作而不必再调用read,write等系统调用函数。如下图所示
image.png传统的read/write操作等需要俩次拷贝,第一次拷贝到内核,第二次拷贝到文件中。为什么需要拷贝到内核呢?按道理直接在用户区拷贝到文件中岂不是更加高效?原因是隔离多进程的影响。试想下,假如允许在用户区进行拷贝到文件,那么多任务是不是会存在相互访问/破坏 文件的风险?需要对文件的拷贝做限制,于是需要放在内核层。但是用户层和内核层又不是一个区,彼此的变量等等不共享,所以需要进行一次拷贝。
mmap之所以只需要一次拷贝,原因是mmap将内存映射到进程中
2.3 systrace中常见的几个内存名词
-
VSS:Virtual Set Size,虚拟耗用内存。它是一个进程能访问的所有内存空间地址的大小。这个大小包含了一些没有驻留在RAM中的内存,就像mallocs已经被分配,但还没有写入。VSS很少用来测量程序的实际使用内存。
-
RSS:Resident Set Size,实际使用物理内存。RSS是一个进程在RAM中实际持有的内存大小。RSS可能会产生误导,因为它包含了所有该进程使用的共享库所占用的内存,一个被加载到内存中的共享库可能有很多进程会使用它。RSS不是单个进程使用内存量的精确表示。
-
PSS:Proportional Set Size,实际使用的物理内存,它与RSS不同,它会按比例分配共享库所占用的内存。例如,如果有三个进程共享一个占30页内存控件的共享库,每个进程在计算PSS的时候,只会计算10页。PSS是一个非常有用的数值,如果系统中所有的进程的PSS相加,所得和即为系统占用内存的总和。当一个进程被杀死后,它所占用的共享库内存将会被其他仍然使用该共享库的进程所分担。在这种方式下,PSS也会带来误导,因为当一个进程被杀后,PSS并不代表系统回收的内存大小。
-
USS:Unique Set Size,进程独自占用的物理内存。这部分内存完全是该进程独享的。USS是一个非常有用的数值,因为它表明了运行一个特定进程所需的真正内存成本。当一个进程被杀死,USS就是所有系统回收的内存。USS是用来检查进程中是否有内存泄露的最好选择
大小顺序:VSS >= RSS >= PSS >= USS。 之所以介绍这个四个名词,尤其是PSS/USS 可能对我们在处理oom上有所帮助
2.4 zswap技术
由前面的知识,我们可以知道。当您的Linux计算机内存不足时,操作系统会将一些低级的数据块从内存中移到磁盘上。当需要的时候再从磁盘上恢复。
这个机制需解决一个问题:磁盘读写速度和内存的读写速度之间的差距。举一个例子:能容纳100张图片的照相机,此时此刻已经有了80张,还得拍50张。相当于多出来了30张照片。假如一张照片100M。30张相当于3G。靠磁盘的读写速度,可能会慢的很。
这时候科学家们,想到可以在内存中开辟一块单独的内存区,这块内存区的作用,就是压缩准备写入到磁盘的数据块。压缩的比率是3:1,且压缩速度非常快。即3G 可以压缩成1G,相当于只需要传输1G数据即可。
这样就可以帮助快速将数据块交换出去,提高内存利用
网友评论