美文网首页程序员netty
Netty内存模型-PoolArena

Netty内存模型-PoolArena

作者: 薛定谔的猫Plus | 来源:发表于2018-09-27 20:10 被阅读9次

1 原理

应用层的内存分配最终是委托给PoolArena实现。先看下PoolArena的内部数据结构:

image

poolArena提供了两种方式进行内存分配:

  • PoolSubpage用于分配小于8k的内存;

tinySubpagePools:用于分配小于512字节的内存,默认长度为32,因为内存分配最小为16,每次增加16,直到512,区间[16,512)一共有32个不同值;

smallSubpagePools:用于分配大于等于512字节的内存,默认长度为4;

tinySubpagePools和smallSubpagePools中的元素都是默认subpage。

  • poolChunkList用于分配大于8k的内存;

qInit:存储内存利用率0-25%的chunk

q000:存储内存利用率1-50%的chunk

q025:存储内存利用率25-75%的chunk

q050:存储内存利用率50-100%的chunk

q075:存储内存利用率75-100%的chunk

q100:存储内存利用率100%的chunk

各chunkList连接如下:

image

按照内存的使用率来取名的,如qInit代表一个chunk最开始分配后会进入它,随着其使用率增大会逐渐从q000到q100,而随着内存释放,使用率减小,它又会慢慢的从q100到q00,最终这个chunk上的所有内存释放后,整个chunk被回收。

接下来看下PoolArena如何进行内存分配,如下。

image
  • 如果是分配小内存,则尝试从tinySubpagePools或smallSubpagePools中分配内存,如果没有合适subpage,则采用方法allocateNormal分配内存。

  • 如果分配一个page以上的内存,直接采用方法allocateNormal分配内存。

默认都是先尝试从poolThreadCache中分配内存,PoolThreadCache利用ThreadLocal的特性,消除了多线程竞争,提高内存分配效率;首次分配时,poolThreadCache中并没有可用内存进行分配,当上一次分配的内存使用完并释放时,会将其加入到poolThreadCache中,提供该线程下次申请时使用。

内存池内存分配流程:

1、ByteBufAllocator 准备申请一块内存;

2、尝试从PoolThreadCache中获取可用内存,如果成功则完成此次分配,否则继续往下走,注意后面的内存分配都会加锁;

3、如果是小块(可配置该值)内存分配,则尝试从PoolArena中缓存的PoolSubpage中获取内存,如果成功则完成此次分配;

4、如果是普通大小的内存分配,则从PoolChunkList中查找可用PoolChunk并进行内存分配,如果没有可用的PoolChunk则创建一个并加入到PoolChunkList中,完成此次内存分配;

5、如果是大块(大于一个chunk的大小)内存分配,则直接分配内存而不用内存池的方式;

6、内存使用完成后进行释放,释放的时候首先判断是否和分配的时候是同一个线程,如果是则尝试将其放入PoolThreadCache,这块内存将会在下一次同一个线程申请内存时使用,即前面的步骤2;

7、如果不是同一个线程,则回收至chunk中,此时chunk中的内存使用率会发生变化,可能导致该chunk在不同的PoolChunkList中移动,或者整个chunk回收(chunk在q000上,且其分配的所有内存被释放);同时如果释放的是小块内存(与步骤3中描述的内存相同),会尝试将小块内存前置到PoolArena中,这里操作成功了,步骤3的操作中才可能成功。

allocateNormal实现如下:

image

第一次进行内存分配时,chunkList没有chunk可以分配内存,需通过方法newChunk新建一个chunk进行内存分配,并添加到qInit列表中。如果分配如512字节的小内存,除了创建chunk,还有创建subpage,PoolSubpage在初始化之后,会添加到smallSubpagePools中,其实并不是直接插入到数组,而是添加到head的next节点。下次再有分配512字节的需求时,直接从smallSubpagePools获取对应的subpage进行分配。

  • 这里为什么不是从较低的q000开始呢,我们知道一个chunk随着内存的不停释放,它本身会不停的往其所在的chunk list的prev list移动,直到其完全释放后被回收。 如果这里是从q000开始尝试分配,虽然分配的速度可能更快了(因为分配成功的几率更大),但一个chunk在使用率为25%以内时有更大几率再分配,也就是一个chunk被回收的几率大大降低了。这样就带来了一个问题,我们的应用在实际运行过程中会存在一个访问高峰期,这个时候内存的占用量会是平时的几倍,因此会多分配几倍的chunk出来,而等高峰期过去以后,由于chunk被回收的几率降低,内存回收的进度就会很慢(因为没被完全释放,所以无法回收),内存就存在很大的浪费。

  • 为什么是从q050开始尝试分配呢,q050是内存占用50%~100%的chunk,能够提高整个应用的内存使用率,因为这样大部分情况下会使用q050的内存,这样在内存使用不是很多的情况下一些利用率低(<50%)的chunk慢慢就会淘汰出去,最终被回收。

  • 为什么不是从qinit中开始呢,这里的chunk利用率低,但又不会被回收,会形成浪费

  • q075,q100由于使用率高,分配成功的几率也会更小,因此放到最后。如果整个list中都无法分配,则新建一个chunk,并将其加入到qinit中。

Refereneces

  1. https://www.jianshu.com/p/4856bd30dd56

  2. https://blog.csdn.net/youaremoon/article/details/50042373

相关文章

网友评论

    本文标题:Netty内存模型-PoolArena

    本文链接:https://www.haomeiwen.com/subject/mrjyoftx.html