1 原理

应用层的内存分配最终是委托给PoolArena实现。先看下PoolArena的内部数据结构：

image

poolArena提供了两种方式进行内存分配：

PoolSubpage用于分配小于8k的内存；

tinySubpagePools：用于分配小于512字节的内存，默认长度为32，因为内存分配最小为16，每次增加16，直到512，区间[16，512)一共有32个不同值；

smallSubpagePools：用于分配大于等于512字节的内存，默认长度为4；

tinySubpagePools和smallSubpagePools中的元素都是默认subpage。

poolChunkList用于分配大于8k的内存；

qInit：存储内存利用率0-25%的chunk

q000：存储内存利用率1-50%的chunk

q025：存储内存利用率25-75%的chunk

q050：存储内存利用率50-100%的chunk

q075：存储内存利用率75-100%的chunk

q100：存储内存利用率100%的chunk

各chunkList连接如下：

image

按照内存的使用率来取名的，如qInit代表一个chunk最开始分配后会进入它，随着其使用率增大会逐渐从q000到q100，而随着内存释放，使用率减小，它又会慢慢的从q100到q00,最终这个chunk上的所有内存释放后，整个chunk被回收。

接下来看下PoolArena如何进行内存分配，如下。

image

如果是分配小内存，则尝试从tinySubpagePools或smallSubpagePools中分配内存，如果没有合适subpage，则采用方法allocateNormal分配内存。
如果分配一个page以上的内存，直接采用方法allocateNormal分配内存。

默认都是先尝试从poolThreadCache中分配内存，PoolThreadCache利用ThreadLocal的特性，消除了多线程竞争，提高内存分配效率；首次分配时，poolThreadCache中并没有可用内存进行分配，当上一次分配的内存使用完并释放时，会将其加入到poolThreadCache中，提供该线程下次申请时使用。

内存池内存分配流程：

1、ByteBufAllocator 准备申请一块内存；

2、尝试从PoolThreadCache中获取可用内存，如果成功则完成此次分配，否则继续往下走，注意后面的内存分配都会加锁；

3、如果是小块（可配置该值）内存分配，则尝试从PoolArena中缓存的PoolSubpage中获取内存，如果成功则完成此次分配；

4、如果是普通大小的内存分配，则从PoolChunkList中查找可用PoolChunk并进行内存分配，如果没有可用的PoolChunk则创建一个并加入到PoolChunkList中，完成此次内存分配；

5、如果是大块（大于一个chunk的大小）内存分配，则直接分配内存而不用内存池的方式；

6、内存使用完成后进行释放，释放的时候首先判断是否和分配的时候是同一个线程，如果是则尝试将其放入PoolThreadCache，这块内存将会在下一次同一个线程申请内存时使用，即前面的步骤2；

7、如果不是同一个线程，则回收至chunk中，此时chunk中的内存使用率会发生变化，可能导致该chunk在不同的PoolChunkList中移动，或者整个chunk回收（chunk在q000上，且其分配的所有内存被释放）；同时如果释放的是小块内存（与步骤3中描述的内存相同），会尝试将小块内存前置到PoolArena中，这里操作成功了，步骤3的操作中才可能成功。

allocateNormal实现如下：

image

第一次进行内存分配时，chunkList没有chunk可以分配内存，需通过方法newChunk新建一个chunk进行内存分配，并添加到qInit列表中。如果分配如512字节的小内存，除了创建chunk，还有创建subpage，PoolSubpage在初始化之后，会添加到smallSubpagePools中，其实并不是直接插入到数组，而是添加到head的next节点。下次再有分配512字节的需求时，直接从smallSubpagePools获取对应的subpage进行分配。

这里为什么不是从较低的q000开始呢，我们知道一个chunk随着内存的不停释放，它本身会不停的往其所在的chunk list的prev list移动，直到其完全释放后被回收。如果这里是从q000开始尝试分配，虽然分配的速度可能更快了（因为分配成功的几率更大），但一个chunk在使用率为25%以内时有更大几率再分配，也就是一个chunk被回收的几率大大降低了。这样就带来了一个问题，我们的应用在实际运行过程中会存在一个访问高峰期，这个时候内存的占用量会是平时的几倍，因此会多分配几倍的chunk出来，而等高峰期过去以后，由于chunk被回收的几率降低，内存回收的进度就会很慢（因为没被完全释放，所以无法回收），内存就存在很大的浪费。
为什么是从q050开始尝试分配呢，q050是内存占用50%~100%的chunk，能够提高整个应用的内存使用率，因为这样大部分情况下会使用q050的内存，这样在内存使用不是很多的情况下一些利用率低(<50%)的chunk慢慢就会淘汰出去，最终被回收。
为什么不是从qinit中开始呢，这里的chunk利用率低，但又不会被回收，会形成浪费
q075,q100由于使用率高，分配成功的几率也会更小，因此放到最后。如果整个list中都无法分配，则新建一个chunk，并将其加入到qinit中。

Refereneces