通过Netty之Helloworld一文,我们简单的对Netty进行了入门,本文说一下Netty的数据容器ByteBuf。
数据在网络中是以字节的形式进行传输的,JDK的NIO提供了ByteBuffer作为它的字节容器,然而它使用起来比较繁琐,例如每次读写都需要进行flip等操作,一不小心就会出现错误,Netty对其进行了包装使用ByteBuf作为其数据容器(底层使用的依旧是ByteBuffer)。
与ByteBuffer相比的两个优点
与JDK的ByteBuffer相比,ByteBuf主要有以下俩个优点
1.采用读写指针,省去flip等操作。
先来看下JDK中的ByteBuffer类,它只有一个位置指针用于处理读写操作
图源自并发编程网其中capacity代表着最大容量,position与limit在读写模式下有着不同的含义。当写数据到buffer时,position会移动到下一个可写的位置,limit表示最多可以往buffer中写入多少数据(写模式下等同于capacity)。当读时,将position重置为为0,positon代表下一个可读的位置,limit代表最多可以读取到多少数据 。当由写切换到读时,limit会被设置成写模式下的position。
flip方法的作用就是从写模式切换到读模式,将position设为0,limit设为写模式下的position。
再来看Netty的ByteBuf
在抽象类AbstractByteBuf中有以上几个实例变量,可见ByteBuf通过read与write指针来协助读写操作。
bytebuf组成(图源自Netty实战)0-readerIndex是已经被读过的字节数,调用discardReadBytes可以释放这部分空间。readerIndex到writeIndex之间的数据是可以读取的,writeIndex到capacity是可以写入的。每次读写的时候操作相应的读写指针,避免了ByteBuffer的flip模式切换。
2.可自动扩容
在ByteBuffer中,如果在写入的时候剩余容量不足,则会出现越界异常,ByteBuf对其进行了优化,类似于HashMap的扩容机制。
abstractbytebuf中的writebytes方法每次写入的时候会调用ensureWritable方法进行容量检查,最终会调用到ensureWritable0方法
判断如果写入的字节数大于最大容量-可写字节数,则发生越界异常,maxCapacity则用于限制ByteBuf的最大内存大小,能够有效控制内存容量。接下来看扩容方法
扩容方法 接上图首先判断写入的大小是否大于门限值4MB,若大于则采用步增threshold的方式增大newCapacity大小。如果未超过门限值,设初值为64,然后若还小于写入大小则进行容量的倍增。总结一下,先倍增然后步增,原理类似于TCP的慢启动与拥塞避免(参考关于TCP协议的总结)。
ByteBuf的分类
从内存分配角度来看,ByteBuf可以分为两类:分配在堆内存的HeapByteBuf与分配在直接内存的DirectByteBuf,前者可以提供快速的分配与释放,但是在IO读写时要额外进行一次内存复制,而后者分配与释放的代价较昂贵,但是可以实现零拷贝(快速将数据从文件系统移动到网络接口,而不需要将其从内核空间复制到用户空间)。一般来说用于IO线程的读写缓冲区使用DirectByteBuf较好(Netty即是),其他则使用HeapByteBuf。
从内存回收角度来看,ByteBuf也可分为两类:池化PooledByteBuf与普通UnpooledByteBuf,关于池相信不用多说,连接池、线程池相信大家已经很熟了。而且对于池化的bytebuf,Netty使用了引用计数(类似于JVM的引用计数,虽然JVM并不是使用用引用计数法判断对象是否可以被回收)来降低内存分配的开销
以上ByteBuf缓冲区的获取可以通过PooledByteBufAllocator与UnpooledByteBufAllocator来获取,或者使用工具类Unpooled来方便的获取未池化的Buffer对象
ByteBuf的操作
读操作:readXxx()等,表示从buf中读取相应的字节数。readBytes(xx),表示将当前buf中的数据读取到目标中。
写操作:writeXxx()等,表示将参数写入到当前buf中。writeBytes(xx),表示将目标中的数据写入到当前buf中。
查找操作:indexOf等,从当前buf中查找相应的value。
置位操作:discard,clear等,主要用于操作ByteBuf内部的读写指针。
两个辅助类
ByteBufHolder:从名字看可以看出,他是持有Bytebuf的容器,在类似HTTP消息的场景下,消息不仅携带消息体,还携带消息头,我们就可以实现自己的ByteBufHolder,Netty中相关HTTP的源码中很多类都实现了这个接口。
CompositeByteBuf:Netty实战中称其为复合缓冲区,它提供了一个将多个缓冲区表示为一个统一缓冲区的能力。
最后
此致,敬礼。
参考:Netty实战,Netty权威指南
网友评论