美文网首页
Memcached底层的一些认识

Memcached底层的一些认识

作者: Dafanzi | 来源:发表于2017-01-08 14:06 被阅读0次

    memcached指南file:///C:/Users/Administrator/Desktop/简历/memcached-笔记资料/memcached权威指南.pdf

    底层认识在p351页

    Memcached如何支持高并发

    Memcached使用多路复用I/O模型(epoll,select等,具体为memcached采用的是libevent库,该库在linux下就是用的epoll)。传统阻塞I/O中,系统可能会因为某个用户连接还没做好I/O准备而一直等待,直到这个连接做好I/O准备(这时如果这时有其他用户连接到服务器,很可能因为系统阻塞而得不到响应)。多路复用I/O模型,阻塞不发生在具体执行I/O的,而是epoll或select上,当某个链接准备好IO时,epoll就返回这个连接的信息,进而去执行相应连接的IO,这样大大提升了CPU效率。此外memcached使用了多线程模式,在开启memcahed服务器时可以通过 -t指定线程数(线程数不是越多越好,一般指定为cpu核数就好了)。

    使用Slab分配算法保存数据

    该算法在slabs.c源文件中, 我们观察的这个函数slab_init(),具体就是初始化这个Memcached的内存的结构的。最后生成了一个数组,其中每个元素为slabclass_t这个结构体。该结构体就描述了具体每个slab class的信息(哪些块被使用了啊,每个chunk大小为多少等)。每个slab class的维持的内存总共都是1048576个字节(1M)。每个数组的chunk都是靠着一个增长因子成倍增长变化的的。最后一个slab class的大小每个chunk就是1M(跳出while循环,再设置组后一个slab class的chunk带大小的)。

    有趣的事,知道为什么每个memcached实例为什么分配那么多个slab class吗?源码中本来最多可以分201个slab class的,但是分配的那个while循环,一个条件是<201,另一个是每个slab class的size要小于一个POWER_BLOCK(这个常量就是规定的每个slab class的总大小)的一半。因此我们可以每次启动的时候看到屏幕上的消息,明白为什么是分配那么多个(通常倒数第二个的大小块接近1M的一半)。

    我们都知道惰性删除和未过期数据被踢现象。那么这些现象又是怎么实现的呢?

    删除过期item

    惰性删除是因为item的删除机制放在item的访问的函数中(do_item_get_notedeleted)的,通过比较item的过期时间和当前时间,前者小的话,就删除这个item。因此item到期后不是立马从内存中删除,而是访问这个item时如果到期了,才把item从内存中删除。

    使用LRU淘汰算法

    大多数关于memcached都说,当memcached使用的内存数大于设置的最大内存数时,比如20kb的slabclass都已经使用完了chunk,这时新来的数据还要再插入20kb的slabclass,会启动LRU算法试着淘汰最近最少使用的数据,给新数据腾位置。

    有趣的事是我知道什么情况下,LRU腾位置失败,以及memcached的LRU的实现。Memcached的LRU实现显然不能完全满足操作系统原理课介绍的那般准确。它就是先从你需要插入的slab class的数据项列表从后往前遍历(因为memcached会把刚刚访问过的item放到item列表头部),寻找一个没有被引用(其引用计数器为0,[这item被引用的总数])的,找到的话,就把这数据项所占内存腾出来。如果没找到的话,就去找一个3个小时没有访问过的item(其上次访问的时间+3个小时的秒数小于现在的时间),满足就释放其内存,腾出来给新的元素用。如果上面两个步骤都没有找到的话,就宣布这个新item不能插入因为申请内存失败。

    Memcached多线程模型

    Memcahed是一个多线程的缓存服务器程序。在Memcached内部,线程分为:主线程(接受客户端链接,并把连接分配给工作线程处理);工作线程(处理客户端连接的请求)

    具体行为是主线程主要侦听客户端的连接drive_machine(),有客户端连接到memcached时,memcached会调用accept函数接受到来的连接, 当主线程接收到客户端连接后,便通过dispatch_conn_new函数把客户端连接注册到libevent进行侦听(放到多路复用中。这里采用的是libevent库,而libevent库在linux下用的是epoll模型,并指定以后处理该连接的读写请求的工作线程),然后libevent会侦听到客户端的读写请求,有请求来了就把任务push到某个工作线程的CQ队列中,并向那个工作线程发送一个信号,以调用相应的工作线程执行函数 thread_libevent_process。

    相关文章

      网友评论

          本文标题:Memcached底层的一些认识

          本文链接:https://www.haomeiwen.com/subject/mqbqbttx.html