美文网首页
六、类原理之cache

六、类原理之cache

作者: Mlqq | 来源:发表于2021-04-07 11:45 被阅读0次

    我们先来回顾一下objc_class的几个主要的结构,如图:


    image.png

    主要是有4个变量:ISAsuperclasscachebits,其中isabits已经分两篇介绍过了,superclass这个比较简单我们就不介绍了,这篇就介绍一下cache

    1、cache内存结构

    cache的内存结构在之前讲cache的大小的时候已经介绍过一次,这里再展示一下:

    image.png

    1、_bucketsAndMaybeMaskuintptr_t类型
    2、联合体:结构体里面有3个成员变量:mask_t类型的_maybeMask_flags_occupied都是uint16_t类型的,他们的作用在后面会介绍

    结构体cache_t提供了一个获取buckets的方法,返回的是结构体bucket_t的指针:

    image.png

    再来看看bucket_t的源码:

    image.png

    成员变量是两个:_imp_sel,有一个获取sel的方法sel()以及获取imp的方法(图中未展示,读者可以参考源码)

    2、获取cache

    有了获取bits的基础,获取cache就简单多了,获取bits时,我们是从类的起始地址平移32位,从objc_class的结构可以看到,获取cache时只需平移16位就可以了,如图:

    image.png

    我们调一个方法之后,再来获取一次看看有没有什么变化:

    image.png

    这个_occupied发生了变化,那么他是不是有我们调用的cacheTest这个方法导致的呢?
    调一下buckets()方法取到里面的内容:

    image.png

    这样我们就取到了buckets存的sel,那么怎么获取imp呢,上面已经提过bucket_t提供了获取imp的方法:

    image.png

    按着这个方式我们可以获取到cacheTestimp

    image.png

    3、cache_t底层原理

    上面只是缓存了一个方法,如果条用多个方法会不会都缓存呢?我们先在MlqqObject添加一个方法如下:

    image.png

    然后再main函数里面按顺序调用:

    image.png

    我们每调用一个方法打印一下_occupied的值,看看会不会一直增加:
    调1个方法_occupied的值为1

    image.png

    调2个方法_occupied的值为2

    image.png

    调3个方法_occupied的值又为1

    image.png

    调4个方法_occupied的值又为2

    image.png

    调5个方法_occupied的值为3

    image.png

    调6个方法_occupied的值为4

    image.png

    调7个方法_occupied的值为5

    image.png

    调8个方法_occupied的值又为1

    image.png

    从上面结果可以看到并不是调一个方法,_occupied就增加1,为什么会这样呢?

    3.1 cache大小

    我们通过源码来分析一下,全局搜索_occupied

    image.png

    找到了改变其值的方法incrementOccupied(),再找调incrementOccupied()的地方:

    image.png

    来分析主要代码块,看看苹果是怎么处理的:

    mask_t newOccupied = occupied() + 1;
    unsigned oldCapacity = capacity(), capacity = oldCapacity;
    

    定义一个新的变量的newOccupied存储当前即将暂存的数量,变量oldCapacitycapacity存当前可以存储容量。

    if (slowpath(isConstantEmptyCache())) {
            // Cache is read-only. Replace it.
            if (!capacity) capacity = INIT_CACHE_SIZE;
            reallocate(oldCapacity, capacity, /* freeOld */false);
        }
    

    cache为空的时候,会走到这个分支来,主要是初始化cache,调方法reallocate开辟空间,当capacity0时,开辟默认为INIT_CACHE_SIZE大小的空间,INIT_CACHE_SIZE可以查到为4,也就是说当大小为0时,默认开辟容量为4的空间。这里注意一下reallocate开辟空间函数的第三个参数传的是false,从注释上也可以看到是不会释放旧的值。

     else if (fastpath(newOccupied + CACHE_END_MARKER <= cache_fill_ratio(capacity))) {
            // Cache is less than 3/4 or 7/8 full. Use it as-is.
    }
    <!--__arm__  ||  __x86_64__  ||  __i386__-->
    static inline mask_t cache_fill_ratio(mask_t capacity) {
        return capacity * 3 / 4;
    }
    

    这个if分支从注释中可以看到当newOccupied小于总容量的3/4不处理,这里用的是<=,是因为加了一个CACHE_END_MARKER的宏定义,该宏定义在模拟器下为1,真机为0,可以参考源码。

    #if CACHE_ALLOW_FULL_UTILIZATION
        else if (capacity <= FULL_UTILIZATION_CACHE_SIZE && newOccupied + CACHE_END_MARKER <= capacity) {//capacity <= 8
            // Allow 100% cache utilization for small buckets. Use it as-is.
        }
    #endif
    

    这个分支不会走,因为CACHE_ALLOW_FULL_UTILIZATION这个宏定义,在客户端没有定义,可以参考源码看一下。

    else {
            capacity = capacity ? capacity * 2 : INIT_CACHE_SIZE;
            if (capacity > MAX_CACHE_SIZE) {
                capacity = MAX_CACHE_SIZE;
            }
            reallocate(oldCapacity, capacity, true);
        }
    

    当容量大于总容量的3/4时,就会扩容,扩容到之前的2倍,最大值为MAX_CACHE_SIZE,为1<<16=65536,再调用reallocate方法开辟空间时,第三个参数传的值就是true了,这时就会清除旧值了。

    看一下reallocate这个容函数做了什么。

    image.png

    这里面要介绍一下setBucketsAndMask这个方法,他有两个参数第一个是newBuckets,第二个就是mask

    image.png

    存储的方法:

        _bucketsAndMaybeMask.store(((uintptr_t)newMask << maskShift) | (uintptr_t)newBuckets, memory_order_relaxed);
    
    

    ((uintptr_t)newMask << maskShift) | (uintptr_t)newBuckets的意思是将newmask向左移动maskShift位,maskShift可以从cache_t的定位中查到为48,然后再或newBuckets,结果就是将mask放在_bucketsAndMaybeMask的高16位,buckets放在低48位。

    3.2 cache存储

    处理完空间问题,再来看看怎么存的

    bucket_t *b = buckets();
    mask_t m = capacity - 1;
    mask_t begin = cache_hash(sel, m);
    mask_t i = begin;
    

    获取到当前buckets指针b,根据capacit计算出maskm,根据masksel计算出脚标begin

    do {
            if (fastpath(b[i].sel() == 0)) {
                incrementOccupied();
                b[i].set<Atomic, Encoded>(b, sel, imp, cls());
                return;
            }
            if (b[i].sel() == sel) {
                // The entry was added to the cache by some other thread
                // before we grabbed the cacheUpdateLock.
                return;
            }
        } while (fastpath((i = cache_next(i, m)) != begin));
    

    这里是一个do-while循环,为什么要一个循环呢,因为上面采用cache_hash计算出来的脚标不同的sel又可能是相同的,所以要循环遍历一下。在循环体里面第一个if判断b[i].sel() == 0,说明该位置没有值,就会使_occupied+1,并且把sel保存在当前位置。第二个if,如果当前位置有值并且是要缓存的sel时就不处理了,直接return了。

    经过上面的介绍,我们根据我们看到的现象来分析一下是不是这样的,是mac下运行的故CACHE_END_MARKER1

    1. 当调1个方法时,第一次初始化cache大小capacity4capacity * 3/4 = 3, 这时newOccupied1,满足(1+CACHE_END_MARKER = 2) <= 3,不会扩容;
    2. 当调2个方法时,capacity * 3/4 = 3,这时newOccupied2,满足(newOccupied+CACHE_END_MARKER = 3) <= 3,不会扩容;
    3. 当调3个方法时,capacity * 3/4 = 3,这时newOccupied3,不满足(newOccupied+CACHE_END_MARKER = 4) <= 3,会扩容,清除旧的值再保存第三个方法,_occupied变为1
    4. 当调4个方法时,capacity 已经扩容为8了,capacity * 3/4 = 6,这时newOccupied2,因为已经存了第3个方法,满足(newOccupied+CACHE_END_MARKER = 3) <= 6,不会扩容;
    5. 当调5个方法时,capacity8capacity * 3/4 = 6,这时newOccupied3,满足(newOccupied+CACHE_END_MARKER = 4) <= 6,不会扩容;
    6. 当调6个方法时,capacity8capacity * 3/4 = 6,这时newOccupied4,满足(newOccupied+CACHE_END_MARKER = 5) <= 6,不会扩容;
    7. 当调7个方法时,capacity8capacity * 3/4 = 6,这时newOccupied5,满足(newOccupied+CACHE_END_MARKER = 6) <= 6,不会扩容;
    8. 当调8个方法时,capacity8capacity * 3/4 = 6,这时newOccupied6,不满足(newOccupied+CACHE_END_MARKER = 7) <= 6,需要扩容;扩容结果capacity变为16capacity * 3/4 = 12,清除旧值再存第8个方法,_occupied变为1

    到这里cache的底层原理就介绍完了,这里只是缓存,那么什么时候取呢,请看下一篇:消息流程之快速查找。

    相关文章

      网友评论

          本文标题:六、类原理之cache

          本文链接:https://www.haomeiwen.com/subject/nqaykltx.html