六、类原理之cache

作者: Mlqq | 来源:发表于2021-04-07 11:45 被阅读0次

我们先来回顾一下objc_class的几个主要的结构，如图：

image.png

主要是有4个变量：ISA、superclass、cache、bits，其中isa和bits已经分两篇介绍过了，superclass这个比较简单我们就不介绍了，这篇就介绍一下cache。

1、cache内存结构

cache的内存结构在之前讲cache的大小的时候已经介绍过一次，这里再展示一下：

image.png

1、_bucketsAndMaybeMask是uintptr_t类型
2、联合体：结构体里面有3个成员变量：mask_t类型的_maybeMask，_flags和_occupied都是uint16_t类型的，他们的作用在后面会介绍

结构体cache_t提供了一个获取buckets的方法，返回的是结构体bucket_t的指针：

image.png

再来看看bucket_t的源码：

image.png

成员变量是两个:_imp和_sel，有一个获取sel的方法sel()以及获取imp的方法（图中未展示，读者可以参考源码）

2、获取`cache`

有了获取bits的基础，获取cache就简单多了，获取bits时，我们是从类的起始地址平移32位，从objc_class的结构可以看到，获取cache时只需平移16位就可以了，如图：

image.png

我们调一个方法之后，再来获取一次看看有没有什么变化：

image.png

这个_occupied发生了变化，那么他是不是有我们调用的cacheTest这个方法导致的呢？
调一下buckets()方法取到里面的内容：

image.png

这样我们就取到了buckets存的sel,那么怎么获取imp呢，上面已经提过bucket_t提供了获取imp的方法：

image.png

按着这个方式我们可以获取到cacheTest的imp：

image.png

3、cache_t底层原理

上面只是缓存了一个方法，如果条用多个方法会不会都缓存呢？我们先在MlqqObject添加一个方法如下：

image.png

然后再main函数里面按顺序调用：

image.png

我们每调用一个方法打印一下_occupied的值，看看会不会一直增加：
调1个方法_occupied的值为1：

image.png

调2个方法_occupied的值为2：

image.png

调3个方法_occupied的值又为1：

image.png

调4个方法_occupied的值又为2：

image.png

调5个方法_occupied的值为3：

image.png

调6个方法_occupied的值为4：

image.png

调7个方法_occupied的值为5：

image.png

调8个方法_occupied的值又为1：

image.png

从上面结果可以看到并不是调一个方法，_occupied就增加1，为什么会这样呢？

3.1 cache大小

我们通过源码来分析一下，全局搜索_occupied：

image.png

找到了改变其值的方法incrementOccupied()，再找调incrementOccupied()的地方：

image.png

来分析主要代码块，看看苹果是怎么处理的：

mask_t newOccupied = occupied() + 1;
unsigned oldCapacity = capacity(), capacity = oldCapacity;

定义一个新的变量的newOccupied存储当前即将暂存的数量，变量oldCapacity，capacity存当前可以存储容量。

if (slowpath(isConstantEmptyCache())) {
        // Cache is read-only. Replace it.
        if (!capacity) capacity = INIT_CACHE_SIZE;
        reallocate(oldCapacity, capacity, /* freeOld */false);
    }

当cache为空的时候，会走到这个分支来，主要是初始化cache，调方法reallocate开辟空间，当capacity为0时，开辟默认为INIT_CACHE_SIZE大小的空间，INIT_CACHE_SIZE可以查到为4，也就是说当大小为0时，默认开辟容量为4的空间。这里注意一下reallocate开辟空间函数的第三个参数传的是false，从注释上也可以看到是不会释放旧的值。

 else if (fastpath(newOccupied + CACHE_END_MARKER <= cache_fill_ratio(capacity))) {
        // Cache is less than 3/4 or 7/8 full. Use it as-is.
}
<!--__arm__  ||  __x86_64__  ||  __i386__-->
static inline mask_t cache_fill_ratio(mask_t capacity) {
    return capacity * 3 / 4;
}

这个if分支从注释中可以看到当newOccupied小于总容量的3/4不处理，这里用的是<=，是因为加了一个CACHE_END_MARKER的宏定义，该宏定义在模拟器下为1，真机为0，可以参考源码。

#if CACHE_ALLOW_FULL_UTILIZATION
    else if (capacity <= FULL_UTILIZATION_CACHE_SIZE && newOccupied + CACHE_END_MARKER <= capacity) {//capacity <= 8
        // Allow 100% cache utilization for small buckets. Use it as-is.
    }
#endif

这个分支不会走，因为CACHE_ALLOW_FULL_UTILIZATION这个宏定义，在客户端没有定义，可以参考源码看一下。

else {
        capacity = capacity ? capacity * 2 : INIT_CACHE_SIZE;
        if (capacity > MAX_CACHE_SIZE) {
            capacity = MAX_CACHE_SIZE;
        }
        reallocate(oldCapacity, capacity, true);
    }

当容量大于总容量的3/4时，就会扩容，扩容到之前的2倍，最大值为MAX_CACHE_SIZE，为1<<16=65536,再调用reallocate方法开辟空间时，第三个参数传的值就是true了，这时就会清除旧值了。

看一下reallocate这个容函数做了什么。

image.png

这里面要介绍一下setBucketsAndMask这个方法，他有两个参数第一个是newBuckets，第二个就是mask：

image.png

存储的方法：

    _bucketsAndMaybeMask.store(((uintptr_t)newMask << maskShift) | (uintptr_t)newBuckets, memory_order_relaxed);

((uintptr_t)newMask << maskShift) | (uintptr_t)newBuckets的意思是将newmask向左移动maskShift位，maskShift可以从cache_t的定位中查到为48，然后再或newBuckets，结果就是将mask放在_bucketsAndMaybeMask的高16位，buckets放在低48位。

3.2 cache存储

处理完空间问题，再来看看怎么存的

bucket_t *b = buckets();
mask_t m = capacity - 1;
mask_t begin = cache_hash(sel, m);
mask_t i = begin;

获取到当前buckets指针b，根据capacit计算出mask值m，根据mask和sel计算出脚标begin。

do {
        if (fastpath(b[i].sel() == 0)) {
            incrementOccupied();
            b[i].set<Atomic, Encoded>(b, sel, imp, cls());
            return;
        }
        if (b[i].sel() == sel) {
            // The entry was added to the cache by some other thread
            // before we grabbed the cacheUpdateLock.
            return;
        }
    } while (fastpath((i = cache_next(i, m)) != begin));

这里是一个do-while循环，为什么要一个循环呢，因为上面采用cache_hash计算出来的脚标不同的sel又可能是相同的，所以要循环遍历一下。在循环体里面第一个if判断b[i].sel() == 0，说明该位置没有值，就会使_occupied+1,并且把sel保存在当前位置。第二个if，如果当前位置有值并且是要缓存的sel时就不处理了，直接return了。

经过上面的介绍，我们根据我们看到的现象来分析一下是不是这样的，是mac下运行的故CACHE_END_MARKER为1：

当调1个方法时，第一次初始化cache大小capacity为4，capacity * 3/4 = 3，这时newOccupied为1，满足（1+CACHE_END_MARKER = 2） <= 3，不会扩容；
当调2个方法时，capacity * 3/4 = 3，这时newOccupied为2，满足（newOccupied+CACHE_END_MARKER = 3） <= 3，不会扩容；
当调3个方法时，capacity * 3/4 = 3，这时newOccupied为3，不满足（newOccupied+CACHE_END_MARKER = 4） <= 3，会扩容，清除旧的值再保存第三个方法，_occupied变为1。
当调4个方法时，capacity 已经扩容为8了，capacity * 3/4 = 6，这时newOccupied为2，因为已经存了第3个方法，满足（newOccupied+CACHE_END_MARKER = 3） <= 6，不会扩容；
当调5个方法时，capacity 为8，capacity * 3/4 = 6，这时newOccupied为3，满足（newOccupied+CACHE_END_MARKER = 4） <= 6，不会扩容；
当调6个方法时，capacity 为8，capacity * 3/4 = 6，这时newOccupied为4，满足（newOccupied+CACHE_END_MARKER = 5） <= 6，不会扩容；
当调7个方法时，capacity 为8，capacity * 3/4 = 6，这时newOccupied为5，满足（newOccupied+CACHE_END_MARKER = 6） <= 6，不会扩容；
当调8个方法时，capacity 为8，capacity * 3/4 = 6，这时newOccupied为6，不满足（newOccupied+CACHE_END_MARKER = 7） <= 6，需要扩容；扩容结果capacity变为16，capacity * 3/4 = 12，清除旧值再存第8个方法，_occupied变为1。

到这里cache的底层原理就介绍完了，这里只是缓存，那么什么时候取呢，请看下一篇：消息流程之快速查找。

六、类原理之cache

1、cache内存结构

2、获取`cache`

3、cache_t底层原理

3.1 cache大小

3.2 cache存储

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

六、类原理之cache

1、cache内存结构

2、获取cache

3、cache_t底层原理

3.1 cache大小

3.2 cache存储

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

2、获取`cache`