美文网首页iOS 底层原理 iOS 进阶之路
OC底层原理十一: cache_t分析

OC底层原理十一: cache_t分析

作者: markhetao | 来源:发表于2020-09-17 21:51 被阅读0次

    OC底层原理 学习大纲

    学习是一件循序渐进的事情步子大了扯到蛋🥚

    我们回顾下之前学习的内容。 将所学知识进行串联,做一个小结

    话说几万年前,世界就是一个封闭的鸡蛋,没有光明黑暗,也毫无生机

    冥冥中大家都有种预感大事将近

    盘古开天辟地(4S横空出世),激活世间万物

    (--- 此处省略1万字 ---)

    我记得爷爷爷爷爷爷曾经跟我说过,世界上第一个生物的诞生
    .
    .
    .

    对咯。 我们就是从对象的创建开始说起。

    image.png

    这个通关游戏,咱们继续。 类的基础结构我们都了解了,但是cache。我们上次只偷瞄了一眼。计算了它占用空间大小。

    • 如此重要的缓存机制,怎么能冷落ta。今天,咱们撸ta!

    cache_t 分析

      1. 结构分析
      1. 探究缓存机制
      1. 快捷查找
      1. cache原理分析

    1. 结构分析

    打开objc4源码,搜索struct objc_class

    image.png

    进入cache_t:

    • 暂时剔除``constvoidstatic函数
    struct cache_t {
    #if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_OUTLINED
        explicit_atomic<struct bucket_t *> _buckets;
        explicit_atomic<mask_t> _mask;
    #elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
        explicit_atomic<uintptr_t> _maskAndBuckets;
        mask_t _mask_unused;
    #elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
        explicit_atomic<uintptr_t> _maskAndBuckets;
        mask_t _mask_unused;
    #else
    #error Unknown cache mask storage type.
    #endif
        
    #if __LP64__
        uint16_t _flags;
    #endif
        uint16_t _occupied;
    };
    
    • 我们先弄清楚判断条件的几个是什么意思

    CACHE_MASK_STORAGE: 当前是使用mac调试,所以会进入

    • macos系统:i386模拟器x86, 苹果真机: arm64
    // 是真机且是64位系统 
    #if defined(__arm64__) && __LP64__              
    #define CACHE_MASK_STORAGE CACHE_MASK_STORAGE_HIGH_16
    // 是真机但不是64位系统
    #elif defined(__arm64__) && !__LP64__ 
    #define CACHE_MASK_STORAGE CACHE_MASK_STORAGE_LOW_4
    // 其他
    #else                                 
    #define CACHE_MASK_STORAGE CACHE_MASK_STORAGE_OUTLINED
    #endif
    

    现在我以电脑端为平台来进行探究。简化cache_t代码:

    struct cache_t {
        explicit_atomic<struct bucket_t *> _buckets;
        explicit_atomic<mask_t> _mask;
        uint16_t _flags;
        uint16_t _occupied;
    };
    

    清爽~ 舒服~

    如果是真机,cache_t分支是:

    struct cache_t {
       explicit_atomic<uintptr_t> _maskAndBuckets;
       mask_t _mask_unused; // 猜测是系统暂时没用到的参数。😂  占坑
       
       // mask掩码移动位数
       static constexpr uintptr_t maskShift = 48;
       
       // 掩码清零4位
      static constexpr uintptr_t maskZeroBits = 4;
       
       // 可以存储的最大mask掩码值(2^16 - 1)
       static constexpr uintptr_t maxMask = ((uintptr_t)1 << (64 - maskShift)) - 1;
       
       // 用于从`_maskAndBuckets`中找回`buckets`的指针位置
       //  (1 << (48 - 4)) - 1  buckets最大位数只有43位
       static constexpr uintptr_t bucketsMask = ((uintptr_t)1 << (maskShift - maskZeroBits)) - 1;
       
       // 没有足够的空间来存放buckets了
       static_assert(bucketsMask >= MACH_VM_MAX_ADDRESS, "Bucket field doesn't have enough bits for arbitrary pointers.");
      
       uint16_t _flags;
       uint16_t _occupied;
    }
    
    • 我们可以看到_buckets_mask被合并成了 _maskAndBuckets,并加设了一些静态mask掩码
    • 你是否还记得isa中也有掩码,我们利用isaunion联合体结构,在更小空间内高效记录更多信息。利用mask掩码isa中取出shiftcls部分。获取到的信息。
    • 这里同样是苹果官方的优化手段,利用掩码位运算,在有限空间内存储更多信息,使用位运算高效读取
    • 回到mac环境。

    • 我们进入explicit_atomic,会发现返回的类型就是传入的泛型T。 它的作用是将操作环境设定为原子操作防止同一时间多端处理同一数据,保障数据的准确性

    如果在测试环境,不要求原子操作,上述代码等同于

    struct cache_t {
       bucket_t *  _buckets;
       mask_t _mask;
       uint16_t _flags;
       uint16_t _occupied;
    };
    

    现在我们一个个来分析:

    • _buckets: 存储bucket_t的数组。其中bucket_t是包含SELIMP结构体

      image.png

      我们可以看到这有公开的selimp读取方法

    • _mask: 重要的掩码,下面分析cache机制会介绍

    • _flags: 标记

    • _occupied: 占用位置个数

    2.探究缓存机制

    我们了解了cache_t内部结构,现在我们来探索cache缓存机制

    • objc4源码的main.m中添加测试代码
    @interface HTPerson : NSObject
    
    @property (nonatomic, copy) NSString *name;
    @property (nonatomic, strong) NSString *nickName;
    
    - (void)sayHello;
    
    - (void)sayCode;
    
    - (void)sayMaster;
    
    - (void)sayNB;
    
    + (void)sayHappy;
    
    @end
    
    @implementation HTPerson
    
    - (void)sayHello{
        NSLog(@"%s",__func__);
    }
    
    - (void)sayCode{
        NSLog(@" %s",__func__);
    }
    
    - (void)sayDevelop{
        NSLog(@"%s",__func__);
    }
    
    - (void)sayMaster{
        NSLog(@"%s",__func__);
    }
    
    - (void)sayNB{
        NSLog(@"%s",__func__);
    }
    
    + (void)sayHappy{
        NSLog(@"%s",__func__);
    }
    @end
    
    int main(int argc, const char * argv[]) {
        @autoreleasepool {
    
            HTPerson *p  = [HTPerson alloc];
            Class pClass = [HTPerson class]; // 记录类,便于后面使用
            //p.name     = @"mark";
            //p.nickName   = @"哈哈";
    
            [p sayHello];
            [p sayCode];
            //[p sayDevelop];
            //[p sayMaster];
            //[p sayNB];
            NSLog(@"%@",pClass);
        }
        return 0;
    }
    

    [p sayHello]一行加入断点,运行函数。

    • 找到HTPersoncache的内存地址:
    image.png

    执行代码,到达[p sayCode]一行。再次打印cache_t内容:

    image.png

    发现执行了一遍sayHello方法后,imp有值了。_occupied占用位置也由0变成了1

    - 我们如何打印处selimp内容呢?

    image.png
    • 我们查找cache_t的函数,发现有公开获取buckets的方法。
    image.png
    • _buckets是一个数组。上图实际上是读取到了数组第一个元素

    • 我们上面知道在bucket_t结构中,有公开的sel()imp(class)方法供外部获取selclass。 所以可以读取:

    image.png

    我们看到sayHello存储在cache中了。

    • 我们继续执行一行代码,运行[p sayCode],打印buckets数组。
    image.png

    - 我们只拿到数组地址,如何读取数组所有元素呢?

    方法一:既然拿到了数组首地址,而数组的元素类型都是一致的,我们可以通过内存偏移读取元素。

    image.png

    方法二:既然是数组,就可以直接使用数组下标进行读取。

    image.png
    • cache内存中成功读取到2个函数
      image.png

    如果我们将测试代码注释都放开, 逐行执行和打印buckets数组,会发现一些奇怪的现象

    • 1. occupiedmask 在变化,是什么在影响它们?mask又是
    • 2. cache中的buckets数组打印的值会有丢失
    • 3. buckets数组的顺序执行顺序不相同
    image.png image.png

    在分析这个原因之前。

    • 我们发现每次lldbp查找很麻烦。所以先介绍个快捷查找的方式

    3. 快捷查找

    • 我们打印buckets相关信息,每次都得进入objc源码工程,很麻烦!
    • 有没有一种任何项目都可以直接查询的方法呢?

    有,请接好:

    • 每次进入objc4源码,其实我们只用到了业务线上的实现结构
    • 既然如此,我们直接从源码中把需要的拷出来,做成{ }代码块工具(点此了解代码块),随时可用,岂不爽歪歪

    老规矩,授人以渔 + 授人以鱼

    授人以渔(思维方式):
    • 确定自己想要的东西,再开始拷贝。简化无用代码。保存完整内存结构即可。
      例如:
    • 我现在研究cache的结构。所以把cache_t结构从objc4拷贝出来。
    • 剔除无用代码(不影响cache_t空间结构的代码)
    • 将原子操作explicit_atomic直接换成直接类型(因为不是完整运行,只仿照代码来获取想要的内容)
    • 需要bucket_t结构,所以我们仿写一个ht_bucket_t,并简化类型。
    • 如何到达cache? 所以我们需要仿写一个objc_class类。然后发现缺少class_data_bits_t类,所有也仿写一个ht_class_data_bits_t
    • 我们知道,所有OC类都是以底层objc_class为模板创建的,所以我们可以直接将任何类强转为ht_objc_class。 在进行结构读取。
    授人以鱼:
    struct ht_bucket_t {
        SEL _sel;
        IMP _imp;
    };
    
    struct ht_cache_t {
        struct ht_bucket_t * _buckets;  // 将bucket_t 改成自己的 ht_bucket_t
        uint32_t  _mask; // 直接使用内部 uint32_t 格式
        uint16_t _flags;
        uint16_t _occupied;
    };
    
    struct ht_class_data_bits_t {
        uintptr_t bits;
    };
    
    // 原继承自objc_object。
    // 我们只需要研究cache,所以直接取objc_object内部的Class ISA
    // 保证数据结构一致,可以类型强转就行。
    struct ht_objc_class {
        Class ISA;
        Class superclass;
        struct ht_cache_t cache;
        struct ht_class_data_bits_t bits; // 将 class_data_bits_t 改成 ht_class_data_bits_t
    };
    
    使用方式:

    参考上面测试代码,加入我们自己的代码

    int main(int argc, const char * argv[]) {
        @autoreleasepool {
    
            HTPerson *p  = [HTPerson alloc];
            Class pClass = [HTPerson class];
            p.name     = @"mark";
            p.nickName   = @"哈哈";
    
            [p sayHello];
            [p sayCode];
            [p sayMaster];
            [p sayNB];
            
            // 将类强转为我们自己的类
            struct ht_objc_class * ht_class = (__bridge struct ht_objc_class *)(pClass);
            
            // struct 类型要用 -> 读取。
            NSLog(@"_occupied: %hu, _mask:%u",ht_class->cache._occupied, ht_class->cache._mask);
            
            // 我们读取mask中每一个值
            for (uint32_t i = 0; i < ht_class->cache._mask; i ++) {
                // 取出每个bucket
                struct ht_bucket_t bucket = ht_class->cache._buckets[i];
                // 打印sel 和 imp
                NSLog(@"第%u个:  sel:%@  imp:%p ", i, NSStringFromSelector(bucket._sel), bucket._imp);
            }
        }
        return 0;
    }
    

    打印结果如下:

    image.png

    自定义类型调用函数代码,都可以写成代码块(点此了解{ }代码块工具),便于后续使用。

    刘德华说的 学到了,就要教出去 😃 ( 感谢KC )

    4. cache原理分析

    走到这,你能感受到_occupied_mask的意思吗?

    • _mask: 总空间大小
    • _occupied: 当前占用的空间大小

    我们发现buckets中只存储函数。 我们细想一下:

    • 属性不影响缓存,只负责存储函数才是影响缓存大小的。增删改查都是函数实现

    回到上面问题: _mask_occupied 是如何变化的?

    • 查看cache_t结构,发现public处,有incrementOccupied函数和setBucketsAndMask函数。

      image.png
    • 进入incrementOccupied发现只是执行了_occupied++

    • 进入setBucketsAndMask发现每次都是重新设置_buckets_mask,并且把_occupied设置为0

      image.png

    有意思的是,我们发现苹果留了个其他情况他也不知道怎么处理😂

    • 还记得前面_mask_unused字段吗? 我们猜测是系统暂时没用到的字段。

    我们发现incrementOccupied是执行计数加一操作,那我们搜索incrementOccupied去看看哪里调用了它。

    • 发现只有cache_t::insert使用到了它。只有一个地方调用。那我们一行一行分析它:
    void cache_t::insert(Class cls, SEL sel, IMP imp, id receiver)
    {
    #if CONFIG_USE_CACHE_LOCK
        cacheUpdateLock.assertLocked();
    #else
        runtimeLock.assertLocked();
    #endif
    
        ASSERT(sel != 0 && cls->isInitialized());
    
        // 原occupied计数+1
        mask_t newOccupied = occupied() + 1;
    
        // 进入查看: return mask() ? mask()+1 : 0;
        // 就是当前mask有值就+1,否则设置初始值0
        unsigned oldCapacity = capacity(), capacity = oldCapacity;
        
        // 当前缓存是否为空
        if (slowpath(isConstantEmptyCache())) {
            
            // Cache is read-only. Replace it.
            // 如果为空,就给空间设置初始值4
            // (进入INIT_CACHE_SIZE查看,可以发现就是1<<2,就是二进制100,十进制为4)
            if (!capacity) capacity = INIT_CACHE_SIZE;
            
            // 创建新空间(第三个入参为false,表示不需要释放旧空间)
            reallocate(oldCapacity, capacity, /* freeOld */false);
        
        }
        
        // CACHE_END_MARKER 就是 1
        // 如果当前计数+1 < 空间的 3/4。 就不用处理
        // 表示空间够用。 不需要空间扩容
        else if (fastpath(newOccupied + CACHE_END_MARKER <= capacity / 4 * 3)) {
            // Cache is less than 3/4 full. Use it as-is.
        }
        
        // 如果计数大于3/4, 就需要进行扩容操作
        else {
            // 如果空间存在,就2倍扩容。 如果不存在,就设为初始值4
            capacity = capacity ? capacity * 2 : INIT_CACHE_SIZE;
            
            // 防止超出最大空间值(2^16 - 1)
            if (capacity > MAX_CACHE_SIZE) {
                capacity = MAX_CACHE_SIZE;
            }
            
            // 创建新空间(第三个入参为true,表示需要释放旧空间)
            reallocate(oldCapacity, capacity, true);
        }
    
        // 读取现在的buckets数组
        bucket_t *b = buckets();
        
        // 新的mask值(当前空间最大存储大小)
        mask_t m = capacity - 1;
        
        // 使用hash计算当前函数的位置(内部就是sel & m, 就是取余操作,保障begin值在m当前可用空间内)
        mask_t begin = cache_hash(sel, m);
        mask_t i = begin;
    
        do {
            // 如果当前位置为空(空间位置没被占用)
            if (fastpath(b[i].sel() == 0)) {
                // Occupied计数+1
                incrementOccupied();
                // 将sle和imp与cls关联起来并写入内存中
                b[i].set<Atomic, Encoded>(sel, imp, cls);
                return;
            }
            
            // 如果当前位置有值(位置被占用)
            if (b[i].sel() == sel) {
                // The entry was added to the cache by some other thread
                // before we grabbed the cacheUpdateLock.
                // 直接返回
                return;
            }
            // 如果位置有值,再次使用哈希算法找下一个空位置去写入
            // 需要注意的是,cache_next内部有分支: 
            // 如果是arm64真机环境: 从最大空间位置开始,依次-1往回找空位
            // 如果是arm旧版真机、x86_64电脑、i386模拟器: 从当前位置开始,依次+1往后找空位。不能超过最大空间。
            // 因为当前空间是没超出mask最大空间的,所以一定有空位置可以放置的。
        } while (fastpath((i = cache_next(i, m)) != begin));
    
        // 各种错误处理
        cache_t::bad_cache(receiver, (SEL)sel, cls);
    }
    

    reallocate : 上面创建新空间释放旧空间的函数

    void cache_t::reallocate(mask_t oldCapacity, mask_t newCapacity, bool freeOld)
    {
        // 读取旧buckets数组
        bucket_t *oldBuckets = buckets();
        // 创建新空间大小的buckets数组
        bucket_t *newBuckets = allocateBuckets(newCapacity);
    
        // Cache's old contents are not propagated. 
        // This is thought to save cache memory at the cost of extra cache fills.
        // fixme re-measure this
    
        // 新空间必须大于0
        ASSERT(newCapacity > 0);
        
        // 新空间-1 转为mask_t类型,再与新空间-1 进行判断
        ASSERT((uintptr_t)(mask_t)(newCapacity-1) == newCapacity-1);
    
        // 设置新的bucktes数组和mask
        // 【重点】我们发现mask就是newCapacity - 1, 表示当前最大可存储空间
        setBucketsAndMask(newBuckets, newCapacity - 1);
        
        // 释放旧内存空间
        if (freeOld) {
            cache_collect_free(oldBuckets, oldCapacity);
        }
    }
    

    allocateBuckets: 创建新空间大小buckets数组

    bucket_t *allocateBuckets(mask_t newCapacity)
    {
        // 创建1个bucket
        bucket_t *newBuckets = (bucket_t *)
            calloc(cache_t::bytesForCapacity(newCapacity), 1);
        // 将创建的bucket放到当前空间的最尾部,标记数组的结束
        bucket_t *end = cache_t::endMarker(newBuckets, newCapacity);
    
    #if __arm__
        // End marker's sel is 1 and imp points BEFORE the first bucket.
        // This saves an instruction in objc_msgSend.
        end->set<NotAtomic, Raw>((SEL)(uintptr_t)1, (IMP)(newBuckets - 1), nil);
    #else
        // 将结束标记为sel为1,imp为这个buckets
        end->set<NotAtomic, Raw>((SEL)(uintptr_t)1, (IMP)newBuckets, nil);
    #endif
        
        // 只是打印记录
        if (PrintCaches) recordNewCache(newCapacity);
        
        // 返回这个bucket
        return newBuckets;
    }
    

    cache_collect_free:释放内存空间

    static void cache_collect_free(bucket_t *data, mask_t capacity)
    {
    #if CONFIG_USE_CACHE_LOCK
        cacheUpdateLock.assertLocked();
    #else
        runtimeLock.assertLocked();
    #endif
    
        if (PrintCaches) recordDeadCache(capacity);
        
        // 垃圾房: 开辟空间 (如果首次,就开辟初始空间,如果不是,就空间*2进行拓展)
        _garbage_make_room ();
        // 将当前扩容后的capacity加入垃圾房的尺寸中,便于后续释放。
        garbage_byte_size += cache_t::bytesForCapacity(capacity);
        // 将当前新数据data存放到 garbage_count 后面 这样可以释放前面的,而保留后面的新值
        garbage_refs[garbage_count++] = data;
        // 不记录之前的缓存 = 【清空之前的缓存】。
        cache_collect(false);
    }
    

    所有代码分析完毕画龙点睛👀的汇总流程图

    • cache分析流程
    cache分析流程
    • cache_t 结构
    cache_t结构
    • 写入(cache_t::insert)
    写入(cache_t::insert)
    • 读取【objc_msgSend】将在下一章节讲

    • 如果你看完上面的cache_t分析。我相信上面的3问题答案你应该已经有了

    1. occupied 和mask 在变化,是什么在影响它们?mask又是啥?

    • 函数写入cache缓存时,occupied加1mask记录当前cache最大可存储空间
    • inset缓存的操作,触发空间使用率超过3/4,空间2倍扩容时,mask记录新空间的最大可存储大小,因为旧空间被释放,之前cache的所有内容都被垃圾房清空了,所以occupied重置为0从新开始计数

    2. cache中的buckets数组打印的值会有丢失

    • 因为触发空间扩容时,旧空间被释放,所以cache中的旧值都被清空。 新值插入新cache空间。

    3. buckets数组的顺序与执行顺序不相同

    • 插入操作是使用的hash算法。插入位置是经过取余计算的。且如果插入位置已经有值,就会不停的后移1位,直到找到空位置完成插入位置。

    下一节 OC底层原理十二: objc_msgSend(汇编)

    相关文章

      网友评论

        本文标题:OC底层原理十一: cache_t分析

        本文链接:https://www.haomeiwen.com/subject/udvlyktx.html