美文网首页
OC底层-cache_t探索

OC底层-cache_t探索

作者: 含笑州 | 来源:发表于2020-09-21 17:55 被阅读0次

    前言

    我们知道objc_class中有ISA、superclass、cache_t、class_data_bits_t、class_rw_t等变量,我们今天主要来研究下cache_t,看看这个结构体里面存储的是什么东西。

    探索

    我们现创建一个类LGPerson,.h中实现如下:

    .m中实现如下:

    main函数实现如下:

    探索方式1-lldb验证

    在我们没有加载方法的时候lldb指令打印的如下:

    我们发现在没有加载任何方法的时候,bucket_t里面是没有任何sel和imp的,sel是我们的方法编号,imp是个函数指针,里面有我们方法的具体实现。

    当我们调用方法后,我们调试如下:

    我们发现我们直接 p $4.imp()时没有出来方法的imp,而且我们的sayCode方法并没有打印出来,这是为什么呢,我们打开objc源码,发现bucket_t中部分源码如下:

    我们发现在调用imp()方法时,我们需要传入一个类,cache_t这个结构体中的部分源码如下:

    我们发现buckets是一个指针数组,那我们打印这个数组应该就可以打印出我们想要的sayCode方法,lldb指令如下:

    通过指针地址 +1的方式或者打印buckets这个数组中的元素也可以得到我们想要的结果,顺便再说下cache_t中的部分宏定义:

    CACHE_MASK_STORAGE_OUTLINED:表示macOS或者模拟器;

    CACHE_MASK_STORAGE_HIGH_16:表示64位真机;

    CACHE_MASK_STORAGE_LOW_4:表示非64位真机

    探索方式2-脱离源码

    我们创建一个LGPerson类,里面声明几个实例方法,然后在main函数中调用,main函数中实现如下:

    #import <Foundation/Foundation.h>

    #import "LGPerson.h"

    #import <objc/runtime.h>

    typedef uint32_tmask_t;  // x86_64 & arm64 asm are less efficient with 16-bits

    structlg_bucket_t {

        SEL_sel;

        IMP_imp;

    };

    structlg_cache_t {

        structlg_bucket_t* _buckets;

        mask_t_mask;

        uint16_t_flags;

        uint16_t_occupied;

    };

    structlg_class_data_bits_t {

        uintptr_tbits;

    };

    structlg_objc_class {

        ClassISA;

        Classsuperclass;

        struct lg_cache_tcache;            // formerly cache pointer and vtable

        struct lg_class_data_bits_tbits;    // class_rw_t * plus custom rr/alloc flags

    };

    intmain(intargc,constchar* argv[]) {

        @autoreleasepool {

            LGPerson*p  = [LGPersonalloc];

            ClasspClass = [LGPersonclass];  // objc_clas

            [psay1];

            [psay2];

    //        [p say3];

    //        [p say4];

            // _occupied  _mask 是什么  cup - 1

            // 会变化 2-3 -> 2-7

            // bucket 会有丢失  重新申请

            // 顺序有点问题  哈希

            // cache_t 底层原理

            // 线索 :

            structlg_objc_class*lg_pClass = (__bridgestructlg_objc_class*)(pClass);

            NSLog(@"%hu - %u",lg_pClass->cache._occupied,lg_pClass->cache._mask);

            for(mask_ti =0; icache._mask; i++) {

                // 打印获取的 bucket

                structlg_bucket_tbucket = lg_pClass->cache._buckets[i];

                NSLog(@"%@ - %p",NSStringFromSelector(bucket._sel),bucket._imp);

            }

            NSLog(@"Hello, World!");

        }

        return0;

    }

    加上ISA属性后,增加两个方法的调用,其正确的打印结果应该是这样的:

    在增加两个方法的调用,即解开say3、say4的注释,其打印结果如下

    接下来我们需要探索_mask是什么吗?_occupied 是什么?

    cache_t中有个函数incrementOccupied,然后我们发现它在cache_t::insert方法中调用部分源码如下:

    insert方法,理解为cache_t的插入,而cache中存储的就是sel-imp,所以cache的原理从insert方法开始分析,以下是cache原理分析的流程图:

    cache_t流程图

    insert方法分析

    根据occupied的值计算出当前的缓存占用量,当属性未赋值及无方法调用时,此时的occupied()为0,而newOccupied为1,如下所示

    mask_t newOccupied=occupied()+1;

    关于缓存占用量的计算,有以下几点说明:

    alloc申请空间时,此时的对象已经创建,如果再调用init方法,occupied也会+1

    当有属性赋值时,会隐式调用set方法,occupied也会增加,即有几个属性赋值,occupied就会在原有的基础上加几个

    当有方法调用时,occupied也会增加,即有几次调用,occupied就会在原有的基础上加几个

    如果是第一次创建,则默认开辟4个

    如果缓存占用量小于等于3/4,则不作任何处理

    如果缓存占用量超过3/4,则需要进行两倍扩容以及重新开辟空间

    根据cache_hash方法,即哈希算法,计算sel-imp存储的哈希下标,分为以下三种情况:

    如果哈希下标的位置未存储sel,即该下标位置获取sel等于0,此时将sel-imp存储进去,并将occupied占用大小加1

    如果当前哈希下标存储的sel等于即将插入的sel,则直接返回

    如果当前哈希下标存储的sel不等于即将插入的sel,则重新经过cache_next方法 即哈希冲突算法,重新进行哈希计算,得到新的下标,再去对比进行存储

    总结

    _mask是指掩码数据,用于在哈希算法或者哈希冲突算法中计算哈希下标,其中mask 等于capacity - 1

    _occupied表示哈希表中sel-imp的占用大小(即可以理解为分配的内存中已经存储了sel-imp的的个数),init会导致occupied变化

    属性赋值,也会隐式调用,导致occupied变化

    方法调用,导致occupied变化

    在cache初始化时,分配的空间是4个,随着方法调用的增多,当存储的sel-imp个数,即newOccupied + CACHE_END_MARKER(等于1)的和 超过 总容量的3/4,例如有4个时,当occupied等于2时,就需要对cache的内存进行两倍扩容

    相关文章

      网友评论

          本文标题:OC底层-cache_t探索

          本文链接:https://www.haomeiwen.com/subject/ouvvyktx.html