前言
我们知道objc_class中有ISA、superclass、cache_t、class_data_bits_t、class_rw_t等变量,我们今天主要来研究下cache_t,看看这个结构体里面存储的是什么东西。
探索
我们现创建一个类LGPerson,.h中实现如下:

.m中实现如下:

main函数实现如下:

探索方式1-lldb验证
在我们没有加载方法的时候lldb指令打印的如下:


我们发现在没有加载任何方法的时候,bucket_t里面是没有任何sel和imp的,sel是我们的方法编号,imp是个函数指针,里面有我们方法的具体实现。
当我们调用方法后,我们调试如下:



我们发现我们直接 p $4.imp()时没有出来方法的imp,而且我们的sayCode方法并没有打印出来,这是为什么呢,我们打开objc源码,发现bucket_t中部分源码如下:


我们发现在调用imp()方法时,我们需要传入一个类,cache_t这个结构体中的部分源码如下:


我们发现buckets是一个指针数组,那我们打印这个数组应该就可以打印出我们想要的sayCode方法,lldb指令如下:



通过指针地址 +1的方式或者打印buckets这个数组中的元素也可以得到我们想要的结果,顺便再说下cache_t中的部分宏定义:
CACHE_MASK_STORAGE_OUTLINED:表示macOS或者模拟器;
CACHE_MASK_STORAGE_HIGH_16:表示64位真机;
CACHE_MASK_STORAGE_LOW_4:表示非64位真机
探索方式2-脱离源码
我们创建一个LGPerson类,里面声明几个实例方法,然后在main函数中调用,main函数中实现如下:
#import <Foundation/Foundation.h>
#import "LGPerson.h"
#import <objc/runtime.h>
typedef uint32_tmask_t; // x86_64 & arm64 asm are less efficient with 16-bits
structlg_bucket_t {
SEL_sel;
IMP_imp;
};
structlg_cache_t {
structlg_bucket_t* _buckets;
mask_t_mask;
uint16_t_flags;
uint16_t_occupied;
};
structlg_class_data_bits_t {
uintptr_tbits;
};
structlg_objc_class {
ClassISA;
Classsuperclass;
struct lg_cache_tcache; // formerly cache pointer and vtable
struct lg_class_data_bits_tbits; // class_rw_t * plus custom rr/alloc flags
};
intmain(intargc,constchar* argv[]) {
@autoreleasepool {
LGPerson*p = [LGPersonalloc];
ClasspClass = [LGPersonclass]; // objc_clas
[psay1];
[psay2];
// [p say3];
// [p say4];
// _occupied _mask 是什么 cup - 1
// 会变化 2-3 -> 2-7
// bucket 会有丢失 重新申请
// 顺序有点问题 哈希
// cache_t 底层原理
// 线索 :
structlg_objc_class*lg_pClass = (__bridgestructlg_objc_class*)(pClass);
NSLog(@"%hu - %u",lg_pClass->cache._occupied,lg_pClass->cache._mask);
for(mask_ti =0; icache._mask; i++) {
// 打印获取的 bucket
structlg_bucket_tbucket = lg_pClass->cache._buckets[i];
NSLog(@"%@ - %p",NSStringFromSelector(bucket._sel),bucket._imp);
}
NSLog(@"Hello, World!");
}
return0;
}
加上ISA属性后,增加两个方法的调用,其正确的打印结果应该是这样的:

在增加两个方法的调用,即解开say3、say4的注释,其打印结果如下

接下来我们需要探索_mask是什么吗?_occupied 是什么?
cache_t中有个函数incrementOccupied,然后我们发现它在cache_t::insert方法中调用部分源码如下:




insert方法,理解为cache_t的插入,而cache中存储的就是sel-imp,所以cache的原理从insert方法开始分析,以下是cache原理分析的流程图:

insert方法分析



根据occupied的值计算出当前的缓存占用量,当属性未赋值及无方法调用时,此时的occupied()为0,而newOccupied为1,如下所示
mask_t newOccupied=occupied()+1;
关于缓存占用量的计算,有以下几点说明:
alloc申请空间时,此时的对象已经创建,如果再调用init方法,occupied也会+1
当有属性赋值时,会隐式调用set方法,occupied也会增加,即有几个属性赋值,occupied就会在原有的基础上加几个
当有方法调用时,occupied也会增加,即有几次调用,occupied就会在原有的基础上加几个
如果是第一次创建,则默认开辟4个

如果缓存占用量小于等于3/4,则不作任何处理

如果缓存占用量超过3/4,则需要进行两倍扩容以及重新开辟空间

根据cache_hash方法,即哈希算法,计算sel-imp存储的哈希下标,分为以下三种情况:
如果哈希下标的位置未存储sel,即该下标位置获取sel等于0,此时将sel-imp存储进去,并将occupied占用大小加1
如果当前哈希下标存储的sel等于即将插入的sel,则直接返回
如果当前哈希下标存储的sel不等于即将插入的sel,则重新经过cache_next方法 即哈希冲突算法,重新进行哈希计算,得到新的下标,再去对比进行存储
总结
_mask是指掩码数据,用于在哈希算法或者哈希冲突算法中计算哈希下标,其中mask 等于capacity - 1
_occupied表示哈希表中sel-imp的占用大小(即可以理解为分配的内存中已经存储了sel-imp的的个数),init会导致occupied变化
属性赋值,也会隐式调用,导致occupied变化
方法调用,导致occupied变化
在cache初始化时,分配的空间是4个,随着方法调用的增多,当存储的sel-imp个数,即newOccupied + CACHE_END_MARKER(等于1)的和 超过 总容量的3/4,例如有4个时,当occupied等于2时,就需要对cache的内存进行两倍扩容
网友评论