美文网首页
1OS底层-对象本质&联合体&isa关联

1OS底层-对象本质&联合体&isa关联

作者: lkm_0bdc | 来源:发表于2020-09-11 19:14 被阅读0次

    之前一直讲述对象本质,它的底层又做了什么。

    在探索对象本质之前我们需要了解一下clang

    • Clang是一个C语言、C++、Objeactive-C语言的轻量级编译器,源代码发布于BSD协议下。
    • Clang 将支持其普通lambda表达式、返回类型的简化处理以及更好的处理constexpr关键字
    • Clang是一个由Applez主导编写,基于LLVM的C/C++/Objective-C编译器
    • 主要用于底层编译,将一些编译文件编译成.cpp文件,方便观察底层的一些结构和实现逻辑,方便理解底层

    Clang创建.cpp文件

    首先我们需要打开终端,cd main文件目录下的路径
    然后输入clang -rewrite-objc main.m -o main.cpp创建main.cpp文件。


    通过搜索LGPerson定位到到struct 结构体,通过name我们可以知道对象编译的底层就是结构体。

    mian.cpp文件中有多处都使用了NSObject_IVARS,其实它就是就是一个指针。

    mian.cpp文件文件中的_I_LGPerson_name是一个get方法,_I_LGPerson_setName是set方法

    set方法有一个objc_setProperty方法,所有set的方法都会调用,它类似一个工厂模式。

    objc4-781编译源码中搜索objc_setProperty方法

    跳转objc_setProperty源码中

    跳转reallySetProperty源码中,可以看到objc_setProperty方法的具体实现,对新值的return,对旧值的release

    每个属性的set方法,都做同样的事情(对新值的return,对旧值的release),因为每个属性对接下层 ,系统llvm会生成很多的临时变量,很难查找,所以所有的set方法,都会走objc_setProperty函数。

    我们可以根据cmd区分属性

    oc的对象就是结构体本质,继承于NSObject的isa ,同时我们分析到了非常重要且非常著名的objc的initinstanceIsa,在开始讲之前我们先扩展一个内容就是联合体位域

    首先对象内存的开辟来自于属性,LGCar类有四个属性,假如四个属性都是int类型,那么4*4 = 16字节16 * 8位 = 128位这四个只是简单的标识,128位实在是太浪费了,所以为了节省空间,我们不需要属性,而是通过set和get方法。set方法通过1字节 = 8位存储,在0000 1111中对应front,back,left,right属性(结构体的顺序是从前往后),如果是位运算进行处理就是char+位域

    @interface LGCar : NSObject
    @property (nonatomic, assign) BOOL front;
    @property (nonatomic, assign) BOOL back;
    @property (nonatomic, assign) BOOL left;
    @property (nonatomic, assign) BOOL right;
    - (void)setFront:(BOOL)isFront;  // 存储 : 1字节 = 8位 0000 1111  char + 位域  bit 结构体
    - (BOOL)isFront;
    
    - (void)setBack:(BOOL)isBack;
    - (BOOL)isBack;
    
    @end
    
    • 结构体(struct)中所有变量是共存的--优点是有容乃大全面;缺点是struct内存空间的分配是粗放的,不管用不用,全分配。
    • 联合体位域(union)中是各变量是互斥--缺点就是不够包容;但优点是内存使用更为精细灵活,也节省了内存空间

    结构体存在共存的关系,LGCar类的属性中,例如:向前就没有必要向后,同时为了更为精细灵活以及节省空间,我们就引入了联合体位域。

    isa的类型isa_t

    以下是isa指针类型的isa_t定义,从定义可以看出使用了联合体(union)

    union isa_t {
        isa_t() { }
        isa_t(uintptr_t value) : bits(value) { }
    
        Class cls;
        uintptr_t bits;
    #if defined(ISA_BITFIELD)
        struct {
            ISA_BITFIELD;  // defined in isa.h
        };
    

    isa_t类型使用联合体(union),是因为内存优化的考虑,这里的内存优化是char+位域的实现,通常说一个isa指针占用8字节,即64位,已经足够存储很多信息,极大的节省内存,提高性能。

    在isa中定义可以看出:

    • 提供了两个成员clsbits,根据联合体,它们是互斥的关系,也就意味着,当初始化isa指针,有两种初始化关系。

      • 通过cls初始化,bits无默认值
      • 通过bits初始化,cls有默认值
    • 提供一个结构体定义的位域,用于存储类信息和其他信息,结构体的成员是一个宏定义ISA_BITFIELD,有两个版本:

      • 移动端 __arm64__
      • mac OS __x86_64__
        位域宏定义--借用Style_月月

    NONPOINTER_ISA

    • nonpointer:表示是否对 isa 指针开启指针优化
      * 0:纯isa指针,
      * 1:不止是类对象地址,isa 中包含了类信息、对象的引用计数等
    • has_assoc:关联对象标志位
      • 0:没有关联对象
      • 1:存在关联对象
    • has_cxx_dtor:该对象是否有 C++ 或者 Objc 的析构器(类似delloc)
      • 如果有析构函数,则需要做析构逻辑
      • 如果没有,则可以更快的释放对象
    • shiftcls:存储类指针的值即类信息
      • arm64占33位,开启指针优化的情况下,在 arm64 架构中有 33 位用来存储类指针
      • x86_64占用44
    • magic:用于调试器判断当前对象是真的对象还是没有初始化的空间
    • weakly_referenced:志对象是否被指向或者曾经指向一个 ARC 的弱变量,
      没有弱引用的对象可以更快释放
    • deallocating:标志对象是否正在释放内存
    • has_sidetable_rc:当对象引用技术大于 10 时,则需要借用该变量存储进位
    • extra_rc:当表示该对象的引用计数值,实际上是引用计数值减 1, 例如,如果对象的引用计数为 10,那么extra_rc 为 9。如果引用计数大于 10, 则需要使用到下面的 has_sidetable_rc
      isa存储情况 --借用Style_月月图

    原理探索

    通过alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone方法路径,查找到initInstanceIsa,并进入其原理实现

    inline void 
    objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
    {
        ASSERT(!cls->instancesRequireRawIsa());
        ASSERT(hasCxxDtor == cls->hasCxxDtor());
    
        initIsa(cls, true, hasCxxDtor);
    }
    

    跳转进入initIsa源码中

    objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
    { 
        ASSERT(!isTaggedPointer()); 
        
        if (!nonpointer) {
            isa = isa_t((uintptr_t)cls);
        } else {
            ASSERT(!DisableNonpointerIsa);
            ASSERT(!cls->instancesRequireRawIsa());
    
            isa_t newisa(0);
    #if SUPPORT_INDEXED_ISA
            ASSERT(cls->classArrayIndex() > 0);
            newisa.bits = ISA_INDEX_MAGIC_VALUE;
            // isa.magic is part of ISA_MAGIC_VALUE
            // isa.nonpointer is part of ISA_MAGIC_VALUE
            newisa.has_cxx_dtor = hasCxxDtor;
            newisa.indexcls = (uintptr_t)cls->classArrayIndex();
    #else
            newisa.bits = ISA_MAGIC_VALUE;
            // isa.magic is part of ISA_MAGIC_VALUE
            // isa.nonpointer is part of ISA_MAGIC_VALUE
            newisa.has_cxx_dtor = hasCxxDtor;
            newisa.shiftcls = (uintptr_t)cls >> 3;
    #endif
            // This write must be performed in a single store in some cases
            // (for example when realizing a class because other threads
            // may simultaneously try to use the class).
            // fixme use atomics here to guarantee single-store and to
            // guarantee memory order w.r.t. the class index table
            // ...but not too atomic because we don't want to hurt instantiation
            isa = newisa;
        }
    }
    

    验证isa指针位域

    根据前文提及的0-64位域,可以在这里通过initIsa方法中证明有isa指针中有这些位域(目前是处于macOS,所以使用的是x86_64)

    • main中的LGPerson 断点 --> initInstanceIsa --> initIsa --> 走到else中的 isa初始化


    • 通过lldb,输入p newisa,打印isa信息

    • 断点进入newisa.bits,执行p newisa lldb命令的打印结果

    通过newsize的信息对比,发现isa指针中有一些变化,如下图所示


    isa 和bits数据比对.jpg

    其中magic的值是59,是由于isa指针地址转为二进制,从47位开始读取6位,再转为二进制

    magic的说明

    isa和类的关联

    cls 与 isa 关联原理就是isa指针中的shiftcls位域中存储了类信息,其中initInstanceIsa的过程是将 calloc 指针 和当前的 类cls 关联起来,有以下几种验证方式:

    • 【方式一】通过initIsa方法中的newisa.shiftcls = (uintptr_t)cls >> 3验证

    • 【方式二】通过isa指针地址与ISA_MSAK 的值 & 来验证

    • 【方式三】通过runtime的方法object_getClass验证

    • 【方式四】通过位运算验证

    方法一:通过initIsa方法

    • 运行至newisa.shiftcls = (uintptr_t)cls >> 3;代码段,shiftcls存储当前类的值信息

      • 查看cls,是LGPerson
      • shiftcls赋值的逻辑是将LGPerson进行编码后,右移3位
    • 执行lldb命令 p (uintptr_t)cls,得到的是(uintptr_t) $2 = 4294975720,有以下两种方式(二选一),对newisashiftcls进行赋值

      • p (uintptr_t)cls >> 3
      • 输入p (uintptr_t)cls 获得$3 = 4294975728 ,然后p $3>>3 获得
    • 继续执行程序到isa = newisa;部分,此时执行p newisa


    与bits赋值结果对比,有两处发生改变

    • cls由默认值,变成LGPerson,将isa与cls完美关联
    • shiftcls由0变成了536871965
      isa 和bits数据比对.jpg

    由此可以观察isa初始化到isa的shiftcls的赋值过程即值的改变过程,如图

    shiftcls赋值.png

    为什么在shiftcls赋值时需要类型强转?

    因为内存的存储不能存储字符串,机器码只能识别 0 、1这两种数字,所以需要将其转换为uintptr_t数据类型,这样shiftcls中存储的类信息才能被机器码理解, 其中uintptr_t是long

    为什么需要右移3位?

    主要是由于shiftcls处于isa指针地址的中间部分,前面还有3个位域,为了不影响前面的3个位域的数据,需要右移将其抹零。

    方式二:通过isa & ISA_MSAK
    继续执行,回到_class_createInstanceFromZone方法,此时cls 与 isa已经关联完成,执行po objc

    • 执行x/4gx obj,得到isa指针的地址0x001d8001000021fd
    • 将isa指针地址 & ISA_MASK (处于macOS,使用x86_64中的宏定义),即 po 0x001d8001000021fd & 0x00007ffffffffff8 ,得出LGPerson


    方式三:通过 object_getClass

    通过查看object_getClass的源码实现,同样可以验证isa与类关联的原理,有以下几步:
    main中导入#import <objc/runtime.h>
    通过runtime的api,即object_getClass函数获取类信息


    • 跳转进入object_getClass 底层实现


    • 跳转进入getIsa源码

    • 点击ISA()进入源码,可以看到如果是indexed类型,执行if流程,反之 执行的是else流程

    • 在else流程中,拿到isa的bits这个位,再 & ISA_MASK,这与方式二中的原理是一致的,获得当前的类信息

    • 从这里也可以得出 cls 与 isa 已经完美关联

    方式四:通过位运算

    • 回到_class_createInstanceFromZone方法。通过x/4gx obj 得到obj的存储信息,当前类的信息存储在isa指针中,且isa中的shiftcls此时占44位(因为处于macOS环境)
    • 想要读取中间的44位 类信息,就需要经过位运算 ,将右边3位,和左边除去44位以外的部分都抹零,其相对位置是不变的。其位运算过程如图所示,其中shiftcls即为需要读取的类信息
      将isa地址右移3位:p/x 0x001d8001000021fd >> 3 ,得到0x0003b0002000043f

    • 在将得到的0x0003b0002000043f``左移20位:p/x 0x0003b0002000043f << 20 ,得到0x0002000043f00000

    • 为什么是左移20位?因为先右移了3位,相当于向右偏移了3位,而左边需要抹零的位数有17位,所以一共需要移动20位
      将得到的0x0002000043f00000 再右移17位:p/x 0x0002000043f00000 >> 17 得到新的0x00000001000021f8

    • 获取cls的地址 与 上面的进行验证 :p/x cls 也得出0x00000001000021f8,所以由此可以证明 cls 与 isa 是关联的


    相关文章

      网友评论

          本文标题:1OS底层-对象本质&联合体&isa关联

          本文链接:https://www.haomeiwen.com/subject/rhmbektx.html