美文网首页
Objc源码之NSObject和isa

Objc源码之NSObject和isa

作者: 繁星mind | 来源:发表于2019-08-10 15:30 被阅读0次

    Objc源码之对象创建alloc和init
    Objc源码之initialize实现
    Objc源码之Load方法实现
    Objc源码之NSObject和isa
    Objc源码之引用计数实现
    objc源码之Method消息发送

    前言

       在OC中,大部分对象都继承自NSObject,NSObject包含了包含了很多基础方法和协议,用来给它的子类使用,同时子类对象的创建和调用,也和NSObject的息息相关,因此了解NSObject对象结构是十分重要的。

    一、NSObject对象结构

    首先我们看下NSObject结构,NSObject包含一个名为Class的isa变量

    @interface NSObject <NSObject> {
        Class isa  OBJC_ISA_AVAILABILITY;
    }
    

    而class是一个objc_class类型的结构体

    typedef struct objc_class *Class;
    

    下面我们就看下objc_class类型的结构体的实现:

    struct objc_class : objc_object {
        // Class ISA;
        Class superclass;
        cache_t cache;             // formerly cache pointer and vtable
        class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags
        ...
    };
    
    

    objc_class结构体,我们可以看出objc_class主要由superclass、cache、bits组成的。objc_class继承自objc_object

    objc_object结构如下:

    struct objc_object {
    private:
        isa_t isa;
    }
    

    isa_t结构如下:

    union isa_t {
        Class cls;
        uintptr_t bits;
    };
    

    下面我们就来看看这三者的具体结构和作用:

    1.superclass

    从名字就可以看出这是当前对象的父类

    2.cache结构
    struct cache_t {
        struct bucket_t *_buckets;
        mask_t _mask;
        mask_t _occupied;
        ...
    };
    

    从cache源码可以看出cache_t主要由_buckets、_mask、_occupied组成,其中_occupied和_mask都是mask_t类型的,_buckets是结构体bucket_t组成。

    2.1 _buckets 结构
    typedef uintptr_t cache_key_t;
    
    struct bucket_t {
    #if __arm64__
        MethodCacheIMP _imp;
        cache_key_t _key;
    #else
        cache_key_t _key;
        MethodCacheIMP _imp;
    #endif
    ...
    };
    

    我们可以看到_buckets中主要由_key_imp组成,这两个就是缓存中的key和具体方法实现,我们在调用方法的时候,为了优化效率会从缓存中读取方法,就是在这里进行的。

    2.2_mask和_occupied
    typedef uint32_t mask_t;
    

    mask:分配用来缓存bucket的总数。
    occupied:表明目前实际占用的缓存bucket的个数。

    总结:
    cache主要是用来存储方法缓存链表_buckets,和mask(分配用来缓存bucket的总数),还有当前实际占用的bucket个数。

    3.bits结构
    typedef unsigned long           uintptr_t;
    
    struct class_data_bits_t {
        // Values are the FAST_ flags above.
        uintptr_t bits;
        class_rw_t* data() {
            return (class_rw_t *)(bits & FAST_DATA_MASK);
        }
    }
    

    在 objc_class 结构体中的注释写到class_data_bits_t相当于class_rw_t指针加上 rr/alloc 的标志。
    bits中主要有两部分:
    1)一个long类型的bits标志位,这个标志位存储了很多flags、比如:快速分配内存标志、是否有析构函数、是否有构造函数、是否有自定义控件等。
    2)它为我们提供了便捷方法用于返回其中的 class_rw_t * 指针:

    class_rw_t* data() {
       return (class_rw_t *)(bits & FAST_DATA_MASK);
    }
    
    4.class_rw_t 和 class_ro_t

    类中的属性、方法、协议等都在class_rw_t的结构中,下面我们可以看下class_rw_t结构:

    struct class_rw_t {
        // Be warned that Symbolication knows the layout of this structure.
        uint32_t flags;
        uint32_t version;
    
        const class_ro_t *ro;
    
        method_array_t methods;
        property_array_t properties;
        protocol_array_t protocols;
    
        Class firstSubclass;
        Class nextSiblingClass;
    
        char *demangledName;
    
    #if SUPPORT_INDEXED_ISA
        uint32_t index;
    #endif
      ...
    }
    
    
    

    flags 存放一些标志,比如在16位存放是否自定义allocWithZone的标志,17位存放是否有析构函数、18位存放构造函数标志等

    ro 存放编译时期确定的OC属性、方法、协议

    methods 方法列表

    properties 属性列表

    protocols 协议列表

    下面看下class_ro_t结构,其主要编译器确定的存储方法,属性,实例变量、协议等:

    struct class_ro_t {
        uint32_t flags;
        uint32_t instanceStart;
        uint32_t instanceSize;
    #ifdef __LP64__
        uint32_t reserved;
    #endif
    
        const uint8_t * ivarLayout;
        
        const char * name;
        method_list_t * baseMethodList;
        protocol_list_t * baseProtocols;
        const ivar_list_t * ivars;
    
        const uint8_t * weakIvarLayout;
        property_list_t *baseProperties;
    
        method_list_t *baseMethods() const {
            return baseMethodList;
        }
    };
    

    在运行期通过调用realizeClass 方法,将ro的值,赋值给rw:

        if (ro->flags & RO_FUTURE) {
            // This was a future class. rw data is already allocated.
            rw = cls->data();
            ro = cls->data()->ro;
            cls->changeInfo(RW_REALIZED|RW_REALIZING, RW_FUTURE);
        } else {
            // Normal class. Allocate writeable class data.
            rw = (class_rw_t *)calloc(sizeof(class_rw_t), 1);
            rw->ro = ro;
            rw->flags = RW_REALIZED|RW_REALIZING;
            cls->setData(rw);
        }
    

    下图是 realizeClass 方法执行过后的类所占用内存的布局:

    NSObject对象结构
    二、isa结构

    isa在对象的结构中,起着很重要的作用,连接着实例对象和类对象,类对象和元类,在方法调用的时候,正是通过isa指针,实现了方法的查找。
    下面我们就来看一下isa指针的结构:

    union isa_t {
        isa_t() { }
        isa_t(uintptr_t value) : bits(value) { }
    
        Class cls;
        uintptr_t bits;
    #if defined(ISA_BITFIELD)
        struct {
            ISA_BITFIELD;  // defined in isa.h
        };
    #endif
    };
    
    # if __arm64__
    #   define ISA_MASK        0x0000000ffffffff8ULL
    #   define ISA_MAGIC_MASK  0x000003f000000001ULL
    #   define ISA_MAGIC_VALUE 0x000001a000000001ULL
    #   define ISA_BITFIELD                                                      \
          uintptr_t nonpointer        : 1;                                       \
          uintptr_t has_assoc         : 1;                                       \
          uintptr_t has_cxx_dtor      : 1;                                       \
          uintptr_t shiftcls          : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
          uintptr_t magic             : 6;                                       \
          uintptr_t weakly_referenced : 1;                                       \
          uintptr_t deallocating      : 1;                                       \
          uintptr_t has_sidetable_rc  : 1;                                       \
          uintptr_t extra_rc          : 19
    #   define RC_ONE   (1ULL<<45)
    #   define RC_HALF  (1ULL<<18)
    
    # elif __x86_64__
    #   define ISA_MASK        0x00007ffffffffff8ULL
    #   define ISA_MAGIC_MASK  0x001f800000000001ULL
    #   define ISA_MAGIC_VALUE 0x001d800000000001ULL
    #   define ISA_BITFIELD                                                        \
          uintptr_t nonpointer        : 1;                                         \
          uintptr_t has_assoc         : 1;                                         \
          uintptr_t has_cxx_dtor      : 1;                                         \
          uintptr_t shiftcls          : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
          uintptr_t magic             : 6;                                         \
          uintptr_t weakly_referenced : 1;                                         \
          uintptr_t deallocating      : 1;                                         \
          uintptr_t has_sidetable_rc  : 1;                                         \
          uintptr_t extra_rc          : 8
    #   define RC_ONE   (1ULL<<56)
    #   define RC_HALF  (1ULL<<7)
    
    

    首先isa指针是一个union,而不是常用struct结构体,那两者什么区别呢?

    1.在存储多个成员信息时,编译器会自动给struct第个成员分配存储空间,struct 可以存储多个成员信息,而Union每个成员会用同一个存储空间,只能存储最后一个成员的信息。
    
    2.都是由多个不同的数据类型成员组成,但在任何同一时刻,Union只存放了一个被先选中的成员,而结构体的所有成员都存在。
    
    3.对于Union的不同成员赋值,将会对其他成员重写,原来成员的值就不存在了,而对于struct 的不同成员赋值 是互不影响的。
    

    也就是union会以其成员中,占用存储空间最多的一个对象,来分配内存。在isa中也就是结构体决定了union的大小。
    那么为什么会使用union而不使用struct结构呢?
    我们可以从isa指针的初始化中看看:

    inline void objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
    {
        initIsa(cls, true, hasCxxDtor);
    }
    
    inline void objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
    { 
        
        if (!nonpointer) {
            isa.cls = cls;
        } else {
            isa_t newisa(0);
            newisa.bits = ISA_MAGIC_VALUE;
            newisa.has_cxx_dtor = hasCxxDtor;
            newisa.shiftcls = (uintptr_t)cls >> 3;
    }
    

    在initInstanceIsa的时候,会调用initInstanceIsa,也就是nonpointer会传true,nonpointer表示的是isa指针优化,具体可以看Tagged Pointer技术

    下面是在指针优化的时候,结构体64位的含义:


    arm64中isa中结构体每位的含义.png

    下面我们来看下这个结构体具体的含义:

    • nonpointer代表是否开启isa指针优化。关于什么是isa指针优化,可以看看Tagged Pointer技术

    • has_assoc 代表对象含有或者曾经含有关联引用,没有关联引用的可以更快地释放内存

    • has_cxx_dtor 表示该对象是否有 C++ 或者 Objc 的析构器

    • shiftcls :类的指针。arm64架构中有33位可以存储类指针。

    • magic 表示判断对象是否初始化完成,在arm64中0x16是调试器判断当前对象是真的对象还是没有初始化的空间。

    • weakly_referenced 表示对象被指向或者曾经指向一个 ARC 的弱变量,没有弱引用的对象可以更快释放

    • deallocating 对象是否正在释放内存

    • has_sidetable_rc 判断该对象的引用计数是否过大,如果过大则需要其他散列表来进行存储。

    • extra_rc 存放该对象的引用计数值减一后的结果。对象的引用计数超过 1,会存在这个这个里面,如果引用计数为 10,extra_rc的值就为 9。

    从以上信息可以看出来isa指针不仅存储了类的指针,还存储了是否开启指针优化,是否有析构器、是否包含关联引用、是否正在释放等信息。

    总结:
    1.在方法调用时,查找缓存,是从objc_class的cache中取的bucket_t,通过key来查找对应的方法实现,实现方法的响应。
    2.类对应的方法、属性、协议存储在objc_class中的bits里面,这里面有个结构体class_rw_t和结构体class_ro_t,class_ro_t是存储编译器的方法、属性、协议,运行期添加的方法属性协议,都是存储在class_rw_t中。
    3.isa指针在arm64和x86_64位时,对应结构体中每位的含义不同,isa指针不仅存储了类的指针,还存储了是否开启指针优化,是否有析构器、是否包含关联引用、是否正在释放等信息。

    参考:
    objc4-750源码
    从 NSObject 的初始化了解 isa.md
    深入理解Objective-C:Category
    深入解析 ObjC 中方法的结构
    神经病院 Objective-C Runtime 入院第一天—— isa 和 Class
    What is a meta-class in Objective-C?
    objc_explain_Classes_and_metaclasses
    isa详解

    相关文章

      网友评论

          本文标题:Objc源码之NSObject和isa

          本文链接:https://www.haomeiwen.com/subject/ttwprctx.html