美文网首页
OC底层原理初探之对象的本质(一)alloc探索上

OC底层原理初探之对象的本质(一)alloc探索上

作者: 温暖xj | 来源:发表于2021-09-01 10:56 被阅读0次

    前言

    OC在生成对象时需要用到alloc方法,那么alloc方法的底层原理是怎样的呢?今天就来探索下alloc底层流程。

    首先做个小测试:
    分别输出对象的内容、对象的地址以及对象指针的地址,代码和打印结果如下:

        XJPerson *p1 = [XJPerson alloc];
        XJPerson *p2 = [p1 init];
        XJPerson *p3 = [p1 init];
        
        XJPerson *p4 = [XJPerson alloc];
        
        NSLog(@"%@-%p-%p", p1, p1, &p1);
        NSLog(@"%@-%p-%p", p2, p2, &p2);
        NSLog(@"%@-%p-%p", p3, p3, &p3);
        
        NSLog(@"%@-%p-%p", p4, p4, &p4);
        **********************   运行结果   ************************
        2021-06-06 15:13:30.196346+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355068
        2021-06-06 15:13:30.196493+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355060
        2021-06-06 15:13:30.196607+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355058
        2021-06-06 15:13:30.196699+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a620>-0x60000295a620-0x7ffee3355050
        
    

    由打印分析可得出:

    • p1、p2、p3 对象的内容、对象的地址是一样的,但是指针的地址不一样。
    • p4p1、p2、p3 打印的对象内容、对象地址、指针地址都不一样。
      为什么呢?原因如下图
      image.png
      由此可得出结论:
    1. alloc 方法具有开辟内存的功能,而init方法没有开辟内存的功能。
    2. 栈区分配的内存是从高到低连续,堆区分配的内存则是从低到高。

    下面正式开始探索对象在初始化时,alloc方法到底做了什么?

    准备工作:

    1. 下载源码objc-818.2
    2. 编译源码objc4-750源码编译,仅供参考

    三种探索底层的方式:

    想要探索alloc的流程,但是Xcode并不能直接看到alloc的具体实现,下面提供三种探索底层的方式。

    1.符号断点

    在alloc方法打好断点,当断点断住之后按住control + step into跳进汇编代码查看底层方法调用顺序(新项目会有更多的汇编代码,编译过的项目只有很少的汇编代码),然后再添加通过汇编已知的符号断点探索。流程如下图:

    image.png

    2.汇编

    当断点断住之后,通过Xcode -> Debug -> Debug Workflow -> Always Show Disassembly,打开汇编调试,通过 control + step into 跟流程或者直接通过添加汇编代码里的符号断点探索。

    image.png

    备注:Build Setting -> Optimization Level 可以更改编译优化级别,不同编译优化级别显示的汇编代码多少不同,编译优化级别越高,显示汇编代码越少。

    image.png

    3.符号断点
    在需要探索的方法处添加符号断点,比如这里需要探索alloc方法就直接添加alloc的符号断点,但是需要注意,在需要的时候才激活此符号断点,不然很多地方都会调用,影响我们探索。

    image.png

    终极方法:源码调试

    上面的三种方法为我们探索底层提供了途径,但是都比较繁琐,而且不够清晰,既然已经通过汇编知道objc_alloc 是属于 libobjc.A.dylib,那么就到苹果开源网站下载objc源码编译成项目跑起来进行探索,这样既深又爽。

    image.png
    通过汇编调试方式知道源码所在库之后,可以直接到苹果开源网站 https://opensource.apple.com/tarballs/ 下载相关源码然后运行调试。
    image.png
    image.png

    alloc源码探索

    通过源码项目探索alloc方法,发现底层调用流程如下图


    image.png

    探索流程如下:

    断点断住alloc方法之后,按住control + command + step into 进入alloc(此方法比加断点的方法更方便快捷且不用担心受其他影响)

    + (id)alloc {
        return _objc_rootAlloc(self);
    }
    

    继续上面操作进入_objc_rootAlloc

    id _objc_rootAlloc(Class cls)
    {
        return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
    }
    

    继续上面操作进入callAlloc

    static ALWAYS_INLINE id
    callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
    {
    #if __OBJC2__ // 判断是否为Objc2.0版本
        //slowpath(x):x很可能为假,为真的概率很小 
        //fastpath(x):x很可能为真 
        //其实将fastpath和slowpath去掉是完全不影响任何功能,写上是告诉编译器对代码进行优化
        if (slowpath(checkNil && !cls)) return nil;
        //判断该类是否实现自自定义的 +allocWithZone,没有则进入if条件句
        if (fastpath(!cls->ISA()->hasCustomAWZ())) {
            return _objc_rootAllocWithZone(cls, nil);
        }
    #endif
    
        // No shortcuts available.
        if (allocWithZone) {
            return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
        }
        return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
    }
    

    按照调用顺序继续上面操作进入_objc_rootAllocWithZone

    NEVER_INLINE
    id
    _objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
    {
        // allocWithZone under __OBJC2__ ignores the zone parameter
        return _class_createInstanceFromZone(cls, 0, nil,
                                             OBJECT_CONSTRUCT_CALL_BADALLOC);
    }
    

    继续上面操作进入_class_createInstanceFromZone,这里就是真正的核心代码了。
    [图片上传失败...(image-77e1eb-1630464921920)]

    通过实际调试发现对obj有较大影响的核心方法有3个:

    • cls->instanceSize(extraBytes):计算所需内存空间的大小,extraBytes此处为0
    • (id)calloc(1, size):向系统申请开辟内存,返回地址指针
    • obj->initInstanceIsa(cls, hasCxxDtor):通过isa关联到相应的类

    下面重点分析这三个方法:

    instanceSize:计算所需内存空间的大小

    继续上面操作进入instanceSize

    inline size_t instanceSize(size_t extraBytes) const {
        if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
            return cache.fastInstanceSize(extraBytes);
        }
    
        size_t size = alignedInstanceSize() + extraBytes;
        // CF requires all objects be at least 16 bytes.
        if (size < 16) size = 16;
        return size;
    }
    

    继续上面操作进入cache.fastInstanceSize

    size_t fastInstanceSize(size_t extra) const
    {
        ASSERT(hasFastInstanceSize(extra));
    
        if (__builtin_constant_p(extra) && extra == 0) {
            return _flags & FAST_CACHE_ALLOC_MASK16;
        } else {
            size_t size = _flags & FAST_CACHE_ALLOC_MASK;
            // remove the FAST_CACHE_ALLOC_DELTA16 that was added
            // by setFastInstanceSize
            return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
        }
    }
    

    继续上面操作进入align16(16字节对齐)

    static inline size_t align16(size_t x) {
        return (x + size_t(15)) & ~size_t(15);
    }
    

    探究下align16方法的具体实现,以align16(12)为例

    x = 12;
    (x + size_t(15)) & ~ size_t(15) // ~ 表示取反
    12 + 15 = 27  0001 1011
    15            0000 1111
    ~15           1111 0000
    27 & ~15      0001 1011 & 1111 0000
    结果:         0001 0000  16
    

    总结:align16算法实际上就是取16的整数倍。我认为是向下取整,理由我是站在纯算法的角度,(x + 15)是16的几倍,超过的部分抹去。例如 (20 + 15) = 35 = 16 * 2 + 3,结果是32。这种算法和 >> 4 << 4 是一样的,得出的结果就是16的倍数,不足16的全部抹去。

    为什么需要16字节对齐?

    1. 数据以字节对齐的方式存储,cpu读取数据时以固定字节长度来读取就可以了,不用频繁变换读取字节长度,这是一种以空间换时间的做法。
    2. 更安全 由于在一个对象中isa指针是占8个字节,如果不进行节对齐 ,对象之间就会紧挨着,容易造成访问混乱。16字节对齐,会预留部分空间,访问更安全

    calloc:向系统申请开辟内存,返回地址指针

    首先由instanceSize方法计算出需要的内存大小,然后向系统申请size大小的内存空间返回给obj,因此obj是指向内存地址的指针,下面我们通过打印来验证下

    image.png image.png
    执行calloc之后打印的地址发生了变换,说明系统分配了内存,但是和常见的对象打印<XJPerson: 0x0000000100616e60>不一样,为什么呢?
    • obj没有和cls进行关联绑定。
    • 同时验证了calloc只是开辟了内存。

    initInstanceIsa:通过isa关联到相应的类

    继续上面操作进入objc_object::initInstanceIsa

    inline void 
    objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
    {
        ASSERT(!cls->instancesRequireRawIsa());
        ASSERT(hasCxxDtor == cls->hasCxxDtor());
    
        initIsa(cls, true, hasCxxDtor);
    }
    

    继续上面操作进入objc_object::initIsa

    inline void 
    objc_object::initIsa(Class cls, bool nonpointer, UNUSED_WITHOUT_INDEXED_ISA_AND_DTOR_BIT bool hasCxxDtor)
    { 
        ASSERT(!isTaggedPointer()); 
        
        isa_t newisa(0);
    
        if (!nonpointer) {
            newisa.setClass(cls, this);
        } else {
            ASSERT(!DisableNonpointerIsa);
            ASSERT(!cls->instancesRequireRawIsa());
    
    
    #if SUPPORT_INDEXED_ISA
            ASSERT(cls->classArrayIndex() > 0);
            newisa.bits = ISA_INDEX_MAGIC_VALUE;
            // isa.magic is part of ISA_MAGIC_VALUE
            // isa.nonpointer is part of ISA_MAGIC_VALUE
            newisa.has_cxx_dtor = hasCxxDtor;
            newisa.indexcls = (uintptr_t)cls->classArrayIndex();
    #else
            newisa.bits = ISA_MAGIC_VALUE;
            // isa.magic is part of ISA_MAGIC_VALUE
            // isa.nonpointer is part of ISA_MAGIC_VALUE
    #   if ISA_HAS_CXX_DTOR_BIT
            newisa.has_cxx_dtor = hasCxxDtor;
    #   endif
            newisa.setClass(cls, this);
    #endif
            newisa.extra_rc = 1;
        }
    
        // This write must be performed in a single store in some cases
        // (for example when realizing a class because other threads
        // may simultaneously try to use the class).
        // fixme use atomics here to guarantee single-store and to
        // guarantee memory order w.r.t. the class index table
        // ...but not too atomic because we don't want to hurt instantiation
        isa = newisa;
    }
    

    通过step over跟流程发现newisa.setClass(cls, this)之后内存就与类关联起来了。

    image.png

    备注:具体的isa结构和源码探索请见OC底层原理初探之对象的本质(三)alloc探索下

    obj->initInstanceIsa(cls, hasCxxDtor)之后打印obj

    image.png

    根据打印结果得出结论:指针和类已经关联起来了。至此alloc的探索也就告一段落了。

    总结:alloc的核心作用就是分配内存,并通过isa指针与类进行关联。

    相关文章

      网友评论

          本文标题:OC底层原理初探之对象的本质(一)alloc探索上

          本文链接:https://www.haomeiwen.com/subject/nbjxwltx.html