美文网首页
iOS alloc&init原理探索

iOS alloc&init原理探索

作者: 辉辉岁月 | 来源:发表于2021-02-07 18:58 被阅读0次

    首先

    • 了解alloc和init的原理之前,我们先看看以下几行代码,以下分別输出对象的内容,对象的地址,对象的指针的地址,打印结果如下:
        LGPerson *p1 = [LGPerson alloc];
        LGPerson *p2 = [p1 init];
        LGPerson *p3 = [p1 init];
       
        LGNSLog(@"%@ - %p - %p",p1,p1,&p1);
        LGNSLog(@"%@ - %p - %p",p2,p2,&p2);
        LGNSLog(@"%@ - %p - %p",p3,p3,&p3);
    
    <LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2068
    <LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2060
    <LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2058
    

    为什么

    • 前两个%@→p1,%p→p1地址一样,而%p→&p1又不一样呢?

    原因

    • 程式在运行时先进行类加载,即在代码段中开辟空间,内部存放声明的属性及方法。
    • 在使用alloc时会在堆区开辟一个空间,内部有isa指针,这个指针指向所指的类对象。
    • 而栈区的指针保存的是对象的地址。


      对象在内存中的存储

      注:想知道类在代码段中的地址可以通过

    Class cls1 = objc_getClass(p1);
    NSLog(@"%p" , cls1);
    
    0x1022147c8
    
    • 由上图可以初步了解对象的内容,对象的地址,对象的指针的地址之间的关系

    那么到底alloc&init的原理是什么呢?

    准备工作

    alloc源码探索

    流程

    源碼搭配斷點調適查看 alloc:

    + (id)alloc {
        return _objc_rootAlloc(self);
    }
    

    进入_objc_rootAlloc

    id _objc_rootAlloc(Class cls) {
        return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
    }
    

    进入callAlloc

    • 到这里会不确定进入哪个流程,不过我们可以通过源码搭配断点调试,判断逻辑走到哪个流程,來到了_objc_rootAllocWithZone
    static ALWAYS_INLINE id
    callAlloc(Class cls, bool checkNil, bool allocWithZone=false) {
    #if __OBJC2__
        // checkNil 为false,!cls 也为false ,不会返回nil
        if (slowpath(checkNil && !cls)) return nil;
        // 是否有自定义的 +allocWithZone 实现
        if (fastpath(!cls->ISA()->hasCustomAWZ())) {
            return _objc_rootAllocWithZone(cls, nil);
        }
    #endif
        // No shortcuts available.
        if (allocWithZone) {
            return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
        }
        return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
    }
    

    怎么知道是走到_objc_rootAllocWithZone 的呢?

    • 首先我们通过符号断点添加_objc_rootAlloccallAlloc_objc_rootAllocWithZone

    • 因为直接运行起來可能断着不是我們想要的流程,所以先disable停用一下,接著运行起來


    • 接下來想要看看alloc后面到底调用了什么吧?

    • 這時再启用刚刚添加的符号断点,确保我们断着的断点是我們想要看的流程


    • 过掉断点來到_objc_rootAlloc

    • 再过掉断点來到_objc_rootAllocWithZone

    • 可以发现为什么直接从_objc_rootAlloc直接跳到了_objc_rootAllocWithZone

    • 因为编译器优化了,可以看到源碼如下。

    • 编译器优化-fastpath&slowpath
      其中的__builtin_expect指令是由gcc引入的,

      1. 目的:编译器可以对代码进行优化,以减少指令跳转带来的性能下降,即性能优化。
      2. 作用:允许程序员将最有可能执行的分支告诉编译器。
      3. 指令的写法为:__builtin_expect(EXP, N)。表示EXP==N的概率很大。
      4. fastpath定义中__builtin_expect((x),1)表示x 的值为真的可能性更大;即执行if里面语句的机会更大。
      5. slowpath定义中的__builtin_expect((x),0)表示x 的值为假的可能性更大。即執行else里面语句的机会更大。
      6. 在日常的开发中,也可以通過设置来优化编译器,达到性能优化的目的,设置的路径为:Build Setting--> Optimization Level--> Debug-->将None改为fastest或者smallest。
    //x很可能为1,程式走if括弧內的實現
    #define fastpath(x) (__builtin_expect(bool(x), 1)) 
    //x很可能为0,程式走else括弧內的實現
    #define slowpath(x) (__builtin_expect(bool(x), 0)) 
    
    static ALWAYS_INLINE id
    callAlloc(Class cls, bool checkNil, bool allocWithZone=false)// alloc 源码 第三步
    {
    #if __OBJC2__ //有可用的编译器优化
        /*
         参考链接:(https://www.jianshu.com/p/2684613a300f)
         */
        
        // checkNil 为false,!cls 也为false ,所以slowpath 为 false,假值判断不会走到if里面,即不会返回nil
        //fastpath(x)表示x很可能不為0,希望編譯器進行優化;slowpath(x)表示x很可能為0,希望編譯器進行優化-這裡表示cls大概率是有值的,編譯器可以不用每次都讀取return nil指令
        if (slowpath(checkNil && !cls)) return nil;
        
        //判断一个类是否有自定义的 +allocWithZone 实现,没有则走到if里面的实现
        if (fastpath(!cls->ISA()->hasCustomAWZ())) {
            return _objc_rootAllocWithZone(cls, nil);
        }
    #endif
    
        // No shortcuts available. // 没有可用的编译器优化
        if (allocWithZone) {
            return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
        }
        return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
    }
    

    跳转至_objc_rootAllocWithZone 的源码实现

    跳转至_class_createInstanceFromZone 的源码实现,這部分是alloc源碼的核心操作,该方法的实现主要分为三个部分

    • cls→instanceSize:计算需要开辟的内存空间大小
    • calloc:申请内存,返回地址指針
    • obj→initInstanceIsa:将类与isa关联
    static ALWAYS_INLINE id
    _class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
                                  int construct_flags = OBJECT_CONSTRUCT_NONE,
                                  bool cxxConstruct = true,
                                  size_t *outAllocatedSize = nil)// alloc 源码 第五步
    {
        ASSERT(cls->isRealized()); //检查是否已经实现
    
        // Read class's info bits all at once for performance
        //一次性读取类的位信息以提高性能
        bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
        bool hasCxxDtor = cls->hasCxxDtor();
        bool fast = cls->canAllocNonpointer();
        size_t size;
    
        //计算需要开辟的内存大小,传入的extraBytes 为 0
        size = cls->instanceSize(extraBytes);
        if (outAllocatedSize) *outAllocatedSize = size;
    
        id obj;
        if (zone) {
            obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
        } else {
            //申请内存
            obj = (id)calloc(1, size);
        }
        if (slowpath(!obj)) {
            if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
                return _objc_callBadAllocHandler(cls);
            }
            return nil;
        }
    
        if (!zone && fast) {
            //将 cls类 与 obj指针(即isa) 关联
            obj->initInstanceIsa(cls, hasCxxDtor);
        } else {
            // Use raw pointer isa on the assumption that they might be
            // doing something weird with the zone or RR.
            obj->initIsa(cls);
        }
    
        if (fastpath(!hasCxxCtor)) {
            return obj;
        }
        construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
        return object_cxxConstructFromClass(obj, cls, construct_flags);
    }
    

    alloc核心操作

    • 核心操作都位于calloc方法中

    cls->instanceSize:计算所需内存大小

    流程

    跳转至instanceSize 的源码实现

    size_t instanceSize(size_t extraBytes) const {
        //编译器快速计算内存大小
        if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
            return cache.fastInstanceSize(extraBytes);
        }
    
        // 计算类中所有属性的大小 + 额外的字节数0
        size_t size = alignedInstanceSize() + extraBytes;
        // CF requires all objects be at least 16 bytes.
        //如果size 小于 16,最小取16
        if (size < 16) size = 16;
        return size;
    }
    
    • 经过断点调试,执行cache.hasFastInstanceSize方法,快速计算内存大小。

    跳转至fastInstanceSize 的源码实现,通过断点调试,來到align16

    size_t fastInstanceSize(size_t extra) const
    {
        ASSERT(hasFastInstanceSize(extra));
    
        //Gcc的内建函数 __builtin_constant_p 用于判断一个值是否为编译时常数,如果参数EXP 的值是常数,函数返回 1,否则返回 0
        if (__builtin_constant_p(extra) && extra == 0) {
            return _flags & FAST_CACHE_ALLOC_MASK16;
        } else {
            size_t size = _flags & FAST_CACHE_ALLOC_MASK;
            // remove the FAST_CACHE_ALLOC_DELTA16 that was added
            // by setFastInstanceSize
            //删除由setFastInstanceSize添加的FAST_CACHE_ALLOC_DELTA16 8个字节
            return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
        }
    }
    

    跳转到align16的源码实现,以下是16字节对齐算法

    //16字節對齊算法
    static inline size_t align16(size_t x) {
        return (x + size_t(15)) & ~size_t(15);
    }
    

    想知道什么是16字节对齐算法,请先参考

    内存对齐原理

    • 看完了内存对齐原理,了解为什么要内存对齐后,我們來看看這個16字节对齐算法,为什么是这样写呢?又代表了什么意思?

    为什么要16字节对齐

    • cpu存取数据时,以区块來做范围的读取,如果读取到的资料是沒有经过对齐的,资料读取上就要花更多的次数读取完成,意味着增加了cpu读取时的负担。
    • 由于一个对象的本质为结构体,且第一個属性为isa指针(占8个字节),在沒有其他属性的情况下,会预留8个字节,其目的是为了数据读取的安全性,如果不预留,有可能造成资料读取混乱。
    • 苹果早期以8字节对齐,現在以16字节对齐。

    16字节对齐算法

    • 在解决为什么16字节是这样写之前,我們先來看看C++的位元运算


    • 在这里出现了AND(&)和NOT(~)两个位元运算子,AND就是两者数据1时输出1,其余为0,NOT就是将1变0,0变1。
    • 有了以上知识后,我們來看看
    //16字節對齊算法
    static inline size_t align16(size_t x) {
        return (x + size_t(15)) & ~size_t(15);
    }
    

    calloc:申請內存,返回地址指針

    • 通過instanceSize计算的内存大小,向內存中申請大小为size的內存,并赋值给obj,因此obj是指向內存地址的指针
    obj = (id)calloc(1, size);
    
    • 这里我们可以通过断点來印证上述的說法,在未执行calloc时,po obj为nil,执行后,再po obj,返回了一個16进制的地址
    • 然而在平常的开发中,一般一個對象的打印的格式都是类似于这样的<LGPerson: 0x01111111f>(是一個指针)。为什么这里不是呢?
    • 主要是因为iobjc 地址还没有与传入的cls进行关联
    • 同时印证了alloc的根本作用就是开辟内存

    obj->initInstanceIsa:类与isa关联

    8 经过calloc可知,內存已经申请好了,类也已经传入进来了,接下來就需要将类与地址指针即isa指针进行关联,其关联的流程圖如下所示


    类与isa关联

    initInstanceIsa流程

    • 主要过程就是初始化一個isa指針,并将isa指針指向申请的内存地址,在将指针与cls类进行关联
      同样也可以通過断点调试來印证上面的說法,在執行完initInstanceIsa后,在通过po obj可以得出一個对象指针

    总结

    通過对alloc源码的分析,可以得知alloc的主要目的就是开辟内存,而且开辟的内存需要使用16字节对齐算法,现在开辟的内存的大小基本上都是16的整數倍
    开辟内存的核心步骤有3步:计算 -- 申请 -- 关联

    init源码探索

    • alloc源码探索完了,接下來探索init源码,通過源码可知,init的源码实现有以下两种

    类方法init

    + (id)init {
        return (id)self;
    }
    
    • 這裡的init是一個构造方法,是通過工厂设计(工厂方法模式),主要是用与給用户提供构造方法入口。這里能使用id强转的原因,主要还是因为内存字节对齐后,可以使用类型强转为你所需的类型

    实例方法init

    通過以下代码进行探索实例方法init

    LGPerson *objc = [[LGPerson alloc] init];
    

    通過main中的init跳转至init的源码实现

    - (id)init {
        return _objc_rootInit(self);
    }
    

    跳转至_objc_rootInit的源码实现

    id
    _objc_rootInit(id obj)
    {
        // In practice, it will be hard to rely on this function.
        // Many classes do not properly chain -init calls.
        return obj;
    }
    

    有上述代码可以,返回的是传入的self本身。

    new 源碼探索

    一般在开发中,初始化除了init,还可以使用new,两者本质上并沒有什么区別,以下是objc中new的源码实现,通過源码可以得知,new函數中直接调用了callAlloc函數(即alloc中分析的函數),且调用了init函數,所以可以得出new 其实就等价于 [alloc init]的结论

    相关文章

      网友评论

          本文标题:iOS alloc&init原理探索

          本文链接:https://www.haomeiwen.com/subject/rwsztltx.html