美文网首页
iOS-alloc底层做了什么流程分析

iOS-alloc底层做了什么流程分析

作者: LWide | 来源:发表于2020-09-06 22:24 被阅读0次

引言

当我们创建一个对象的时候 比如: [[Person alloc] init] alloc 到底做了什么 init到底做了什么 ? 这就是这篇文档要给大家分享的一些个人见解,希望大家多提意见,共同学习.

探索路程

如下图 直接上代码


001.png

上述代码说明p1,p2,p3指向了相同的内存地址,init并没有创建空间 真正申请空间的是alloc申请了空间.

%p -> &p1:是对象的指针地址,
%p -> p1: 是对象指针指向的的内存地址

由p1,p2,p3的指针地址推断,栈内存是连续的(0x30 + 0x08 = 0x38, 0x28 + 0x08 = 0x30 [这里是16进制运算]),并且所占内存都是8字节(指针占内存8字节)


002.png

源码探索

要想知道alloc到底做了什么事我们需要知道他的源码里面到底怎么实现的,由于苹果API是点不进去的 我们只能根据符号断点或者其他方法去探索 我们可以从网上下载他的源码去分析.

苹果开源库:
1:https://opensource.apple.com/source 所以开源库都在里面,包括各个老版本
2:https://opensource.apple.com 可以根据系统版本选择更新的下载
3 : 编译源码,可参考https://github.com/LGCooci/objc4_debug

999

知道哪里下载库了,那我们怎么知道alloc属于哪个库呢?
这里为大家提供3个方法,供参考
方法一: 下符号断点的形式直接跟流程
下符号断点的方法如图


003.png

方法二:Ctrl + step into


004

按住Ctrl,多点几次下一步,来到了 objc_alloc

005

把objc_alloc作为符号断点,加上的一瞬间就又找到了libobjc.A.dylib


006

方法三:汇编查看跟流程(最常用的)
Debug -> Debug Workflow -> Always Show Disassembly 进入汇编


007

得到 objc_alloc


008

用方法二下符号断点又可以拿到libobjc.A.dylib

找到源码库libobjc.A.dylib 即 objc4

下载源码+编译源码请移步到 iOS_objc4-781.2 最新源码编译调试

打开源码工程,开始alloc源码探索

通过 command + 鼠标左键 一步一步进入源码看流程

如下图 NSObject 和它的子类是有点区别的 NSObject 没走alloc只走了一次callAlloc是因为系统帮我们做了(alloc底层会被hook去调用objc_alloc,所以先走objc_alloc再走alloc) MyNSObject走了两次callAlloc 第二次才是真正的去开辟空间.


666 444

所以可以看到在调用NSObject *objc = [NSObject alloc];时,其实调用的是objc中的objc_alloc方法。

二、OC 的 alloc 深入探究

经过上面一步,我们就能浅尝辄止吗?当然不能;所以我搞来一份objc4源码继续我们的探究。
看到源码 NSObject.mm 文件,里面的alloc方法

image

他会调用_objc_rootAlloc

image
  • 问题:
    我上面看到 [NSObject alloc]看到的不是会到objc_alloc来吗?怎么源码分析的到了_objc_rootAlloc?
  • 答:我们知道OC代码有运行时的特点,即方法的调用不是在编译时确定的,而是运行时,不懂的补一下编译原理。我们在objc运行时源码中查找objc_alloc,发现如下的代码
static void 
fixupMessageRef(message_ref_t *msg)
{    
    msg->sel = sel_registerName((const char *)msg->sel);

    if (msg->imp == &objc_msgSend_fixup) { 
        if (msg->sel == @selector(alloc)) {
            msg->imp = (IMP)&objc_alloc;
        } else if (msg->sel == @selector(allocWithZone:)) {
            msg->imp = (IMP)&objc_allocWithZone;
        } else if (msg->sel == @selector(retain)) {
            msg->imp = (IMP)&objc_retain;
        } else if (msg->sel == @selector(release)) {
            msg->imp = (IMP)&objc_release;
        } else if (msg->sel == @selector(autorelease)) {
            msg->imp = (IMP)&objc_autorelease;
        } else {
            msg->imp = &objc_msgSend_fixedup;
        }
    } 
    else if (msg->imp == &objc_msgSendSuper2_fixup) { 
        msg->imp = &objc_msgSendSuper2_fixedup;
    } 
    else if (msg->imp == &objc_msgSend_stret_fixup) { 
        msg->imp = &objc_msgSend_stret_fixedup;
    } 
    else if (msg->imp == &objc_msgSendSuper2_stret_fixup) { 
        msg->imp = &objc_msgSendSuper2_stret_fixedup;
    } 
#if defined(__i386__)  ||  defined(__x86_64__)
    else if (msg->imp == &objc_msgSend_fpret_fixup) { 
        msg->imp = &objc_msgSend_fpret_fixedup;
    } 
#endif
#if defined(__x86_64__)
    else if (msg->imp == &objc_msgSend_fp2ret_fixup) { 
        msg->imp = &objc_msgSend_fp2ret_fixedup;
    } 
#endif
}

发现消息发送时,当msg->imp == &objc_msgSend_fixup 进行了方法实现(IMP)的替换。

什么时候msg->imp == &objc_msgSend_fixup成立还没有确定的探究,后续了解会进一步更新。从源码的运行看[NSObject alloc]会走到objc_alloc;但是其子类的[LGPerson alloc]会调用_objc_rootAlloc

不管是_objc_rootAlloc或者objc_alloc从图4看都会进入callAlloc这个函数,不过最后两个参数不同;我们姑且往下走,进入callAlloc去看看究竟。代码如下

image
  • 这里看到有两个宏定义函数:slowpath, fastpath. 这两个函数是用于编译器优化;slowpath低概率会走;fastpath大概率会走,如果项目中有需求,自己也可以用上,让自己的代码质量提高。
  • hasCustomAWZ是否有自定义的AWZ;经过运行实际得出,当类的第一次运行时slowpathfastpath判断都为false,后面在运行时fastpath为true;不过我们看到下面的函数又是消息的发送,调用的是allocallocWithZone,其实接着往下走,可以发现,他又回到了callAlloc,并且此时的fastpath为true;

那么函数此时应来到_objc_rootAllocWithZone

unsigned 
class_createInstances(Class cls, size_t extraBytes, 
                      id *results, unsigned num_requested)
{
    return _class_createInstancesFromZone(cls, extraBytes, nil, 
                                          results, num_requested);
}

那么我们去看看_class_createInstancesFromZone

unsigned
_class_createInstancesFromZone(Class cls, size_t extraBytes, void *zone, 
                               id *results, unsigned num_requested)
{
    unsigned num_allocated;
    if (!cls) return 0;

    size_t size = cls->instanceSize(extraBytes);

    num_allocated = 
        malloc_zone_batch_malloc((malloc_zone_t *)(zone ? zone : malloc_default_zone()), 
                                 size, (void**)results, num_requested);
    for (unsigned i = 0; i < num_allocated; i++) {
        bzero(results[i], size);
    }

    // Construct each object, and delete any that fail construction.

    unsigned shift = 0;
    bool ctor = cls->hasCxxCtor();
    for (unsigned i = 0; i < num_allocated; i++) {
        id obj = results[i];
        obj->initIsa(cls);    // fixme allow nonpointer
        if (ctor) {
            obj = object_cxxConstructFromClass(obj, cls,
                                               OBJECT_CONSTRUCT_FREE_ONFAILURE);
        }
        if (obj) {
            results[i-shift] = obj;
        } else {
            shift++;
        }
    }

    return num_allocated - shift;    
}

这里的逻辑大体分为

  • 1、求出实例所需内存大小
size_t size = cls->instanceSize(extraBytes);

  • 2、分配空间
num_allocated = 
        malloc_zone_batch_malloc((malloc_zone_t *)(zone ? zone : malloc_default_zone()), 
                                 size, (void**)results, num_requested);

3、绑定isa到类

obj->initIsa(cls);    // fixme allow nonpointer

接下来返回对应类的首地址

内存分配分析

static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
                              int construct_flags = OBJECT_CONSTRUCT_NONE,
                              bool cxxConstruct = true,
                              size_t *outAllocatedSize = nil)
{
    ASSERT(cls->isRealized());

    // Read class's info bits all at once for performance
    bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
    bool hasCxxDtor = cls->hasCxxDtor();
    bool fast = cls->canAllocNonpointer();
    size_t size;
    1:根据字节对齐机制计算出相关的分配所需内存空间的大小
    size = cls->instanceSize(extraBytes);
    if (outAllocatedSize) *outAllocatedSize = size;

    id obj;
    if (zone) {
        obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
    } else {
       2 : 根据第一步计算所需空间,向系统开辟内存
        obj = (id)calloc(1, size);
    }
    if (slowpath(!obj)) {
        if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {

         3:根据分配的内存情况管理对象
            return _objc_callBadAllocHandler(cls);
        }
        return nil;
    }

    if (!zone && fast) {
        obj->initInstanceIsa(cls, hasCxxDtor);
    } else {
        // Use raw pointer isa on the assumption that they might be
        // doing something weird with the zone or RR.
        obj->initIsa(cls);
    }

    if (fastpath(!hasCxxCtor)) {
        return obj;
    }

    construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
    return object_cxxConstructFromClass(obj, cls, construct_flags);
}

我们顺着代码进入到第一步

  • 步骤1:计算相关内存大小
 size_t instanceSize(size_t extraBytes) const {
        if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
            return cache.fastInstanceSize(extraBytes);
        }

        size_t size = alignedInstanceSize() + extraBytes;
        // CF requires all objects be at least 16 bytes.
        if (size < 16) size = 16;
        return size;
    }

根据断点我们能进入到 return cache.fastInstanceSize(extraBytes);这里,再次进入代码到

  size_t fastInstanceSize(size_t extra) const
    {
        ASSERT(hasFastInstanceSize(extra));

        if (__builtin_constant_p(extra) && extra == 0) {
            return _flags & FAST_CACHE_ALLOC_MASK16;
        } else {
            size_t size = _flags & FAST_CACHE_ALLOC_MASK;
            // remove the FAST_CACHE_ALLOC_DELTA16 that was added
            // by setFastInstanceSize
            return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
        }
    }

最后通过一个计算得到是一个align16的数据返回类型,第一段代码告诉我们,系统是通过16字节对齐的方式,如果分配小于16字节,就直接等于16字节。所以此时的size 是16,
align16(size + extra - FAST_CACHE_ALLOC_DELTA16);

  • size : 16字节对齐,此时是16,

  • extra :是系统计算的额外信息,根据断点此时是0,

  • FAST_CACHE_ALLOC_DELTA16:是宏定义 :此时是8

    image

所以结合最终返回的align16的值是 align16(8)

我们在此进入align16的定义函数

static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}

此处代码的意思就是,上一步计算结果 的值加上15,和15的值取反过后再进行 按位与操作,
什么意思呢:例如上一步我们计算的结果是8,再加上15 结果等于23,23在内存中的标识是这样的

0000 0000 0001 0111

15的内存表示

0000 0000 0000 1111

15取反操作的值是

1111 1111 1111 0000

所以按位与的操作就是 23 & ~15

0000 0000 0001 0111
1111 1111 1111 0000
0000 0000 0001 0000(结果)十进制的16

如果是内存分配大于16 的,比如 20 加上15表示成 35,内存表示(0000 0000 0010 0011)
按位与操作是 35 & ~15

0000 0000 0010 0011
1111 1111 1111 0000
0000 0000 0010 0000(结果) 十进制的32,

所以这就是16字节对齐的核心机制,相信我已经介绍的够清晰了,这就是iOS内存分配的最新机制。

  • 步骤2 :分配内存

根据计算的内存size_t size 进行内存的分配,

image
  • 步骤3 关联对象类型

通过InitInstanceIsa 方法进行关联类对象实例,

objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
    ASSERT(!cls->instancesRequireRawIsa());
    ASSERT(hasCxxDtor == cls->hasCxxDtor());

    initIsa(cls, true, hasCxxDtor);
}

objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
{ 
    ASSERT(!isTaggedPointer()); 

    if (!nonpointer) {
        isa = isa_t((uintptr_t)cls);
    } else {
        ASSERT(!DisableNonpointerIsa);
        ASSERT(!cls->instancesRequireRawIsa());

        isa_t newisa(0);

#if SUPPORT_INDEXED_ISA
        ASSERT(cls->classArrayIndex() > 0);
        newisa.bits = ISA_INDEX_MAGIC_VALUE;

        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
        newisa.bits = ISA_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.shiftcls = (uintptr_t)cls >> 3;
#endif

        isa = newisa;
    }
}

总结

这就是 alloc 的完整流程;
通过ISA的关联,我们就完成了一个对象的内存分配情况,也就是一个对象的alloc 的完整流程,因为任何一个类对象都可以通过ISA指针找到相应的父类,以及元类,这样对象的各种初始化实例方法都能通过ISA指针指向找到相应的IMP。从而调用方法进行消息转发。


666

这就是alloc的大致流程

init 源码探索

alloc源码探索完了,接下来探索init源码,通过源码可知,inti的源码实现有以下两种

类方法 init

+ (id)init {
    return (id)self;
}

这里的init是一个构造方法 ,是通过工厂设计(工厂方法模式),主要是用于给用户提供构造方法入口。这里能使用id强转的原因,主要还是因为 内存字节对齐后,可以使用类型强转为你所需的类型

实例方法 init

  • 通过以下代码进行探索实例方法 init
LGPerson *objc = [[LGPerson alloc] init];

  • 通过main中的init跳转至init的源码实现
- (id)init {
    return _objc_rootInit(self);
}

  • 跳转至_objc_rootInit的源码实现
id
_objc_rootInit(id obj)
{
    // In practice, it will be hard to rely on this function.
    // Many classes do not properly chain -init calls.
    return obj;
}

有上述代码可以,返回的是传入的self本身。

new 源码探索

一般在开发中,初始化除了init,还可以使用new,两者本质上并没有什么区别,以下是objc中new的源码实现,通过源码可以得知,new函数中直接调用了callAlloc函数(即alloc中分析的函数),且调用了init函数,所以可以得出new 其实就等价于 [alloc init]的结论

+ (id)new {
    return [callAlloc(self, false/*checkNil*/) init];
}

但是一般开发中并不建议使用new,主要是因为有时会重写init方法做一些自定义的操作,例如 initWithXXX,会在这个方法中调用[super init],用new初始化可能会无法走到自定义的initWithXXX部分。

例如,在CJLPerson中有两个初始化方法,一个是重写的父类的init,一个是自定义的initWithXXX方法,如下图所示

image
  • 使用 alloc + init 初始化时,打印的情况如下

    image
  • 使用new 初始化时,打印的情况如下

    image

总结

  • 如果子类没有重写父类的init,new会调用父类的init方法
  • 如果子类重写了父类的init,new会调用子类重写的init方法
  • 如果使用 alloc + 自定义的init,可以帮助我们自定义初始化操作,例如传入一些子类所需参数等,最终也会走到父类的init,相比new而言,扩展性更好,更灵活。

谢谢你的阅读!

链接:https://www.jianshu.com/p/b72018e88a97
推荐参考:https://www.jianshu.com/p/dbba973c7446

相关文章

网友评论

      本文标题:iOS-alloc底层做了什么流程分析

      本文链接:https://www.haomeiwen.com/subject/vkyhektx.html