在分析源码之前,先做一个打印
分别输出三个对象的内容,内存地址,指针地址
结论通过上图可以看出,三个对象指向的是同一个内存空间,所以内容和内存地址是相同的,指针地址是不同的
准备工作
alloc 源码探索
alloc+init 整体探索流程如下
未命名文件-3.png
- 第一步,根据main 函数中的 alloc 方法进入 alloc 方法源码实现
+ (id)alloc {
return _objc_rootAlloc(self);
}
- 第二步,跳转到_objc_rootAlloc方法实现
_objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
- 第三步,跳转到 callAlloc 源码实现
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
if (slowpath(checkNil && !cls)) return nil;
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
如上所示,在 callAlloc 中,不确定走哪一步的时候,可以断点调试一下,这里走的是_objc_rootAllocWithZone
slowpath 和 fastPath
其中 slowpath 和 fastpath 都是objc 源码中的宏
x 很可能为真,可以简称为真值判断
#define fastpath(x) (__builtin_expect(bool(x), 1))
x 值很可能为假,可以简称为假值判断
#define slowpath(x) (__builtin_expect(bool(x), 0))
其中__builtin_expect是由 gcc 引入的
1.目的:编译器可以对代码进行优化,以减少指令跳转带来的性能下降,即性能优化
2.作用:允许程序员将最有可能执行的分支告诉编译器
3.指令的写法:__builtin_expect(EXP, N)标识 EXP==N 的概率很大
4.fastpath 中的定义__builtin_expect(bool(x), 1),表示 x 的值为真的可能性更大,即执行 if 里面语句的机会更大
5.slowpath 中的定义__builtin_expect(bool(x), 0),表示 x 的值为假的可能性更大,即执行 else 里面语句的机会更大
6.在日常开发过程中,也可以通过设置来优化编译器,达到性能优化的目的,设置的路径为Build setting -> optimization Level -> Debug -> 将 None 改成fastest或者smallest
cls->ISA()->hasCustomAWZ()
其中 fastpath 中的cls->ISA()->hasCustomAWZ 表示判断一个类是否有自定义的+allocWithZone 实现,通过断点调试,这里是没有自定义实现的,所以会执行 if 里面的代码,即_objc_rootAllocWithZone
- 第四步:跳转到_objc_rootAllocWithZone实现
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
// allocWithZone under __OBJC2__ ignores the zone parameter
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
- 第五步:跳转到_class_createInstanceFromZone实现,这部分是 alloc 源码的核心操作,该方法的核心主要分为三步
- cls->instanceSize:计算对象所需大小
- calloc:开辟内存空间,返回指针地址
- initInstanceIsa:绑定obj 与 isa
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)
{
ASSERT(cls->isRealized());
// Read class's info bits all at once for performance
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
根据源码分析,得出流程图如下
createInstanceFromZone流程.png
alloc 核心操作
核心方法都在 calloc 方法中
cls -> instanceSize 计算所需内存大小
计算需要开辟内存大小的流程如下
instanceSize流程.png
- 1.跳转到 instanceSize 源码实现
inline size_t instanceSize(size_t extraBytes) const {
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
if (size < 16) size = 16;
return size;
}
通过断点调试,会走到cache.fastInstanceSize(extraBytes);快速计算内存大小
- 2.调转到fastInstanceSize实现,会走到align16
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
- 3.跳转到 align16 源码,是 16 字节对齐算法
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
内存对齐原则
在解释为什么需要 16 字节对齐之前,首先需要了解内存对齐原则,主要有三点
- 数据成员对齐规则:struct或者 union 成员,第一个数据成员放在 offset 为 0 的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如数据,结构体等)的整数倍开始(例如 int 在 32 位中是 4 字节,则要从 4 的整数倍开始存储)
- 数据成员为结构体:如果一个结构里面有结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储(例如 struct a 中有 structb,b 里面有 char,int,double 等元素,则 b 应该从 8 的整数倍开始存储)
- 结构体整体对齐原则:结构体总大小,即sizeof 的结果,必须要是其内部最大成员的整数倍,不足的要补齐
为什么需要 16 字节对齐
- 通常内存是由一个个字节组成的,cpu 在存取数据时,并不是以字节为单位存储,而是以块为单位存储,块的大小为内存存取力度,频繁存取字节未对齐的数据,会极大讲低 cpu 的性能,所以通过减少存取次数,来讲低 cpu 的消耗
- 16 字节对齐,是由于在一个对象中,第一个属性 isa 占 8 字节,当然一个对象肯定还有其他属性,当没有属性时,会预留 8 字节,即 16 字节对齐,如果不预留,相当于这个对象的 isa和其他对象的 isa 紧挨着,容易造成访问混乱
- 16 字节对齐以后,可以加快 cpu 的访问速度,同时访问更安全,不会产生访问混乱的情况
字节对齐总结
- 在字节对齐算法中,对齐的主要是对象,而对象的本质是一个 struct objc_object的结构体
- 结构体在内存中是连续存放的,所以可以利用这一点对结构体进行强转
-
苹果早期是 8 字节对齐,现在是 16 字节对齐
下面以 align(8)为例,图解 16 字节对齐过程
image.png - 第一步:将原始内存 8 与sizet(15)相加 8 + 15 = 23
- 将 sizet(15)即 15进行~取反操作,取反的规则是:1 变 0, 0 变 1
- 最后将 23 与 15 取反的结果进行 &(与)操作,&(与)的操作规则: 都是 1 为 1,反之为 0,最后的结果为 16,即内存的大小是以 16 的倍数增加的
calloc:申请内存,返回地址指针
通过 instanceSize计算的内存大小,像内存中申请大小为 size 的内存,并赋值给 obj,因此 obj 是指向内存地址的指针
obj = (id)calloc(1, size);
这里可以通过断点验证上述的说法,在未执行 calloc 时.po obj 为 nil, 执行后,在 po obj 返回了一个 16 进制地址
image.png
在平时开发中,一个对象的打印格式一般都是<LGPerson:0x111111>(是一个指针),为什么这里不是呢
- 主要是因为obj 指针还没有与传入的 cls 进行关联
- 同事印证了 alloc 的作用就是开辟内存
obj->initInstanceIsa(cls, hasCxxDtor);类与isa 关联
经过 calloc 可知,内存已经申请好了,类也已经传进来了,接下来就需要将类与地址指针 isa 相关联,关联流程如下
isa 关联
主要过程就是初始换一个 isa 指针,并将 isa 指针指向申请的内存地址,在将指针与 cls 进行关联
同样也可以通过断点调试来印证上面的说法,在执行完 initIntanceIsa后,在通过 po obj 就可以得到一个对象指针
image.png
总结
- 通过对alloc 源码的分析,可以得知 alloc 的目的就是开辟内存,而且开辟的内存需要使用 16 字节对齐算法,现在开辟内存的大小基本都是 16 的整数倍
- 开辟内存的核心步骤有三步, 计算 -> 申请 -> 关联
init 源码探索
alloc 源码探索完了,接下来探索 init 源码,init源码实现有以下两种,
类方法 init
+ (id)init {
return (id)self;
}
这里的 init是一个构造方法,是通过工厂设计(工厂方法模式),主要用于给程序员提供构造方法入口,这里能使用类型强转的原因,主要还是因为内存字节对齐后,可以使用类型强转成你所需的类型
实例方法 init
- 通过以下代码探索实例方法 init
LGPerson *objc = [[LGPerson alloc] init];
- 通过 main 中的 init 跳转到源码实现
- (id)init {
return _objc_rootInit(self);
}
- 跳转到_objc_rootInit源码实现
_objc_rootInit(id obj)
{
// In practice, it will be hard to rely on this function.
// Many classes do not properly chain -init calls.
return obj;
}
通过上述代码可知,返回的是传入 self 本身
new 源码探索
一般在开发中,除了使用 init 方式初始化,还会使用到 new,两者本质并没有什么区别,以下是 new的源码实现,通过源码可知,new 函数中直接调用了 callalloc (alloc 中的分析函数)且调用了 init 函数,所以可以得出 new 等于[alloc init]的结论
+ (id)new {
return [callAlloc(self, false/*checkNil*/) init];
}
但是在开发中不建议使用 new,主要是有时会重写 init 方法做一些自定义操作,例如 initWithXXX,会在这个方法中调用[super init],使用 new 初始化,会走不到 initWithXXX 自定义部分
例如在 CJPerson 中有两个初始化方法,一个是重写父类的 init,另一个是自定义方法
image.png
-
使用 alloc initXXX 初始化时,打印结果如下
image.png -
使用 new 初始化时,打印结果如下
image.png
总结
- 如果子类没有重写 init 方法,new 会调用父类的 init
- 如果子类重写了 init 方法,new 会调用子类的 init
- 如果使用alloc + 自定义的 init,可以帮助我们自定义初始化操作,例如传入一些子类需要的参数等,最终也会走到父类的 init,相比较 new 来说,灵活性更高,扩展性更好
补充
[问题]为什么无法断点到obj->initInstanceIsa(cls, hasCxxDtor);?
主要因为断点断住的不是 自定义类的流程,而是系统的
image.png
网友评论