在开始之前,首先要理解一个概念:OC 对象的本质是什么?
1. OC 对象本质
1.1 Clang介绍
Clang是一个由 Apple 主导编写,基于 LLVM 的 C/C++/OC的编译器
用于底层编译,将一些文件输出成 c++文件,例如 main.m 输出成 main.cpp
1.2 探究对象本质
- 新建一个 Test 类,继承 NSObject,有一个属性name:
@interface Test : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation Test
@end
- 使用 clang 命令将Test.m编译成Test.app:
clang -rewrite-objc test.m -o test.cpp
如果出现fatal error: 'UIKit/UIKit.h' file not found
的错误,使用:
clang -x objective-c -rewrite-objc -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator.sdk test.m
- 查看 test.cpp 文件
打开编译好的 test.cpp文件,找到 Test 的定义,发现 Test 在底层会被编译成 struct 结构体:
// Test的底层编译
struct Test_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString * _Nonnull _name;
};
//NSObject的定义
@interface NSObject <NSObject> {
Class isa OBJC_ISA_AVAILABILITY;
}
//NSObject 的底层编译
struct NSObject_IMPL {
Class isa;
};
Test_IMPL中第一个属性NSObject_IVARS,等效于NSObject 中的 isa,是继承自 NSObject,属于伪继承(直接将 NSObject 结构体定义为 Test 中的第一个属性),意味着 Test 拥有 NSObject 中的所有成员变量。
通过上述分析,理解了对象的本质,其实就是一个结构体,但是看到 NSObject 的定义,会产生一个疑问:为什么 isa 的类型是 Class ?
1.4 isa类型
-
在探究alloc底层原理的时候,提到过alloc方法的核心之一的initInstanceIsa方法,通过看这个方法的源码实现,我们发现,在初始化 isa 指针时,是通过 isa_t 类型来初始化的。
-
而在 NSObject 定义中的 isa 的类型是 Class,其根本原因是由于 isa 对外反馈的是类信息,为了让开发者更加清晰明确,在 isa 返回时做了一个类型强制转换:
image.png
1.5 小结
从上述探索过程中可以得出:
- OC 对象本质其实就是结构体
- Test 中的 isa 是继承自 NSObject 中的 isa
2. objc_setProperty
2.1 objc_setProperty 源码探索
除了 Test 的底层定义,我们还发现了属性name对应的 set 和 get 方法,如下图所示,其中 set 方法的实现依赖于 runtime 中的objc_setProperty:
image.png
- 我们通过 objc 源码全局搜索
objc_setProperty
,找到 objc_setProperty 的源码实现:
void objc_setProperty(id self, SEL _cmd, ptrdiff_t offset, id newValue, BOOL atomic, signed char shouldCopy)
{
bool copy = (shouldCopy && shouldCopy != MUTABLE_COPY);
bool mutableCopy = (shouldCopy == MUTABLE_COPY);
reallySetProperty(self, _cmd, newValue, offset, atomic, copy, mutableCopy);
}
-
进入 reallySetProperty 的源码实现,其方法的原理就是新值 retain,旧值 release:
image.png
2.2 小结
通过对objc_setProperty的底层源码探索,有以下几点说明:
- objc_setProperty方法的目的适用于关联上层的 set 方法以及底层的 set 方法,其本质就是一个接口
- 这么设计的原因是,上层的 set 方法很多,如果直接调用底层 set 方法,会产生很多临时变量
-
苹果采用了适配器设计模式(将底层接口适配为客户端需要的接口),对外提供一个接口,供上层的 set 方法使用,对内调用底层的 set 方法,使其互不影响,即无论上层怎么变,下层都是不变的,或者下层的变化也无法影响上层,主要是达到上下层接口隔离的目的:
image.png
3. cls 与 类关联的原理
还是探索 initInstanceIsa是如何将 cls 和 isa 关联的,首先需要了解下联合体,为什么 isa 的类型 isa_t 使用联合体定义
3.1 联合体(union)
结构体
这个我们很熟悉,把不同的数据组合成一个整体,其变量时共存的,变量不管是否使用,都会分配内存
- 缺点:所有变量都分配内存,比较浪费内存,假如有 4 个 int 成员,一共分配了 16 字节的内存,但是在使用时,只用了 4 个字节,剩余的 12 个字节就很浪费
- 优点:存储容量较大,包容性强,不会相互影响
联合体
联合体也是由不同的数据类型组成,但其变量时互斥的,所有成员共占一段内存,而且联合体采用了内存的覆盖技术,同一时刻只能保存一个变量的值,如果对新的成员赋值,就会将原来成员的值覆盖掉
- 缺点:包容性弱
- 优点:所有成员共用一段内存,使内存的使用更为精细灵活,同时也节省了内存空间
两者的区别
-
内存占用情况
结构体的各个成员会占用不同的内存,互不影响,联合体的所有成员共用一段内存,修改一个成员会影响其余所有成员 -
内存分配大小
结构体内存 >= 所有成员占用的内存总和
联合体占用的内存等于最大成员占用的内存
3.2 isa 的类型 isa_t
下面是 isa 指针的类型 isa_t联合体的定义:
union isa_t { // 联合体
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
// 提供了 cls 和 bits,两者是互斥关系
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
isa_t类型使用联合体的原因也是基于内存优化的考虑,这里的内存优化是指在 isa 指针中通过 char + 位域 (即二进制中每一位或者多位均可表示不同的信息) 的原理实现。
通常,isa 指针占用的内存大小是 8 字节,即 64 位,已经足够存储很多的信息了,这样可以极大的节省内存,以提高性能。
从上面 isa_t的定义中可以看出:
- cls 和 bits是互斥的,说明isa 指针初始化方式有两种:通过 cls 或者 bit 初始化
-
还有一个结构体定义的位域,用于存储类信息以及其他一些信息,如下:
image.png
- nonpointer 有两个值,表示自定义的类等,占 1 位
- 0:纯 isa 指针
- 1:不只是类对象地址,isa 中包含了类信息、对象的引用计数等
- has_assoc表示关联对象标志位,占 1 位
- 0:没有关联对象
- 1:有关联对象
- has_cxx_dtor 表示该对象是否有C++/OC的析构器(类似于dealloc),占1位
- 如果有析构函数,则需要做析构逻辑
- 如果没有,则可以更快的释放对象
- shiftcls表示存储类的指针的值(类的地址), 即类信息
- arm64中占 33位,开启指针优化的情况下,在arm64架构中有33位用来存储类指针
- x86_64中占 44位
-
magic 用于调试器判断当前对象是真的对象 还是 没有初始化的空间,占6位
-
weakly_refrenced是指对象是否有弱引用
- 释放前需要释放弱引用指针
-
deallocating 标志对象是是否正在释放内存
-
has_sidetable_rc表示 当对象引用计数大于10时,则需要借用该变量存储进位
-
extra_rc(额外的引用计数) --- 表示该对象的引用计数值,实际上是引用计数值减1
- 如果对象的引用计数为10,那么extra_rc为9
3.3 initInstanceIsa 源码探索
- 直接到initInstanceIsa的源码实现:
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
- 进入 initIsa 方法的源码实现,主要是初始化 isa 指针
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) { // isa 通过 cls 初始化
isa = isa_t((uintptr_t)cls); // 初始化
} else { // 通过 bits 初始化
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
isa_t newisa(0); // 初始化
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE; //
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
该方法的逻辑主要分为两部分:
- 通过 cls 初始化 isa
- 通过 bits 初始化 isa
3.4 isa与类的关联
cls 与 isa 关联的原理就是 isa 指针中的 shiftcls 位域中存储了类信息,其中initInstanceIsa的过程是将 calloc 指针 和当前的 类cls 关联起来。
网友评论