Objective-C
(以下简称 OC
)是一门动态性强的编程语言,OC
的动态性是基于 Runtime
来实现的,Runtime
系统是由 C\C++\汇编语言
编写的,提供的 API
基本都是 C
语言的。这里我们从苹果提供的 Runtime
代码来探究类的本质。
legacy 版本
OC
的 runtime
分为两个版本.一个是 legacy
版本,一个是 modern
版本。相信很多读者都见过下面这段代表 OC
类结构的代码:
struct objc_class {
Class _Nonnull isa OBJC_ISA_AVAILABILITY;
#if !__OBJC2__
Class _Nullable super_class OBJC2_UNAVAILABLE;
const char * _Nonnull name OBJC2_UNAVAILABLE;
long version OBJC2_UNAVAILABLE;
long info OBJC2_UNAVAILABLE;
long instance_size OBJC2_UNAVAILABLE;
struct objc_ivar_list * _Nullable ivars OBJC2_UNAVAILABLE;
struct objc_method_list * _Nullable * _Nullable methodLists OBJC2_UNAVAILABLE;
struct objc_cache * _Nonnull cache OBJC2_UNAVAILABLE;
struct objc_protocol_list * _Nullable protocols OBJC2_UNAVAILABLE;
#endif
} OBJC2_UNAVAILABLE;
其实这段代码就是 legacy
版本 已经在 2006
年的 WWDC
大会上发布 Objective-C 2.0
后弃用了, OBJC2_UNAVAILABLE
标记的内容已经不再使用,那么现在的结构是什么呢?
对象
OC
中,每一个对象都是类的实例,先直接来看源码中的结构:
struct objc_object {
private:
isa_t isa;
// ...
}
代表对象的结构中只有一个 isa
的成员变量,在 arm64
架构下,系统对 isa
进行了优化,它不光存着地址信息,还存着其他信息。因此对象的本质就是包含了一个私有成员变量 isa
的结构体,而 isa
存着的地址就指向着对象所属的类。不同的对象有不同的成员变量,编译后,每个对象的结构体也会存着自己的成员变量的值。
使用命令获取编译后的代码 -sdk iphoneos clang -arch arm64 -rewrite-objc Coder.m
@interface Coder : Person
@property (nonatomic, copy) NSString *name;
@end
// 编译后查看 `Coder` 的实现
struct NSObject_IMPL {
Class isa;
};
struct Coder_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString * _Nonnull _name;
};
之所以成员变量的值存在对象中,这个也很好理解,每个对象肯定是独立存在的,都需要拥有自己的变量值。而变量名称和方法等等存在什么地方呢,就是类了!
类
类存着成员变量的类型,方法等等,源码如下:
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
// 省略...
}
首先可以看到的一点是 objc_class
继承了 objc_object
,因此其实 OC
中的类也可以理解为一种对象,称之为类对象,在 legacy
版本中,对象的结构体中只有一个 isa
指针,指向它的类对象,而类对象中也有一个 isa
指针,指向它的元类。modern
版本使用继承后,类对象的结构体就继承了这个优化后的 isa
变量。但对比两个版本,会发现 modern
版本中除了superclass&cache
,其余的很多变量不在了,并多了一个 bits
变量。
struct class_data_bits_t {
uintptr_t bits;
class_rw_t* data() {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
// ...
}
这个结构体里面是通过一个位运算获取的指向 class_rw_t
的指针,可见 bits
存着 class_rw_t
结构体的指针和一些其他信息。然后把目光转到 class_rw_t
上:
'rw' 和 ro' 分别表示 'readwrite' 和 'readonly'
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
// ...
}
可以看到原先 legacy
版本中的方法、属性和协议列表就存在这个里面,这几个列表可以理解为是二维数组,是可读可写的,包含了类的初始内容、分类的内容,二维数组方便增加。 而这里又有一个 class_ro_t
:
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
// ....
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
// ....
};
class_ro_t
里面的 baseMethodList、baseProtocols、ivars、baseProperties
可以理解为是一维数组,是只读的,包含了类的初始内容。
从这里我们也能看出分类不能动态添加成员变量到类对象的原因,分类是通过
runtime
加载的,这时候类结构已经确定下来了,并且这里保存成员变量的内存是只读的。
元类
上面已经提到,类对象的 isa
中储存的地址指向的就算类对象的类,称之为元类,元类储存着对象方法。也就是说实例方法是储存在类中的,类方法是存储在元类中的。用一个经典的图来表示对象、类和元类的关系。
图中已经很好的阐述了三者之间的关系,不过这里需要强调两点。
- 元类的
isa
指向的是基类的元类。 - 基类的元类的
superclass
指向的是基类
这两个点很容易被忽略,在一些面试题中经常出现。
网友评论