Runtime源码剖析-对象
预备知识
- 如果大家对联合体、位域相关知识不够熟悉的话,请参考联合体+位域
Clang
什么是Clang
Clang
是一个C语言
、C++
、Objective-C
语言的轻量级编译器。源代码发布于BSD
协议下。Clang
将支持其普通lambda
表达式、返回类型的简化处理以及更好的处理constexpr
关键字。Clang
是一个有Apple主导编写,基于LLVM
的C/C++/Objective-C/Objective-C++
编译器。
- 简单来说就是一个编译器,可以把我们写的
OC
代码,编译成C++
代码。便于观察底层逻辑。
终端编译命令
- 首先需要在
main.m
文件中,创建一个Person
类,然后在main
函数中,创建一个对象
@interface Person : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation Person
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
Person *person1 = [[Person alloc] init];
}
return 0;
}
- 然后使用
clang
命令,把.m
文件转换成.cpp
文件
// 1. 通过clang命令
clang -rewrite-objc main.m -o main.cpp
// 编译引入 UIKit的文件
// UIKit报错
clang -x objective-c -rewrite-objc -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator.sdk main.m
// 2. xcode安装的时候顺带安装了xcrun命令,xcrun命令在clang的基础上进行了一些封装,要更好用一些
// 模拟器编译
xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
// 真机编译
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp
- 执行完后,会在对应目录下生成
.cpp
文件
对象
对象结构
- 打开
.cpp
文件,我们想要知道对象的结构,于是我们先去寻找main
方法,因为在oc中,我们在这个方法中创建了一个Person
对象。
int main(int argc, const char * argv[]) {
/* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
Person *person1 = ((Person *(*)(id, SEL))(void *)objc_msgSend)((id)((Person *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("Person"), sel_registerName("alloc")), sel_registerName("init"));
}
return 0;
}
- 然后我们发现最终创建了一个
Person
类型的指针,引用着Person
对象。接着我们去查询Person
的定义
#ifndef _REWRITER_typedef_Person
#define _REWRITER_typedef_Person
typedef struct objc_object Person;
typedef struct {} _objc_exc_Person;
#endif
- 发现其实
Person
对象,就是一个objc_object
类型的结构体,我们接着去查询objc_object
的定义
typedef struct objc_class *Class;
struct objc_object {
Class _Nonnull isa __attribute__((deprecated));
};
- 这个时候发现,原来它内部包含了一个
Class
类型的指针,也就是说Person
对象内部只有一个指针。本以为我们已经接近真相了,突然发现__attribute__((deprecated))
这个标识符,通过查询它表示该变量已经被废弃。也就是说其实objc_object
内部是空的什么也没有。我们现在已经得知对象就是一个struct objc_object
类型的结构体,现在想要知道它内部是怎么实现的。这个时候通过苹果开源的OBJC4
源码中,去查找对应的结构。
struct objc_object
struct objc_object {
private:
isa_t isa;
public:
// 此处省略方法
};
- 可以看到除了一些公开方法外,只有一个成员变量,类型为
isa_t
的变量
isa_t
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
uintptr_t bits;
private:
Class cls;
public:
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
// 省略此处方法
#endif
// 省略此处方法
};
- 此处
isa_t
是一个联合体,如果对这一块知识不够数序的,可以查看本文预备知识联合体+位域 - 它一共有两个成员变量
bits
和cls
,共同占用这一段内存空间,由于它们是互斥的,同时只能使用其中一个变量 -
isa_t
中还有一个结构体,其中ISA_BITFIELD
位域信息,表述了bits
的每一位的信息。所以本质上isa_t
是一个联合体位域。下面我们看一下具体位域信息
ISA_BITFIELD
- 点击这个宏,你发现它对应两个版本。一个是
__arm64__
(iOS真机+模拟器),一个是__x86_64__
(macOS)。这里我们就选择arm64
真机版本来查看
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
# define ISA_HAS_CXX_DTOR_BIT 1
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t unused : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 19
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
- 下面我们看一下具体的存储地址
- 各变量的含义:
-
nonpointer
:表示是否对isa
指针进行优化,0
表示纯指针,1
表示不止是类对象的地址,isa中包含了类信息、对象、引用计数等 -
has_assoc
:关联对象标志位,0
表示未关联,1
表示关联 -
has_cxx_dtor
:该对象是否C ++
或者Objc
的析构器,如果有析构函数,则需要做析构逻辑,没有,则释放对象 -
shiftcls
:储存类指针的值,开启指针优化的情况下,在arm64
架构中有33
位用来存储类指针,x86_64
架构中占44
位 -
magic
:用于调试器判断当前对象是真的对象
还是没有初始化
的空间 -
weakly_referenced
:指对象是否被指向或者曾经指向一个ARC
的弱变量,没有弱引用的对象可以更快释放 -
deallocating
:标志对象是否正在释放 -
has_sidetable_rc
:当对象引用计数大于10
时,则需要借用该变量存储进位 -
extra_rc
:表示该对象的引用计数值,实际上引用计数值减1
,例如,如果对象的引用计数为10
,那么extra_rc
为9
,如果大于10
,就需要用到上面的has_sidetable_rc
-
总结
-
isa_t
分为nonpointer
类型和非nonpointer
。非nonpointer
类型只是一个纯指针,nonpointer
还包含了类的信息。什么是nonpointer
和非nonpointer
,参考Non-pointer isa -
isa_t
是联合体
+位域
的方式存储信息的。采用这种方式的有点就是节省大量内存
。通过位域的方式,可以在isa
上面存储更多相关信息,内存得到充分的利用
Isa_t初始流程
- 在Runtime源码剖析-alloc我们讲到
alloc
主要干了三件事,最后一件事就是把开辟的内存和类联系起来,具体就是通过initInstanceIsa
达到这个目的。下面我们就来看看具体这个方法做了什么操作。
initInstanceIsa
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
- 该方法中调用了
initIsa
方法
initIsa
inline void
objc_object::initIsa(Class cls, bool nonpointer, UNUSED_WITHOUT_INDEXED_ISA_AND_DTOR_BIT bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
isa_t newisa(0);
if (!nonpointer) {
newisa.setClass(cls, this);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
# if ISA_HAS_CXX_DTOR_BIT
newisa.has_cxx_dtor = hasCxxDtor;
# endif
newisa.setClass(cls, this);
#endif
newisa.extra_rc = 1;
}
isa = newisa;
}
-
在这个方法里面,首先判断是否是
nonpointer
,如不是的话,说明isa_t
就是一个指针,直接把把类地址传给他。如果是的话,说明isa_t
是一个联合体位域,里面不仅仅包含类地址,还有一些别的信息。 -
接着我们遇到一个宏定义
SUPPORT_INDEXED_ISA
,简单来说就是watch
手表使用的架构,则该宏定义为1,其他架构为0。具体该宏的定义可以查看此篇文章SUPPORT_INDEXED_ISA -
由于我们研究的目的是在iOS上应用,所以此处宏定义为0,我们走下面这块代码
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
# if ISA_HAS_CXX_DTOR_BIT
newisa.has_cxx_dtor = hasCxxDtor;
# endif
newisa.setClass(cls, this);
#endif
newisa.extra_rc = 1;
- 可以发现我们初始化就只有4步了,由于这里是在mac平台下的调试,所以这里以
__x86_64__
平台下isa_t
位域来进行初始化,arm64
初始化结构类似。
newisa.bits
- 我们来看看
ISA_MAGIC_VALUE
的定义
#define ISA_MAGIC_VALUE 0x001d800000000001ULL
二进制表示:11101100000000000000000000000000000000000000000000001
- 我们转换成二进制数据,然后看一下哪些属性对应的位域被这行代码初始化了(标记为红色)
- 从图中了解到,在使用
ISA_MAGIC_VALUE
设置isa_t
结构体之后,实际上只是设置了nonpointer
以及magic
这两部分的值。 -
magic
的值为0x3b
用于调试器判断当前对象是真的对象还是没有初始化的空间
newisa.has_cxx_dtor
-
has_cxx_dtor
表示当前对象有 C++ 或者 ObjC 的析构器(destructor
),如果有析构器就会快速释放内存。
newisa.setClass
- 这一步主要是把类的地址存下来
inline void
isa_t::setClass(Class newCls, UNUSED_WITHOUT_PTRAUTH objc_object *obj)
{
// Match the conditional in isa.h.
#if __has_feature(ptrauth_calls) || TARGET_OS_SIMULATOR
# if ISA_SIGNING_SIGN_MODE == ISA_SIGNING_SIGN_NONE
// No signing, just use the raw pointer.
uintptr_t signedCls = (uintptr_t)newCls;
# elif ISA_SIGNING_SIGN_MODE == ISA_SIGNING_SIGN_ONLY_SWIFT
// We're only signing Swift classes. Non-Swift classes just use
// the raw pointer
uintptr_t signedCls = (uintptr_t)newCls;
if (newCls->isSwiftStable())
signedCls = (uintptr_t)ptrauth_sign_unauthenticated((void *)newCls, ISA_SIGNING_KEY, ptrauth_blend_discriminator(obj, ISA_SIGNING_DISCRIMINATOR));
# elif ISA_SIGNING_SIGN_MODE == ISA_SIGNING_SIGN_ALL
// We're signing everything
uintptr_t signedCls = (uintptr_t)ptrauth_sign_unauthenticated((void *)newCls, ISA_SIGNING_KEY, ptrauth_blend_discriminator(obj, ISA_SIGNING_DISCRIMINATOR));
# else
# error Unknown isa signing mode.
# endif
shiftcls_and_sig = signedCls >> 3;
#elif SUPPORT_INDEXED_ISA
// Indexed isa only uses this method to set a raw pointer class.
// Setting an indexed class is handled separately.
cls = newCls;
#else // Nonpointer isa, no ptrauth
shiftcls = (uintptr_t)newCls >> 3;
#endif
}
- 通过断点调试,可知最终走的是
shiftcls = (uintptr_t)newCls >> 3;
- 这里为什么需要把类的地址右移三位?
-
MACH_VM_MAX_ADDRESS
表示虚拟内存最大寻址
空间,在__arm64__
中MACH_VM_MAX_ADDRESS
=0x1000000000
虚拟内存最大寻址
空间是36
位。在__x86_64__
中MACH_VM_MAX_ADDRESS
=0x7fffffe00000
虚拟内存最大寻址
空间是47
位。 - 字节对齐是
8字节
对齐,也就是说指针的地址只能是8
的倍数,那么指针地址的后3位
只能是0
- 为了节省内存空间,把
后3位
是0
抹去
-
- 地址填进去后,位域变化如下
newisa.extra_rc
- 表示该对象的引用计数为1
网友评论