Runtime源码 —— 方法加载的过程

作者: Haven_ZN | 来源:发表于2017-02-14 16:30 被阅读712次

在上一篇文章中分析过类的结构体，是这个样子的：

struct objc_class : objc_object {
    Class superclass;
    cache_t cache;             // formerly cache pointer and vtable
    class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags
}

那一篇主要是分析isa的源码，这些字段并没有深究，这一篇就来深入研究一下。我还是会先对源码进行分析，再结合例子进行验证。

从字面上来看，前两个字段的意思是很容易理解的：

Class superclass
父类的指针。
cache_t cache;
一个缓存，官方文档注释写明了用于缓存指针和虚表。但这个缓存是如何起作用在后续的文章中再讲。

下面就来重点看一看这个不太看得懂的字段：

class_data_bits_t bits
注释中讲了这个字段实际上就是class_rw_t *加上自定义的rr/alloc标志，rr/alloc标志是指含有这些方法：retain/release/autorelease/retainCount/alloc等。

那么就来看看class_rw_t这个结构体：

struct class_rw_t {
    // Be warned that Symbolication knows the layout of this structure.
    uint32_t flags;
    uint32_t version;

    const class_ro_t *ro;

    method_array_t methods;
    property_array_t properties;
    protocol_array_t protocols;
    Class firstSubclass;
    Class nextSiblingClass;
    char *demangledName;
}

除开明显的方法，属性，协议等字段，这个结构体中有一个奇怪的字段，const class_ro_t *ro;这个结构体是这样定义的：

struct class_ro_t {
    uint32_t flags;
    uint32_t instanceStart;
    uint32_t instanceSize;
    uint32_t reserved;
    const uint8_t * ivarLayout;
    const char * name;
    method_list_t * baseMethodList;
    protocol_list_t * baseProtocols;
    const ivar_list_t * ivars;
    const uint8_t * weakIvarLayout;
    property_list_t *baseProperties;
}

感觉这两个结构体还是比较类似的，这时候合理猜测一下，rw应该是指readwrite，ro是指readonly。也就是说在可读可写的结构体中存放了一个只读的结构体，而且这两个结构体很相似。

结合oc是一门动态语言再猜测一下，class_ro_t是不是存放在编译期就确定的信息，class_rw_t用来存放在运行期添加的信息呢?只能通过代码来验证一下。

注：这里面还有一些很关键的字段，比如instanceStart，instanceSize。本文不做扩展。

例子

首先把之前的TestObject扩展一下，添加一个hello方法：

// TestObject.h
#import <Foundation/Foundation.h>
@interface TestObject : NSObject

- (void)hello;

@end

// TestObject.m
#import "TestObject.h"
@implementation TestObject

- (void)hello {
    NSLog(@"hello");
}

@end

接着获取一下TestObject在内存中的地址：

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSLog(@"%p", [TestObject class]);
    }
    return 0;
}

输出：0x100001168

只要代码不变，这个类在内存中的地址就不会变

这个时候在void _objc_init(void)添加一个断点：

1.png

然后利用上面的地址就可以看一看这个时候class_ro_t的内容。

(lldb) p (objc_class *)0x100001168
(objc_class *) $0 = 0x0000000100001168
// 根据objc_class的结构，isa:8字节，superclass:8字节，cache:16字节
// 所以偏移32字节来获取class_data_bits_t
(lldb) p (class_data_bits_t *)0x100001188
(class_data_bits_t *) $1 = 0x0000000100001188
(lldb) p $1->data()
(class_rw_t *) $2 = 0x00000001000010e8
// 在这个时候，class_rw_t实际上是class_ro_t，后面会验证
(lldb) p (class_ro_t *)$2
(class_ro_t *) $3 = 0x00000001000010e8
(lldb) p *$3
(class_ro_t) $4 = {
  flags = 128
  instanceStart = 8
  instanceSize = 8
  reserved = 0
  ivarLayout = 0x0000000000000000 <no value available>
  name = 0x0000000100000f99 "TestObject"
  baseMethodList = 0x00000001000010c8
  baseProtocols = 0x0000000000000000
  ivars = 0x0000000000000000
  weakIvarLayout = 0x0000000000000000 <no value available>
  baseProperties = 0x0000000000000000
}

可以看到class_ro_t结构体中name和baseMethodList已经有内容了，可以打印一下看看是不是TestObject类中的hello方法：

(lldb) p $4.baseMethodList
(method_list_t *) $5 = 0x00000001000010c8
(lldb) p $5->get(0)
(method_t) $6 = {
  name = "hello"
  types = 0x0000000100000fb0 "v16@0:8"
  imp = 0x0000000100000eb0 (debug-objc`-[TestObject hello] at TestObject.m:13)
}

没有问题，从name可以看出就是hello方法。method_t结构体也非常简单：

struct method_t {
    SEL name;
    const char *types;
    IMP imp;
}

types那一串乱七八糟的字符串可以参考苹果的文档：Type Encodings

扯远了，刚刚验证了在编译期，类的相关信息会存放到class_ro_t中，那么看看运行期是如何把信息添加到class_rw_t中的。这时候就需要看看这个方法了：static Class realizeClass(Class cls)

为什么会突然跳到这个方法，中间过程有些复杂，概括来说就是在研究void _objc_init(void)方法时，通过这么个路径（省略函数签名）map_2_images() -> map_images_nolock() -> _read_images() -> realizeClass()，看到了这个方法，主要是看到了这个方法的注释：

* realizeClass
* Performs first-time initialization on class cls, 
* including allocating its read-write data.
* Returns the real class structure for the class. 
* Locking: runtimeLock must be write-locked by the caller

这里面提到的read-write data指的就是class_rw_t了，当然实际方法的调用栈并不是上面的路径。在realizeClass方法中添加一个断点：

2.png

左侧可以看到方法的调用栈，切换到4那一步：

3.png
可以看到是因为在main函数中打印log时调用了class方法，才一步步进入了realizeClass方法。

猜测：某个类的realizeClass方法是在类被首次调用的时候才会调用。

关于方法的调用，或者说是消息的转发，并不是本文的重点，下一篇讲消息转发机制的时候再具体说。下面看看realizeClass方法是如何实现的：

static Class realizeClass(Class cls)
{
    const class_ro_t *ro;
    class_rw_t *rw;
    ...
    ro = (const class_ro_t *)cls->data();
    // Normal class. Allocate writeable class data.
    rw = (class_rw_t *)calloc(sizeof(class_rw_t), 1);
    rw->ro = ro;
    rw->flags = RW_REALIZED|RW_REALIZING;
    cls->setData(rw);
    ...
    methodizeClass(cls);

    return cls;
}

删掉了不少代码，只看关键部分，首先看到这一步：

ro = (const class_ro_t *)cls->data();
验证了之前我们的猜想，在这个时候，class_rw_t实际上class_ro_t，所以有这一步强转。
rw->ro = ro;
把ro赋值给rw中的ro字段
cls->setData(rw);
最后把rw赋值回去，这一步完成之后rw和ro就被正确的设置了，但rw中的方法、属性、协议列表还是空的。
methodizeClass(cls);
这一步会把ro中的方法、属性、协议拷贝到rw中。另外会把此类所有的category中附加的方法、属性、协议也拷贝进去。oc之所以能在运行时做各种事情，其实都是基于runtime的这些支持。

看看关键的methodizeClass(cls)方法是如何实现的：

static void methodizeClass(Class cls)
{
    bool isMeta = cls->isMetaClass();
    auto rw = cls->data();
    auto ro = rw->ro;

    // Install methods and properties that the class implements itself.
    method_list_t *list = ro->baseMethods();
    if (list) {
        prepareMethodLists(cls, &list, 1, YES, isBundleClass(cls));
        rw->methods.attachLists(&list, 1);
    }

    property_list_t *proplist = ro->baseProperties;
    if (proplist) {
        rw->properties.attachLists(&proplist, 1);
    }

    protocol_list_t *protolist = ro->baseProtocols;
    if (protolist) {
        rw->protocols.attachLists(&protolist, 1);
    }

    // Root classes get bonus method implementations if they don't have 
    // them already. These apply before category replacements.
    if (cls->isRootMetaclass()) {
        // root metaclass
        addMethod(cls, SEL_initialize, (IMP)&objc_noop_imp, "", NO);
    }

    // Attach categories.
    category_list *cats = unattachedCategoriesForClass(cls, true /*realizing*/);
    attachCategories(cls, cats, false /*don't flush caches*/);
}

这个方法结构还是很清楚的，就是通过attachLists()方法把ro中的内容拷贝到了rw中，最后通过attachCategories()方法把分类中的内容也添加进去，这里就不再深挖了。

在methodizeClass()方法结束后，rw中的方法、属性、协议就有内容了，用代码验证一下：

(lldb) p (objc_class *)0x100001168
(objc_class *) $5 = 0x0000000100001168
(lldb) p (class_data_bits_t *)0x100001188
(class_data_bits_t *) $6 = 0x0000000100001188
(lldb) p $6->data()
(class_rw_t *) $7 = 0x00000001008022e0
// 之前在这里强转成class_ro_t，现在这个时候已经不需要了，直接获取属性
(lldb) p $7->methods
(method_array_t) $8 = {
  list_array_tt<method_t, method_list_t> = {
     = {
      list = 0x00000001000010c8
      arrayAndFlag = 4294971592
    }
  }
}
// method_array_t结构体中有如下的方法来获取method_list_t的二维数组
(lldb) p $8.beginCategoryMethodLists()[0][0]
(method_list_t) $9 = {
  entsize_list_tt<method_t, method_list_t, 3> = {
    entsizeAndFlags = 26
    count = 1
    first = {
      name = "hello"
      types = 0x0000000100000fb0 "v16@0:8"
      imp = 0x0000000100000eb0 (debug-objc`-[TestObject hello] at TestObject.m:13)
    }
  }
}

可以看到这个时候hello方法已经存在了。

总结

在编译期，类的相关方法，属性，协议会被添加到class_ro_t这个只读的结构体中。
在运行期，类第一次被调用的时候，class_rw_t会被初始化，category中的内容也是在这个时候被添加进来的。
最开始的猜测不完全正确，class_rw_t不仅仅用来存放运行时添加的信息，编译期确定下来的信息也会被拷贝进去。

Runtime源码 —— 方法加载的过程

例子

总结

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

iOS小记

OC进化

错误日志博客

iOS学习笔记

iOS进阶指南

iOS Developer