美文网首页iOS面试资料搜集
iOS底层总结- Category底层原理

iOS底层总结- Category底层原理

作者: 6ffd6634d577 | 来源:发表于2019-07-25 14:09 被阅读0次

    问题

    1. Category的实现原理,以及Category为什么只能加方法不能加属性。
    2. Category中有load方法吗?load方法是什么时候调用的?load 方法能继承吗?
    3. load、initialize的区别,以及它们在category重写的时候的调用的次序。
    4. Catagory_t存储的方法,属性,协议等是如何加载到类对象中的?

    1、Category简介

    category是Objective-C 2.0之后添加的语言特性,category的主要作用是为已经存在的类添加方法。除此之外,apple还推荐了category的另外两个使用场景

    • 可以把类的实现分开在几个不同的文件里面。这样做有几个显而易见的好处,
      a)可以减少单个文件的体积
      b)可以把不同的功能组织到不同的category里
      c)可以由多个开发者共同完成一个类
      d)可以按需加载想要的category 等等。
    • 声明私有方法

    不过除了apple推荐的使用场景,广大开发者脑洞大开,还衍生出了category的其他几个使用场景:

    • 模拟多继承
    • 把framework的私有方法公开

    Objective-C的这个语言特性对于纯动态语言来说可能不算什么,比如javascript,你可以随时为一个“类”或者对象添加任意方法和实例变量。但是对于不是那么“动态”的语言而言,这确实是一个了不起的特性。

    2、连类比事-category和extension

    extension看起来很像一个匿名的category,但是extension和有名字的category几乎完全是两个东西。 extension在编译期决议,它就是类的一部分,在编译期和头文件里的@interface以及实现文件里的@implement一起形成一个完整的类,它伴随类的产生而产生,亦随之一起消亡。extension一般用来隐藏类的私有信息,你必须有一个类的源码才能为一个类添加extension,所以你无法为系统的类比如NSString添加extension。(详见2

    但是category则完全不一样,它是在运行期决议的。 就category和extension的区别来看,我们可以推导出一个明显的事实,extension可以添加实例变量,而category是无法添加实例变量的(因为在运行期,对象的内存布局已经确定,如果添加实例变量就会破坏类的内部布局,这对编译型语言来说是灾难性的)。

    3、挑灯细览-category真面目

    我们知道,所有的OC类和对象,在runtime层都是用struct表示的,category也不例外,在runtime层,category用结构体category_t(在objc-runtime-new.h中可以找到此定义),iOS上关于Runtime的源码其实就是objc4,我们在objc4源码上能看到最新版本为objc-750,它包含了:

    • 1)、类的名字(name)
    • 2)、类(cls)
    • 3)、category中所有给类添加的实例方法的列表(instanceMethods)
    • 4)、category中所有添加的类方法的列表(classMethods)
    • 5)、category实现的所有协议的列表(protocols)
    • 6)、category中添加的所有属性(instanceProperties)
    struct category_t {
        const char *name;
        classref_t cls;
        struct method_list_t *instanceMethods;
        struct method_list_t *classMethods;
        struct protocol_list_t *protocols;
        struct property_list_t *instanceProperties;
    
        method_list_t *methodsForMeta(bool isMeta) {
            if (isMeta) return classMethods;
            else return instanceMethods;
        }
    
        property_list_t *propertiesForMeta(bool isMeta) {
            if (isMeta) return nil; // classProperties;
            else return instanceProperties;
        }
    };
    

    从category的定义也可以看出category的可为(可以添加实例方法,类方法,甚至可以实现协议,添加属性)和不可为(无法添加实例变量)。

    我们先去写一个category看一下category到底为何物:
    MyClass.h:

    #import <Foundation/Foundation.h>
    
    @interface MyClass : NSObject
    
    - (void)printName;
    
    @end
    
    @interface MyClass(MyAddition)
    
    @property(nonatomic, copy) NSString *name;
    
    - (void)printName;
    
    @end
    

    MyClass.m:

    #import "MyClass.h"
    
    @implementation MyClass
    
    - (void)printName
    {
        NSLog(@"%@",@"MyClass");
    }
    
    @end
    
    @implementation MyClass(MyAddition)
    
    - (void)printName
    {
        NSLog(@"%@",@"MyAddition");
    }
    
    @end
    

    我们使用clang的命令去看看category到底会变成什么:

    xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc  MyClass.m
    

    好吧,我们得到了一个1.6M大小,3w多行的.cpp文件,我们忽略掉所有和我们无关的东西,在文件的最后,我们找到了如下代码片段

    static struct /*_method_list_t*/ {
        unsigned int entsize;  // sizeof(struct _objc_method)
        unsigned int method_count;
        struct _objc_method method_list[1];
    } _OBJC_$_CATEGORY_INSTANCE_METHODS_MyClass_$_MyAddition __attribute__ ((used, section ("__DATA,__objc_const"))) = {
        sizeof(_objc_method),
        1,
        {{(struct objc_selector *)"printName", "v16@0:8", (void *)_I_MyClass_MyAddition_printName}}
    };
    
    
    static struct /*_prop_list_t*/ {
        unsigned int entsize;  // sizeof(struct _prop_t)
        unsigned int count_of_properties;
        struct _prop_t prop_list[1];
    } _OBJC_$_PROP_LIST_MyClass_$_MyAddition __attribute__ ((used, section ("__DATA,__objc_const"))) = {
        sizeof(_prop_t),
        1,
        {{"name","T@\"NSString\",C,N"}}
    };
    
    extern "C" __declspec(dllexport) struct _class_t OBJC_CLASS_$_MyClass;
    
    static struct _category_t _OBJC_$_CATEGORY_MyClass_$_MyAddition __attribute__ ((used, section ("__DATA,__objc_const"))) =
    {
    "MyClass",
    0, // &OBJC_CLASS_$_MyClass,
    (const struct _method_list_t *)&_OBJC_$_CATEGORY_INSTANCE_METHODS_MyClass_$_MyAddition,
    0,
    0,
    (const struct _prop_list_t *)&_OBJC_$_PROP_LIST_MyClass_$_MyAddition,
    };
    static void OBJC_CATEGORY_SETUP_$_MyClass_$_MyAddition(void ) {
    _OBJC_$_CATEGORY_MyClass_$_MyAddition.cls = &OBJC_CLASS_$_MyClass;
    }
    #pragma section(".objc_inithooks$B", long, read, write)
    __declspec(allocate(".objc_inithooks$B")) static void *OBJC_CATEGORY_SETUP[] = {
    (void *)&OBJC_CATEGORY_SETUP_$_MyClass_$_MyAddition,
    };
    static struct _class_t *L_OBJC_LABEL_CLASS_$ [1] __attribute__((used, section ("__DATA, __objc_classlist,regular,no_dead_strip")))= {
    &OBJC_CLASS_$_MyClass,
    };
    static struct _class_t *_OBJC_LABEL_NONLAZY_CLASS_$[] = {
    &OBJC_CLASS_$_MyClass,
    };
    static struct _category_t *L_OBJC_LABEL_CATEGORY_$ [1] __attribute__((used, section ("__DATA, __objc_catlist,regular,no_dead_strip")))= {
    &_OBJC_$_CATEGORY_MyClass_$_MyAddition,
    };
    

    我们可以看到,

    1)、首先编译器生成了实例方法列表OBJC$_CATEGORY_INSTANCE_METHODS_MyClass$_MyAddition和属性列表OBJC$_PROP_LIST_MyClass$_MyAddition,两者的命名都遵循了公共前缀+类名+category名字的命名方式,而且实例方法列表里面填充的正是我们在MyAddition这个category里面写的方法printName,而属性列表里面填充的也正是我们在MyAddition里添加的name属性。还有一个需要注意到的事实就是category的名字用来给各种列表以及后面的category结构体本身命名,而且有static来修饰,所以在同一个编译单元里我们的category名不能重复,否则会出现编译错误
    2)、其次,编译器生成了category本身OBJC$_CATEGORY_MyClass$_MyAddition,并用前面生成的列表来初始化category本身。
    3)、最后,编译器在DATA段下的objc_catlist section里保存了一个大小为1的category_t的数组L_OBJC_LABELCATEGORY$(当然,如果有多个category,会生成对应长度的数组_),用于运行期category的加载。

    到这里,编译器的工作就接近尾声了,对于category在运行期怎么加载,我们下节揭晓。

    4、追本溯源-category如何加载

    我们知道,Objective-C的运行是依赖OC的runtime的,而OC的runtime和其他系统库一样,是OS X和iOS通过dyld动态加载的

    想了解更多dyld地同学可以移步这里(3)。

    对于OC运行时,入口方法如下(在objc-os.mm文件中):

    void _objc_init(void)
    {
        static bool initialized = false;
        if (initialized) return;
        initialized = true;
        
        // fixme defer initialization until an objc-using image is found?
        environ_init();
        tls_init();
        static_init();
        lock_init();
        exception_init();
    
        _dyld_objc_notify_register(&map_images, load_images, unmap_image);
    }
    

    category被附加到类上面是在map_images的时候发生的,在new-ABI的标准下,_objc_init里面的调用的map_images最终会调用objc-runtime-new.mm里面的_read_images方法,而在_read_images方法的结尾,有以下的代码片段:

    // Realize newly-resolved future classes, in case CF manipulates them
        if (resolvedFutureClasses) {
            for (i = 0; i < resolvedFutureClassCount; i++) {
                realizeClass(resolvedFutureClasses[i]);
                resolvedFutureClasses[i]->setInstancesRequireRawIsa(false/*inherited*/);
            }
            free(resolvedFutureClasses);
        }    
    
        ts.log("IMAGE TIMES: realize future classes");
    

    进入核心函数 realizeClass

    static Class realizeClass(Class cls)
    {
        runtimeLock.assertLocked();
    
        const class_ro_t *ro;
        class_rw_t *rw;
        Class supercls;
        Class metacls;
        bool isMeta;
    
        if (!cls) return nil;
        if (cls->isRealized()) return cls;
        assert(cls == remapClass(cls));
    
        // fixme verify class is not in an un-dlopened part of the shared cache?
    
        ro = (const class_ro_t *)cls->data();   //⚠️⚠️⚠️ class_rw_t 强制转换为 class_ro_t 指针
        if (ro->flags & RO_FUTURE) {
            // This was a future class. rw data is already allocated.
            rw = cls->data();  //⚠️⚠️⚠️如果rw已经分配了内存,则rw指向cls->data(),然后将rw的ro指针指向之前最开始的ro
            ro = cls->data()->ro;
            cls->changeInfo(RW_REALIZED|RW_REALIZING, RW_FUTURE);
        } else {
            // Normal class. Allocate writeable class data.     //⚠️⚠️⚠️如果rw还没有分配内存
            rw = (class_rw_t *)calloc(sizeof(class_rw_t), 1);    //⚠️⚠️⚠️给rw分配内存
            rw->ro = ro;
            rw->flags = RW_REALIZED|RW_REALIZING;
            cls->setData(rw);    //⚠️⚠️⚠️调整类的data()
        }
    
        isMeta = ro->flags & RO_META;
        ...
        ...
        
            // Attach categories   
        methodizeClass(cls);     //⚠️⚠️⚠️⚠️⚠️⚠️附加
    
        return cls;
    }
    

    在加载 ObjC 运行时的过程中在 realizeClass 方法中:

    1. 从 class_data_bits_t 调用 data 方法,将结果从 class_rw_t 强制转换为 class_ro_t 指针
    2. 初始化一个 class_rw_t 结构体
    3. 设置结构体 ro 的值以及 flag
    4. 最后设置正确的 data。
    image.png

    但是,在这段代码运行之后 class_rw_t 中的方法,属性以及协议列表均为空。这时需要realizeClass 调用 methodizeClass 方法来将类自己实现的方法(包括分类)、属性和遵循的协议加载到 methods、 properties 和 protocols 列表中,我们去看下methodizeClass

    static void methodizeClass(Class cls)
    {
        runtimeLock.assertLocked();
    
        bool isMeta = cls->isMetaClass();
        auto rw = cls->data();
        auto ro = rw->ro;
    
        // Methodizing for the first time
        if (PrintConnecting) {
            _objc_inform("CLASS: methodizing class '%s' %s", 
                         cls->nameForLogging(), isMeta ? "(meta)" : "");
        }
    
        // Install methods and properties that the class implements itself.
         //⚠️⚠️⚠️⚠️⚠️⚠️rw找到ro取出里面的baseMethods、baseProperties、baseProtocols,
        //⚠️⚠️⚠️⚠️⚠️⚠️添加到rw对应的methods、properties、protocols中
    
        method_list_t *list = ro->baseMethods();
        if (list) {
            prepareMethodLists(cls, &list, 1, YES, isBundleClass(cls));
            rw->methods.attachLists(&list, 1);   
        }
    
        property_list_t *proplist = ro->baseProperties;
        if (proplist) {
            rw->properties.attachLists(&proplist, 1);   
        }
    
        protocol_list_t *protolist = ro->baseProtocols;
        if (protolist) {
            rw->protocols.attachLists(&protolist, 1);    
        }
        
            // Attach categories.    //⚠️⚠️⚠️⚠️⚠️⚠️取出未添加过的分类内容添加进来
        category_list *cats = unattachedCategoriesForClass(cls, true /*realizing*/);
        attachCategories(cls, cats, false /*don't flush caches*/);
        ...
        ...
    }
    

    从上述源码中可以看出,从rw找到ro取出里面的baseMethods、baseProperties、baseProtocols,添加到rw对应的methods、properties、protocols中。最后取出未添加过的分类内容添加进来。关于怎么将分类方法添加进来的,即 attachCategories 函数的具体实现,

    // ⚠️⚠️⚠️⚠️⚠️⚠️获取到Category的Protocol list、Property list、Method list,
    //⚠️⚠️⚠️⚠️⚠️⚠️然后通过attachLists函数添加到所属的类中
    static void 
    attachCategories(Class cls, category_list *cats, bool flush_caches)
    {
        if (!cats) return;
        if (PrintReplacedMethods) printReplacements(cls, cats);
    
        bool isMeta = cls->isMetaClass();
    
        //⚠️⚠️⚠️⚠️⚠️⚠️按照Category个数,分配对应的内存空间
        // fixme rearrange to remove these intermediate allocations
        method_list_t **mlists = (method_list_t **)
            malloc(cats->count * sizeof(*mlists));
        property_list_t **proplists = (property_list_t **)
            malloc(cats->count * sizeof(*proplists));
        protocol_list_t **protolists = (protocol_list_t **)
            malloc(cats->count * sizeof(*protolists));
    
        // Count backwards through cats to get newest categories first
        int mcount = 0;
        int propcount = 0;
        int protocount = 0;
        int i = cats->count;
        bool fromBundle = NO;
    
         //⚠️⚠️⚠️⚠️⚠️⚠️ 循环查找出Protocol list、Property list、Method list
        while (i--) {
            auto& entry = cats->list[i];
    
            method_list_t *mlist = entry.cat->methodsForMeta(isMeta);
            if (mlist) {
                mlists[mcount++] = mlist;
                fromBundle |= entry.hi->isBundle();
            }
    
            property_list_t *proplist = 
                entry.cat->propertiesForMeta(isMeta, entry.hi);
            if (proplist) {
                proplists[propcount++] = proplist;
            }
    
            protocol_list_t *protolist = entry.cat->protocols;
            if (protolist) {
                protolists[protocount++] = protolist;
            }
        }
    
        auto rw = cls->data();
        
        // ⚠️⚠️⚠️⚠️⚠️⚠️执行添加操作
        prepareMethodLists(cls, mlists, mcount, NO, fromBundle);
        rw->methods.attachLists(mlists, mcount);
        free(mlists);
        if (flush_caches  &&  mcount > 0) flushCaches(cls);
    
        rw->properties.attachLists(proplists, propcount);
        free(proplists);
    
        rw->protocols.attachLists(protolists, protocount);
        free(protolists);
    }
    

    attachLists 函数的具体实现

    image.png

    上述源代码中有两个重要的数组
    array()->lists: 类对象原来的方法列表,属性列表,协议列表。
    addedLists:传入所有分类的方法列表,属性列表,协议列表。
    attachLists函数中最重要的两个方法为 memmove 内存移动和 memcpy 内存拷贝。

    经过memmove和memcpy方法之后,分类的方法,属性,协议列表被放在了类对象中原本存储的方法,属性,协议列表前面。

    需要注意的有两点:

    1)、category的方法没有“完全替换掉”原来类已经有的方法,也就是说如果category和原来类都有methodA,那么category附加完成之后,类的方法列表里会有两个methodA

    2)、category的方法被放到了新方法列表的前面,而原来类的方法被放到了新方法列表的后面,这也就是我们平常所说的category的方法会“覆盖”掉原来类的同名方法,这是因为运行时在查找方法的时候是顺着方法列表的顺序查找的,它只要一找到对应名字的方法,就会罢休_,殊不知后面可能还有一样名字的方法。

    5、旁枝末叶-category和+load方法

    我们知道,在类和category中都可以有+load方法,那么有两个问题:

    1)、在类的+load方法调用的时候,我们可以调用category中声明的方法么?
    2)、这么些个+load方法,调用顺序是咋样的呢? 鉴于上述几节我们看的代码太多了,对于这两个问题我们先来看一点直观的:

    image.png

    我们的代码里有MyClass和MyClass的两个category (Category1和Category2),MyClass和两个category都添加了+load方法,并且Category1和Category2都写了MyClass的printName方法。 在Xcode中点击Edit Scheme,添加如下两个环境变量(可以在执行load方法以及加载category的时候打印log信息,更多的环境变量选项可参见objc-private.h):


    image.png

    运行项目,我们会看到控制台打印很多东西出来,我们只找到我们想要的信息,顺序如下:

    objc[1187]: REPLACED: -[MyClass printName] by category Category1 
    objc[1187]: REPLACED: -[MyClass printName] by category Category2 . . . 
    
    objc[1187]: LOAD: class ‘MyClass’ scheduled for +load 
    objc[1187]: LOAD: category ‘MyClass(Category1)’ scheduled for +load 
    objc[1187]: LOAD: category ‘MyClass(Category2)’ scheduled for +load 
    objc[1187]: LOAD: +[MyClass load] . . . 
    
    objc[1187]: LOAD: +[MyClass(Category1) load] . . . 
    objc[1187]: LOAD: +[MyClass(Category2) load]
    

    所以,对于上面两个问题,答案是很明显的:
    1)、可以调用,因为附加category到类的工作会先于+load方法的执行
    2)、+load的执行顺序是先类,后category,而category的+load执行顺序是根据编译顺序决定的。 目前的编译顺序是这样的:

    image.png

    我们调整一个Category1和Category2的编译顺序,run。我们可以看到控制台的输出顺序变了:


    image.png
    objc[1187]: REPLACED: -[MyClass printName] by category Category2 
    objc[1187]: REPLACED: -[MyClass printName] by category Category1 . . . 
    
    objc[1187]: LOAD: class ‘MyClass’ scheduled for +load 
    objc[1187]: LOAD: category ‘MyClass(Category2)’ scheduled for +load 
    objc[1187]: LOAD: category ‘MyClass(Category1)’ scheduled for +load 
    
    objc[1187]: LOAD: +[MyClass load] . . . 
    objc[1187]: LOAD: +[MyClass(Category2) load] . . . 
    objc[1187]: LOAD: +[MyClass(Category1) load]
    

    虽然对于+load的执行顺序是这样,但是对于“覆盖”掉的方法,则会先找到最后一个编译的category里的对应方法。 这一节我们只是用很直观的方式得到了问题的答案,有兴趣的同学可以继续去研究一下OC的运行时代码。

    问:load、initialize的区别,以及它们在category重写的时候的调用的次序。

    答:区别在于调用方式和调用时刻
    调用方式:load是根据函数地址直接调用,initialize是通过objc_msgSend调用
    调用时刻:load是runtime加载类、分类的时候调用(只会调用1次),initialize是类第一次接收到消息的时候调用,每一个类只会initialize一次(父类的initialize方法可能会被调用多次)
    调用顺序:先调用类的load方法,先编译那个类,就先调用load。在调用load之前会先调用父类的load方法。分类中load方法不会覆盖本类的load方法,先编译的分类优先调用load方法。initialize先初始化父类,之后再初始化子类。如果子类没有实现+initialize,会调用父类的+initialize(所以父类的+initialize可能会被调用多次),如果分类实现了+initialize,就覆盖类本身的+initialize调用。

    6、触类旁通-category和方法覆盖

    鉴于上面几节我们已经把原理都讲了,这一节只有一个问题:

    怎么调用到原来类中被category覆盖掉的方法? 对于这个问题,我们已经知道category其实并不是完全替换掉原来类的同名方法,只是category在方法列表的前面而已,所以我们只要顺着方法列表找到最后一个对应名字的方法,就可以调用原来类的方法:

    Class currentClass = [MyClass class];
    MyClass *my = [[MyClass alloc] init];
    
    if (currentClass) {
        unsigned int methodCount;
        Method *methodList = class_copyMethodList(currentClass, &methodCount);
        IMP lastImp = NULL;
        SEL lastSel = NULL;
        for (NSInteger i = 0; i < methodCount; i++) {
            Method method = methodList[i];
            NSString *methodName = [NSString stringWithCString:sel_getName(method_getName(method)) 
                                            encoding:NSUTF8StringEncoding];
            if ([@"printName" isEqualToString:methodName]) {
                lastImp = method_getImplementation(method);
                lastSel = method_getName(method);
            }
        }
        typedef void (*fn)(id,SEL);
        
        if (lastImp != NULL) {
            fn f = (fn)lastImp;
            f(my,lastSel);
        }
        free(methodList);
    }
    

    7、更上一层-category和关联对象

    如上所见,我们知道在category里面是无法为category添加实例变量的。但是我们很多时候需要在category中添加和对象关联的值,这个时候可以求助关联对象来实现。

    但是关联对象又是存在什么地方呢? 如何存储? 对象销毁时候如何处理关联对象呢?

    而在对象的销毁逻辑里面,见objc-runtime-new.mm:

    /***********************************************************************
    * objc_destructInstance
    * Destroys an instance without freeing memory. 
    * Calls C++ destructors.
    * Calls ARC ivar cleanup.
    * Removes associative references.
    * Returns `obj`. Does nothing if `obj` is nil.
    **********************************************************************/
    void *objc_destructInstance(id obj) 
    {
        if (obj) {
            // Read all of the flags at once for performance.
            bool cxx = obj->hasCxxDtor();
            bool assoc = obj->hasAssociatedObjects();
    
            // This order is important.
            if (cxx) object_cxxDestruct(obj);
            if (assoc) _object_remove_assocations(obj);
            obj->clearDeallocating();
        }
    
        return obj;
    }
    

    嗯,runtime的销毁对象函数objc_destructInstance里面会判断这个对象有没有关联对象,如果有,会调用_object_remove_assocations做关联对象的清理工作。

    iOS底层总结 - 关联对象底层原理

    后记

    正如侯捷先生所讲-“源码面前,了无秘密”,Apple的Cocoa Touch框架虽然并不开源,但是Objective-C的runtime和Core Foundation却是完全开放源码的可以下载到全部的开源代码

    参考文章
    深入理解Objective-C:Category

    相关文章

      网友评论

        本文标题:iOS底层总结- Category底层原理

        本文链接:https://www.haomeiwen.com/subject/rtjcrctx.html