美文网首页底层原理
iOS底层之objc_msgSend快速查找流程

iOS底层之objc_msgSend快速查找流程

作者: K哥的贼船 | 来源:发表于2020-09-28 00:46 被阅读0次

    iOS底层之cache_t探究分析了方法写入缓存的流程。类似于数据库的增删改查,那么在调用方法的时候,在写入缓存之前,也先执行查找缓存的过程。下面我们来分析objc_msgSend消息发送过程中是怎么查找方法缓存的。
    首先,我们先了解下Runtime的机制。

    Runtime

    Runtime,顾名思义,即运行时,区别于编译时。

    • 编译时:就是正在编译的时。 而编译,就是编译器把
      源代码翻译成机器能识别的代码(实际上可能只是翻译成某个中间状态的语言)。编译时,做了一些检查、翻译的工作。会检查你的关键字、词法、语法,如果发现了错误,就会编译不通过,提示错误信息。这个过程也会进行静态类型分析,这时候只是扫描代码而已,并没有真正放到内存中运行,也不存在分配内存。
    • 运行时:将代码运行起来,装载到内存中去。而运行时做的类型检查就跟编译时类型检查(静态类型检查)不一样,不是简单的扫描代码,会将其运行在内存中做些判断和操作。例如我们通过使用performSelector给对象发送执行方法选择器的消息的方式,就是运行时的操作。

    Runtime的使用方式有三种:

    1. Objective-C,例如[person eat];,类的实例对象调用方法;
    2. 通过框架和接口引入,比如isKindOf
    3. 通过Runtime API,比如class_getInstanceSize

    其层级可以表示为


    也就是Runtime通过编译层到底层库,比如alloc方法是通过发送消息在LLVM编译阶段以objc_alloc实现的。

    OC运行时

    #import <Foundation/Foundation.h>
    #import <objc/message.h>
    
    @interface BKPerson : NSObject
    - (void)sayHello;
    @end
    
    @implementation BKPerson
    - (void)sayHello{
        NSLog(@"Hello!");
    }
    @end
    
    @interface Man : BKPerson
    - (void)sayHello;
    - (void)sayBye;
    @end
    
    @implementation Man
    - (void)sayBye{
        NSLog(@"88");
    }
    @end
    

    定义两个类,Man继承于BKPerson
    将下列方法Clang编译成.cpp文件,可以看到

    Man *man = [Man alloc];
    [man sayBye];
    [man sayHello];
    //.cpp
    Man *man = ((Man *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("Man"), sel_registerName("alloc"));
    ((void (*)(id, SEL))(void *)objc_msgSend)((id)man, sel_registerName("sayBye"));
    ((void (*)(id, SEL))(void *)objc_msgSend)((id)man, sel_registerName("sayHello"));
    

    可以发现,实例对象调用方法,本质是通过objc_msgSend实现的。

    为了验证这个发现。以objc_msgSend方法方式来调用[man sayBye]

    Man *man = [Man alloc];
    objc_msgSend(man, sel_registerName("sayBye"));
    [man sayBye];
    

    打印如下,两种方式打印的结果一致,验证成功。


    拓展:
    1、调用objc_msgSend,需要导入头文件#import <objc/message.h>
    2、使用obc_msgSend方法时,编译器会有参数错误警告。 需要将target -->Build Setting -->搜索msg -- 将enable strict checking of obc_msgSend callsYES 改为NO,将严厉的检查机制关掉。

    实例方法调用机制初探

    @interface BKPerson : NSObject
    - (void)sayHello;
    @end
    
    @implementation BKPerson
    - (void)sayHello{
        NSLog(@"Hello!");
    }
    @end
    
    @interface Man : BKPerson
    - (void)sayHello;
    - (void)sayBye;
    @end
    
    @implementation Man
    - (void)sayBye{
        NSLog(@"88");
    }
    

    上面的代码,Man继承自BKPersonBKPerson实现了sayHello方法,Man却没有实现sayHello方法。
    消息的接收者都是Man的实例对象,分别使用OC对象调用和C语言API调用的方式:

    1. OC中对象调用:
    Man *man = [Man alloc];
    BKPerson *person = [BKPerson alloc];
    [man sayHello];
    
    1. 直接调用底层CAPI
    struct objc_super mansuper;
    mansuper.receiver = man;
    mansuper.super_class = [BKPerson class];
    objc_msgSendSuper(&mansuper, sel_registerName("sayHello"));
    

    objc_msgSendSuper的定义:

    OBJC_EXPORT id _Nullable
    objc_msgSendSuper(struct objc_super * _Nonnull super, SEL _Nonnull op, ...)
        OBJC_AVAILABLE(10.0, 2.0, 9.0, 1.0, 2.0);
    
    struct objc_super {
        /// Specifies an instance of a class.
        __unsafe_unretained _Nonnull id receiver;
    
        /// Specifies the particular superclass of the instance to message. 
    #if !defined(__cplusplus)  &&  !__OBJC2__
        /* For compatibility with old objc-runtime.h header */
        __unsafe_unretained _Nonnull Class class;
    #else
        __unsafe_unretained _Nonnull Class super_class;
    #endif
        /* super_class is the first class to search */
    };
    

    __OBJC2__需要指定receiversuper_class

    执行打印结果:


    Man并没有实现sayHello,却不会崩溃,而且两种方式都打印出了方法里的信息。猜测原因在于其父类实现了sayHello
    那么可猜想,类的实例方法调用的查找是会向父类查找。而方法调用是本质是objc_msgSend发送消息,那么它是怎么通过调用的方法编号sel找到imp函数地址指针,从而找到函数内容的呢?
    带着这个疑惑我们来查看objc_msgSend的流程。

    objc_msgSend快速查找流程

    首先要知道objc_msgSend是通过汇编语言写的,区别于C/C++实现的源码,优势是汇编快,由于方法查找是经常发生的高频率的事务,所以如果能提高一点点速度,那么在运行中进程的量级上是一个质的飞跃。另外一点是为了实现参数的不确定性(动态性),而C/C++大多使用静态方法,要实现动态性则麻烦得多。
    objc_msgSend消息的接收者是对象,对象和方法的关系是:对象 ->ISA -> 类(元类)-> cache_t -> methodList

    第一步.获取isa的类信息
    objc4-781源码中,搜索objc_msgSend,在arm64.s后缀的文件中查找objc_msgSend汇编实现。入口函数为

    其汇编实现如下:

        //消息发送汇编入口:这一步主要获取isa类信息
        ENTRY _objc_msgSend
        //无窗口化
        UNWIND _objc_msgSend, NoFrame
        //p0存放是objc_msgSend的第一个参数-消息接收者receiver,receiver和空对比,判断消息接收者是否存在
        cmp p0, #0          // nil check and tagged pointer check
    //是否支持小对象类型,在arm64架构下,恒为true
    #if SUPPORT_TAGGED_POINTERS
        //1.支持则走小对象流程
        b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
    #else
        //0.不支持则返回空
        b.eq    LReturnZero
    #endif
        //p13存放isa
        ldr p13, [x0]       // p13 = isa
        //从p13的isa中获取class,放在p16
        GetClassFromIsa_p16 p13     // p16 = class
    LGetIsaDone://获取isa完毕
        // calls imp or objc_msgSend_uncached
        //开始从缓存中获取imp地址(CacheLookup方法参数为NORMAL)
        CacheLookup NORMAL, _objc_msgSend
    
    #if SUPPORT_TAGGED_POINTERS
    LNilOrTagged://小对象流程
        //判断为空则返回空
        b.eq    LReturnZero     // nil check
    
        // tagged
        adrp    x10, _objc_debug_taggedpointer_classes@PAGE
        add x10, x10, _objc_debug_taggedpointer_classes@PAGEOFF
        ubfx    x11, x0, #60, #4
        ldr x16, [x10, x11, LSL #3]
        adrp    x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGE
        add x10, x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGEOFF
        cmp x10, x16
        b.ne    LGetIsaDone
    
        // ext tagged
        adrp    x10, _objc_debug_taggedpointer_ext_classes@PAGE
        add x10, x10, _objc_debug_taggedpointer_ext_classes@PAGEOFF
        ubfx    x11, x0, #52, #8
        ldr x16, [x10, x11, LSL #3]
        b   LGetIsaDone
    // SUPPORT_TAGGED_POINTERS
    #endif
    
    LReturnZero:
        // x0 is already zero
        mov x1, #0
        movi    d0, #0
        movi    d1, #0
        movi    d2, #0
        movi    d3, #0
        ret
    
        END_ENTRY _objc_msgSend
    

    GetClassFromIsa_p16获取类信息的汇编实现:

    .macro GetClassFromIsa_p16 /* src */
    //是否支持INDEXED_ISA
    #if SUPPORT_INDEXED_ISA 
    //# if  __ARM_ARCH_7K__ >= 2  ||  (__arm64__ && !__LP64__)
        // 仅支持armv7k or arm64_32
        // Indexed isa
        //将isa指针存入p16
        mov p16, $0         // optimistically set dst = src
        //判断是否是 nonapointer isa
        tbz p16, #ISA_INDEX_IS_NPI_BIT, 1f  // done if not non-pointer isa
        // isa in p16 is indexed
        //将_objc_indexed_classes所在页的基址 读入x10寄存器
        adrp    x10, _objc_indexed_classes@PAGE
        //x10 = x10 + _objc_indexed_classes(偏移量),对x10基址根据偏移量进行内存偏移
        add x10, x10, _objc_indexed_classes@PAGEOFF
        //将p16的isa从第ISA_INDEX_SHIFT位(第2位)开始,提取 ISA_INDEX_BITS 位(15位) 到 p16寄存器,剩余的高位用0补充
        ubfx    p16, p16, #ISA_INDEX_SHIFT, #ISA_INDEX_BITS  // extract index
        ldr p16, [x10, p16, UXTP #PTRSHIFT] // load class from array
    1:
    
    //arm64架构64位处理器
    #elif __LP64__
        // 64-bit packed isa
        //p16的isa & ISA_MASK 得到class存到p16
        and p16, $0, #ISA_MASK
    
    #else
        // 32-bit raw isa
        mov p16, $0
    
    #endif
    
    .endmacro
    

    主要流程是:

    • 获取isa指针,判断是否为空,空则返回。
    • 非空时判断是否支持tagged pointer小对象类型,支持则走小对象流程。不支持则返回空。
    • 之后获取isa中的类信息。通过isa & ISA_MASK 获取bitsshiftcls位域的类信息class

    第二步.CacheLookup查找缓存

    #define CACHE            (2 * __SIZEOF_POINTER__)
    
    .macro CacheLookup
        //
        // Restart protocol:
        //
        //   As soon as we're past the LLookupStart$1 label we may have loaded
        //   an invalid cache pointer or mask.
        //
        //   When task_restartable_ranges_synchronize() is called,
        //   (or when a signal hits us) before we're past LLookupEnd$1,
        //   then our PC will be reset to LLookupRecover$1 which forcefully
        //   jumps to the cache-miss codepath which have the following
        //   requirements:
        //
        //   GETIMP:
        //     The cache-miss is just returning NULL (setting x0 to 0)
        //
        //   NORMAL and LOOKUP:
        //   - x0 contains the receiver
        //   - x1 contains the selector
        //   - x16 contains the isa
        //   - other registers are set as per calling conventions
        //
    LLookupStart$1:
    
        // p1 = SEL, p16 = isa
        //从isa平移16字节到cache_t
        ldr p11, [x16, #CACHE]              // p11 = mask|buckets
    
    #if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
        //p11 & 0x0000ffffffffffff 取出buckets放在p10
        and p10, p11, #0x0000ffffffffffff   // p10 = buckets
        //将p11右移48位,得出mask,p1(_cmd) & mask取出了缓存的下标 放在p12
        and p12, p1, p11, LSR #48       // x12 = _cmd & mask
    #elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
        and p10, p11, #~0xf         // p10 = buckets
        and p11, p11, #0xf          // p11 = maskShift
        mov p12, #0xffff
        lsr p11, p12, p11               // p11 = mask = 0xffff >> p11
        and p12, p1, p11                // x12 = _cmd & mask
    #else
    #error Unsupported cache mask storage for ARM64.
    #endif
    
        //buckets首地址平移 _cmd下标 * 1<<4(16),得到所在bucket,放在p12
        add p12, p10, p12, LSL #(1+PTRSHIFT)
                         // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))
        //从p12拿到imp、sel,存入p17、p9
        ldp p17, p9, [x12]      // {imp, sel} = *bucket
        //比较p9上的sel是否等于p1的cmd
    1:  cmp p9, p1          // if (bucket->sel != _cmd)
        //如果不相等,则跳到2f
        b.ne    2f          //     scan more
        //相等,则缓存命中,返回imp
        CacheHit $0         // call or return imp
        
        //2f:如果没有命中就走到这里
    2:  // not hit: p12 = not-hit bucket
        //判断bucket的sel是否为空,空则返回空
        CheckMiss $0            // miss if bucket->sel == 0
        //比较p12的bucket和p10的buckets的首地址,也就是第一个bucket,也就是判断当前的bucket是否是第一个
        cmp p12, p10        // wrap if bucket == buckets
        //相等,则跳转第三步
        b.eq    3f
        //从p12的地址向前平移一个bucket的size,得到的bucket的imp和sel分别存入p17,p9
        ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
        //重复第一步,对比sel和cmd
        b   1b          // loop
    
    //如果计算的下标是在第一个,则执行第三步
    3:  // wrap: p12 = first bucket, w11 = mask
    #if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
        //p11(mask|buckets)右移44位,相当于mask左移4位,也就是mask * 16, 而mask是buckets最后一个元素的下标,16为存储着sel和imp的bucket的size,这一步相当于将地址平移到最后一个bucket,将该bucket存储于p12,缓存查找顺序是向前查找
        add p12, p12, p11, LSR #(48 - (1+PTRSHIFT))
                        // p12 = buckets + (mask << 1+PTRSHIFT)
    #elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
        add p12, p12, p11, LSL #(1+PTRSHIFT)
                        // p12 = buckets + (mask << 1+PTRSHIFT)
    #else
    #error Unsupported cache mask storage for ARM64.
    #endif
    
        // Clone scanning loop to miss instead of hang when cache is corrupt.
        // The slow path may detect any corruption and halt later.
    
        //将最后的bucket的imp、sel分别放在p17、p9
        ldp p17, p9, [x12]      // {imp, sel} = *bucket
    //--- 比较p9的sel和传入参数cmd是否一致
    1:  cmp p9, p1          // if (bucket->sel != _cmd)
        //--- 不一致则跳到步骤2f(继续往前查找)
        b.ne    2f          //     scan more
        //--- 一致则命中,返回imp
        CacheHit $0         // call or return imp
        
    2:  // not hit: p12 = not-hit bucket
        //--- 如果从最后一个元素遍历过来,还是找不到就CheckMiss
        CheckMiss $0            // miss if bucket->sel == 0
        //--- 比较p12和第一个bucket p10 是否一致,也就是判断是否是当前比较的是第一个bucket了,再往前已经没有了
        cmp p12, p10        // wrap if bucket == buckets
        //--- 如果是第一个,则跳到3f
        b.eq    3f
        //--- 不是第一个,则向前平移BUCKET_SIZE,找前一个bucket,imp、sel分别放入p17,p9
        ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
        //--- 返回第一步,继续对比sel和cmd
        b   1b          // loop
    
    LLookupEnd$1:
    LLookupRecover$1:
    3:  // double wrap
    //--- 跳转到jumpMiss,因为是normal,跳转至__objc_msgSend_uncached,表示缓存没找到
        JumpMiss $0
    
    .endmacro
    
    // 以下是跳转的函数
    // CacheHit: x17 = cached IMP, x12 = address of cached IMP, x1 = SEL, x16 = isa
    .macro CacheHit
    .if $0 == NORMAL
        TailCallCachedImp x17, x12, x1, x16 // authenticate and call imp
    .elseif $0 == GETIMP
        mov p0, p17
        cbz p0, 9f          // don't ptrauth a nil imp
        AuthAndResignAsIMP x0, x12, x1, x16 // authenticate imp and re-sign as IMP
    9:  ret             // return IMP
    .elseif $0 == LOOKUP
        // No nil check for ptrauth: the caller would crash anyway when they
        // jump to a nil IMP. We don't care if that jump also fails ptrauth.
        AuthAndResignAsIMP x17, x12, x1, x16    // authenticate imp and re-sign as IMP
        ret             // return imp via x17
    .else
    .abort oops
    .endif
    .endmacro
    
    .macro CheckMiss
        // miss if bucket->sel == 0
    //--- $0:传入的第一个参数,也就是方法执行的类型,根据不同的类型,执行不同指令
    .if $0 == GETIMP
        cbz p9, LGetImpMiss
    .elseif $0 == NORMAL
        cbz p9, __objc_msgSend_uncached
    .elseif $0 == LOOKUP
        cbz p9, __objc_msgLookup_uncached
    .else
    .abort oops
    .endif
    .endmacro
    
    .macro JumpMiss
    .if $0 == GETIMP
        b   LGetImpMiss
    .elseif $0 == NORMAL
        b   __objc_msgSend_uncached
    .elseif $0 == LOOKUP
        b   __objc_msgLookup_uncached
    .else
    .abort oops
    .endif
    .endmacro
    

    这一步是查找缓存,CacheLookup传入的类型为normal64位处理器下的主要流程为:

    1. isa平移16字节获取到cache_tcache_t的首地址存放着 mask|buckets(32位处理器是buckets),放在一个8字节,将mask|buckets & 0x0000ffffffffffff得到了bucketsmask|buckets右移48位,得到mask,通过cmd & mask取出了缓存bucket的下标,cmd(sel) & mask的算法是在方法缓存的时候计算哈希下标的算法,所以查找缓存也是用这个算法。
    static inline mask_t cache_hash(SEL sel, mask_t mask) 
    {
        return (mask_t)(uintptr_t)sel & mask;
    }
    

    buckets + ((_cmd & mask) << (1+PTRSHIFT))buckets首地址平移下标*16,算出所在的下标的bucket。因为selimp各占8字节,也就是一个bucketsize16字节。这样得到了bucketimpsel

    • 步骤1:比较这个bucketsel是否等于我们传入的cmd,如果不相等,则跳到步骤2,相等则缓存命中,返回bucketimp
    • 步骤2:判断当前bucketsel是否为空,空就返回空,表示这个方法没有缓存。非空,则判断bucket是不是第一个bucket,是第一个则跳转到步骤3,否则将bucket向前平移一个BUCKET_SIZE,找前面的一个bucket,返回执行步骤1。
    • 步骤3:如果是第一个bucket,将mask|buckets右移44位,相当于mask左移4位,也就是mask * 16, 而maskbuckets最后一个元素的下标,16为存储着selimpbucketsize,这一步相当于将地址平移到最后一个bucket,获得最后一个bucketselimp,这步骤3里也分了3个分支。
    1. 注意这里是双层嵌套,下面是第二层
    • 步骤3分支1:比较这个bucketsel是不是等于传入的cmd,不一致跳到分支2,一致则缓存命中,返回imp。
    • 步骤3分支2:如果是从最后一个元素遍历过来的,当前bucketsel0,也就是这个槽没有缓存,则执行CheckMiss,因为是NORMAL类型,所以__objc_msgSend_uncached,表示找不到缓存。如果sel不是0,判断这个bucket是不是第一个bucket,是的话就跳转到分支3,不是第一个,那么向前平移16字节获取前面一个bucket,获取它的selimp,返回执行分支1。
    • 步骤3分支3:跳转到jumpMiss,因为是NORMAL,跳转至__objc_msgSend_uncached,表示缓存没找到。

    如果经历CacheLookup后没找到缓存,则会开始慢速查找,从methodList查找。

    整个快速查找流程图:


    objc_msgSend快速查找流程

    相关文章

      网友评论

        本文标题:iOS底层之objc_msgSend快速查找流程

        本文链接:https://www.haomeiwen.com/subject/yxqnyktx.html