GCD之dispatch_once源码剖析

作者: Scott丶Wang | 来源:发表于2018-03-07 13:45 被阅读28次

    本文使用的源码是libdispatch-187.10版本
    至于为啥是这个版本,因为这一版的实现相对来说比较直观、阅读性较佳,但是也存在一个问题就是后续可能会有更新(至少是出于效率上的考虑)我们并不知晓,看完了这个觉得自己已经窥得真知,那就看最新版本吧,对比不同版本之间的差异,了解其中的原委。最新版本为libdispatch-913.30.4版本

    只考虑单一线程来看dispatch_once的作用没什么意义,只有多线程考虑到线程安全的时候才能真正体现出它的优势。

    废话少说,直接上源码:

    once.h

    /*!
     * @typedef dispatch_once_t
     * predicate需要先初始化为0,static和global变量创建出来即有默认值0
     */
    typedef long dispatch_once_t;
    
    /*!
     * @function dispatch_once
     */
    void dispatch_once(dispatch_once_t *predicate, dispatch_block_t block);
    
    void dispatch_once(dispatch_once_t *predicate, dispatch_block_t block) 
    {
        if (DISPATCH_EXPECT(*predicate, ~0l) != ~0l) {
            dispatch_once(predicate, block);
        }
    }
    void dispatch_once_f(dispatch_once_t *predicate, void *context,
            dispatch_function_t function)
    {
        // __builtin_expect((x), (v))
        if (DISPATCH_EXPECT(*predicate, ~0l) != ~0l) {
            dispatch_once_f(predicate, context, function);
        }
    }
    

    头文件中用到一个DISPATCH_EXPECT宏,这个宏展开之后其实是一个GCC内置函数__builtin_expect(exp, c),在GCC手册上是这样描述这个函数的:由于大部分程序员在分支预测方面做得很糟糕,所以 GCC 提供了这个内建函数来帮助程序员处理分支预测,优化程序。其第一个参数 exp 为一个整型表达式,这个内建函数的返回值也是这个 exp ,而 c 为一个编译期常量。这个函数的语义是:你期望 exp 表达式的值等于常量 c ,从而 GCC 为你优化程序,将符合这个条件的分支放在合适的地方

    once.m

    struct _dispatch_once_waiter_s {
        volatile struct _dispatch_once_waiter_s *volatile dow_next;//链表下一个节点
        _dispatch_thread_semaphore_t dow_sema;// 信号量
    };
    
    #define DISPATCH_ONCE_DONE ((struct _dispatch_once_waiter_s *)~0l)
    
    void dispatch_once(dispatch_once_t *val, dispatch_block_t block)
    {
         dispatch_once_f(val, block, _dispatch_Block_invoke(block));
    }
    
    void dispatch_once_f(dispatch_once_t *val, void *ctxt, dispatch_function_t func)
    {
        // volatileg关键字编辑的变量vval,告诉编译器此指针指向的值随时可能被其他线程改变,从而使得编译器不对此指针进行代码编译优化。
        // 指针的最大的作用就是间接的改变变量的值
        struct _dispatch_once_waiter_s * volatile *vval = (struct _dispatch_once_waiter_s **)val;
        
        // 初始化一个结构体
        struct _dispatch_once_waiter_s dow = {NULL, 0};
        
        // 声明辅助变量
        struct _dispatch_once_waiter_s *tail, *tmp;
        
        // 声明信号变量
        // uintptr_t sema
        _dispatch_thread_semaphore_t sema;
    
        // 内置函数 原子比较交换函数 __sync_bool_compare_and_swap
        // 判断vval与NULL是否相等,如果相等就返回YES,并将&dow的值赋给vval
        // 当dispatch_once第一次执行时,predicate也即val为0,地址并不为NULL,但是将0转成链表的时候vval为NULL,那么此“原子比较交换函数”将返回YES并将vval指向值赋值为&dow,即为“等待中”,_dispatch_client_callout其内部做了一些判定,但实际上是调用了func而已。到此,block中的用户代码执行完毕。
        // #1
        if (dispatch_atomic_cmpxchg(vval, NULL, &dow)) {
            dispatch_atomic_acquire_barrier();//这是一个空的宏函数,大概是注释的作用吧
            
            // 其实质是执行block
            _dispatch_client_callout(ctxt, func);
            
            // cpuid指令等待,使得其他线程的【读取到未初始化值的】预执行能被判定为猜测未命中,从而使得这些线程能够进入dispatch_once_f里的另一个分支从而进行等待
            dispatch_atomic_maximally_synchronizing_barrier();
            
            dispatch_atomic_release_barrier(); //这是一个空的宏函数,大概是注释的作用吧
            
            // dispatch_atomic_xchg 其将第二个参数的值赋给第一个参数(解引用指针),然后返回第一个参数被赋值前的解引用值:
            // vval = &dow;
            // old = vval;
            // vval = DISPATCH_ONCE_DONE;// 置block完成标记,是置成NULL吗
            // tmp = old;
            tmp = dispatch_atomic_xchg(vval, DISPATCH_ONCE_DONE);
            
            tail = &dow;
            
            // tmp = 旧的vval = dow
            // vval = dow;
            // 接下来是对信号量链的处理:
            // 1.在block执行过程中,没有其他线程进入本函数来等待,则vval指向值保持为&dow,即tmp被赋值为&dow,即下方while循环不会被执行,此分支结束。
            // 2.在block执行过程中,有其他线程进入本函数来等待进入另一个分支,那么会构造一个信号量链表(vval指向值变为信号量链的头部,链表的尾部为&dow),此时就会当前分支进入while循环,在此while循环中,遍历链表,逐个signal每个信号量,然后结束循环。
            while (tail != tmp) {
                while (!tmp->dow_next) {
                    // 此句是为了提示cpu减少额外处理,提升性能,节省电力。
                    _dispatch_hardware_pause();
                }
                sema = tmp->dow_sema;
                tmp = (struct _dispatch_once_waiter_s*)tmp->dow_next;
                _dispatch_thread_semaphore_signal(sema);
            }
        } else {
            // #2
            // 当执行block分支#1未完成,且有线程再进入本函数时,将进入线程等待分支:
            // 先调用_dispatch_get_thread_semaphore创建一个信号量,此信号量被赋值给dow.dow_sema。
            // 然后进入一个无限for循环,假如发现vval的指向值已经为DISPATCH_ONCE_DONE,即“完成”,则直接break,然后调用_dispatch_put_thread_semaphore函数销毁信号量并退出函数
            // _dispatch_get_thread_semaphore内部使用的是“有即取用,无即创建”策略来获取信号量。
            dow.dow_sema = _dispatch_get_thread_semaphore();
            
            // 然后进入一个无限for循环
            for (;;) {
                tmp = *vval;
                // 假如发现vval的指向值已经为DISPATCH_ONCE_DONE,即“完成”,则直接break
                // 然后调用_dispatch_put_thread_semaphore函数销毁信号量并退出函数。
                if (tmp == DISPATCH_ONCE_DONE) {
                    break;
                }
                dispatch_atomic_store_barrier();// 注释作用
                
                /*
                 假如vval的解引用值并非DISPATCH_ONCE_DONE,则进行一个“原子比较并交换”操作(此操作可以避免两个等待线程同时操作链表带来的问题)
                 假如此时vval指向值已不再是tmp(这种情况发生在多个线程同时进入线程等待分支#2,并交错修改链表)则for循环重新开始,再尝试重新获取一次vval来进行同样的操作;若指向值还是tmp,则将vval的指向值赋值为&dow,此时val->dow_next值为NULL,可能会使得block执行分支#1进行while等待(如前述),紧接着执行dow.dow_next = tmp这句来增加链表节点(同时也使得block执行分支#1的while等待结束),然后等待在信号量上,当block执行分支#1完成并遍历链表来signal时,唤醒、释放信号量,然后一切就完成了。
                 */
                // 此操作可以避免两个等待线程同时操作链表带来的问题
                // 判断vval与tmp是否相等,如果相等就返回YES,并将&dow的值赋给vval
                if (dispatch_atomic_cmpxchg(vval, tmp, &dow)) {
                    dow.dow_next = tmp;
                    _dispatch_thread_semaphore_wait(dow.dow_sema);
                }
            }
            // _dispatch_put_thread_semaphore内部使用的是“销毁旧的,存储新的”策略来缓存信号量
            _dispatch_put_thread_semaphore(dow.dow_sema);
        }
    }
    
    // 在这里_dispatch_Block_invoke()宏的定义如下
    #define _dispatch_Block_invoke(bb) \
            ((dispatch_function_t)((struct Block_layout *)bb)->invoke)
    
    block内存布局.jpg
    
    struct Block_descriptor {
        unsigned long int reserved;
        unsigned long int size;
        void (*copy)(void *dst, void *src);
        void (*dispose)(void *);
    };
    
    struct Block_layout {
        void *isa;
        int flags;
        int reserved;
        void (*invoke)(void *, ...);
        struct Block_descriptor *descriptor;
        /* Imported variables. */
    };
    
    

    isa指针:指向表明该block类型的类。
    flags:按bit位表示一些block的附加信息,比如判断block类型、判断block引用计数、判断block是否需要执行辅助函数等。
    reserved:保留变量,我的理解是表示block内部的变量数。
    invoke:函数指针,指向具体的block实现的函数调用地址。
    descriptor:block的附加描述信息,比如保留变量数、block的大小、进行copy或dispose的辅助函数指针。
    variables:因为block有闭包性,所以可以访问block外部的局部变量。这些variables就是复制到结构体中的外部局部变量或变量的地址。

    dispatch_once.png
    最后盗用一张深入浅出GCD之dispatch_once里面的示意图来做一个总结,看完这张图我想对dispatch_once会有更深的了解。

    参考资料:
    __builtin_expect 解惑
    深入浅出GCD之dispatch_once

    相关文章

      网友评论

        本文标题:GCD之dispatch_once源码剖析

        本文链接:https://www.haomeiwen.com/subject/jysjfftx.html