美文网首页iOSiOS高级开发iOS专题
iOS源码解析:Block的本质<一>

iOS源码解析:Block的本质<一>

作者: 雪山飞狐_91ae | 来源:发表于2018-08-13 21:48 被阅读297次

    Block在iOS开发中的用途非常广,今天我们就来一起探索一下Block的底层结构。

    1. Block的底层结构

    下面是一个没有参数和返回值的简单的Block:

    int main(int argc, char * argv[]) {
        @autoreleasepool {
            
            void (^block)(void) = ^{
                
                NSLog(@"Hello World!");
            };
            
            block();
            
            return 0;
        }
    }
    

    为了探索Block的底层结构,我们将main.m文件转化为C++的源码、我们打开命令行。cd到包含main.m文件的文件夹,然后输入:clang -rewrite-objc main.m,这个时候在该文件夹的目录下会生成main.cpp文件。
    这个文件非常长,我们直接拉到文件的最下面,找到main函数:

    int main(int argc, char * argv[]) {
        /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
             //定义block
            void (*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
             //调用block
            ((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
    
            return 0;
        }
    }
    

    这第一行代码是定义一个block变量,第二行代码是调用block。这两行代码看起来非常复杂。但是我们可以去简化一下,怎么简化呢?

    变量前面的()一般是做强制类型转换的,比如在调用block这一行,block前面有一个()是(__block_impl *),这就是进行了一个强制类型转换,将其转换为一个_block_impl类型的结构体指针,那像这样的强制类型转换非常妨碍我们理解代码,我们可以暂时将这些强制类型转换去掉,这样可以帮助我们理解代码。

    化简后的代码如下:

    //定义block
    void (*block)(void) = &__main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA);
    //调用block
    block->FuncPtr(block);
    

    这样化简后的代码就要清爽多了。我们一句一句的看,先看第一句:

    void (*block)(void) = &__main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA);
    

    这句代码的意思好像就是调用_main_block_impl_0这个函数,给这个函数传进两个参数_main_block_func_0&_main_block_desc_0_DATA,然后得到这个函数的返回值,取函数返回值的地址,赋值给block这个指针。
    我们在稍微上一点的位置可以找到_main_block_impl_0这个结构:

    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
    //构造函数,类似于OC的init方法
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    

    __block_impl这个结构体的结构我们可以command+f在main.cpp文件中搜索得到:

    struct __block_impl {
      void *isa;
      int Flags;
      int Reserved;
      void *FuncPtr;
    };
    

    _main_block_desc_0结构体的结构在main.cpp文件的最下面可以找到:

    static struct __main_block_desc_0 {
      size_t reserved;
      size_t Block_size;
    } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
    

    这是一个C++的结构体。而且在这个结构体内还包含一个函数,这个函数的函数名和结构体名称一致,这在C语言中是没有的,这是C++特有的。

    在C++的结构体包含的函数称为结构体的构造函数,它就相当于是OC中的init方法,用来初始化结构体。OC中的init方法返回的是对象本身,C++的结构体中的构造方法返回的也是结构体对象。

    那么我们就知道了,__main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA);返回的就是_main_block_impl_0这个结构体对象,然后取结构体对象的地址赋值给block指针。换句话说,block指向的就是初始化后的_main_block_impl_0结构体对象。
    我们再看一下初始化_main_block_impl_0结构体传进去的参数:

    • 第一个参数是_main_block_func_0,这个参数的结构在上面一点的位置也能找到:
    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
    
    
      NSLog((NSString *)&__NSConstantStringImpl__var_folders_74_wk04zv690mz36wn0g18r5nxm0000gn_T_main_3b803f_mi_0);
     }
    

    这个函数其实就是把我们Block中要执行的代码封装到这个函数内部了。我们可以看到这个函数内部就一行代码,就是一个NSlog函数,这也就是NSLog(@"Hello World!");这句代码。
    把这个函数指针传给_main_block_impl_0的构造函数的第一个参数,然后用这个函数指针去初始化_main_block_impl_0这个结构体的第一个成员变量impl的成员变量FuncPtr。也就是说FuncPtr这个指针指向_main_block_func_0这个函数。

    • 第二个参数是&_main_block_desc_0_DATA
      我们看一下这个结构:
    static struct __main_block_desc_0 {
      size_t reserved;
      size_t Block_size;
    } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
    

    在结构体的构造函数中,0赋值给了reserved,sizeof(struct __main_block_impl_0)是赋值给了Block_size,可以看出这个结构体存放的是_main_block_impl_0这个结构体的信息。在_main_block_impl_0的构造函数中我们可以看到,_main_block_desc_0这个结构体的地址被赋值给了_main_block_impl_0的第二个成员变量Desc这个结构体指针。也就是说Desc这个结构体指针指向_main_block_desc_0_DATA这个结构体。
    那么我们总结一下:

    EC36EEA6-C31A-46F5-91A1-B5684A788213.png
    所以第一句定义block
    void (*block)(void) = &__main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA);
    

    总结起来就是:

    • 1.创建一个函数_main_block_func_0,这个函数
      的作用就是将我们block中要执行的代码封装到函数内部,方便调用。
    • 2.创建一个结构体_main_block_desc_0,这个结构体中主要包含_main_block_impl_0这个结构体占用的存储空间大小等信息。
    • 3.将1中创建的_main_block_func_0这个函数的地址,和2中创建的_main_block_desc_0这个结构体的地址传给_main_block_impl_0的构造函数。
    • 4.利用_main_block_func_0初始化_main_block_impl_0结构体的第一个成员变量impl的成员变量FuncPtr。这样_main_bck_impl_0这个结构体也就得到了block中那个代码块的地址。
    • 5.利用_mian_block_desc_0_DATA去初始化_mian_block_impl_0的第二个成员变量Desc
      下面我们再看第二步调用block:
    block->FuncPtr(block);
    

    我们知道,block实质上就是指向_main_block_impl_0这个结构体的指针,而FuncPtr是_main_block_impl_0的第第一个成员变量impl的成员变量,正常来讲,block想要调用自己的成员变量的成员变量的成员变量,应该像下面这样调用:

    block->impl->FuncPtr
    

    然而事实却不是这样,这是为什么呢?

    原因就在于之前我们把所有的强制类型转换给删掉了,之前block前面的()是(__block_impl *),为什么可以这样强制转换呢?因为block指向的是_main_block_impl_0这个结构体的首地址,而_main_block_impl_0
    的第一个成员变量是struct __block_impl impl;,所以impl和_main_block_impl_0的首地址是一样的,因此指向_main_block_impl_0的首地址的指针也就可以被强制转换为指向impl的首地址的指针。

    之前说过,FuncPtr这个指针在构造函数中是被初始化为指向_mian_block_func_0这个函数的地址。因此通过block->FuncPtr调用也就获取了_main_block_func_0这个函数的地址,然后对_main_block_func_0进行调用,也就是执行block中的代码了。这中间block又被当做参数传进了_main_block_func_0这个函数。

    2.变量捕获-auto变量

    auto变量是声明在函数内部的变量,比如int a = 0;这句代码声明在函数内部,那a就是auto变量,等价于auto int a = 0;auto变量时分配在栈区,当超出作用域时,其占用的内存会被系统自动销毁并生成。下面看一段代码:

            int a = 10;
            
            void (^block)(void) = ^{
                
                NSLog(@"%d", a);
            };
            
            a = 20;
            
            block();
    

    这是一个很简单的Block捕获自动变量的例子,我们看一下打印结果:

    2018-09-04 20:39:45.436534+0800 copytest[17163:477148] 10
    

    自动变量a的值明明已经变为了20,为什么输出结果还是10呢?我们把这段代码转化为C++的源码看看。

    int main(int argc, char * argv[]) {
        /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
    
            int a = 10;
    
            void (*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, a));
    
            a = 20;
    
            ((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
    
            return 0;
        }
    }
    

    我们还是把代码化简一下来看:

            int a = 10;
    
            void (*block)(void) = &__main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA, a);
    
            a = 20;
    
            block->FuncPtr)(block);
    

    对比一下上面分析的没有捕获自动变量的源代码,我们发现这里_main_block_impl_0中传入的参数多了一个a。然后我们往上翻看看_main_block_impl_0的结构:

    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      int a; //这是新加入的成员变量
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _a, int flags=0) : a(_a) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    

    在_main_block_impl_0这个结构体中我们发现多了一个int类型的成员变量a,在结构体的构造函数中多了一个参数int _a,并且用这个int _a去初始化成员变量a。
    所以在void (*block)(void) = &__main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA, a);中传入了自动变量a用来初始化_main_block_impl_0的成员变量a。那这个时候_main_block_impl_0的成员变量a就被赋值为10了。
    由于上面这一步是值传递,所以当执行a = 20时,_main_block_impl_0结构体的成员变量a的值是不会随之改变的,仍然是10。
    然后我们再来看一下_main_block_func_0的结构有何变化:

    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
      int a = __cself->a; // bound by copy
    
                NSLog((NSString *)&__NSConstantStringImpl__var_folders_74_wk04zv690mz36wn0g18r5nxm0000gn_T_main_fb5f0d_mi_0, a);
            }
    

    可以看到,通过传入的_main_block_impl_0这个结构体获得其成员变量a的值。

    3.变量捕获-static变量

    上面讲的捕获的是自动变量,在函数内部声明的变量默认为自动变量,即默认用auto修饰。那么如果在函数内部声明的变量用static修饰,又会带来哪些不同呢?static变量和auto变量的不同之处在于变量的内存的回收时机。auto变量在其作用域结束时就会被系统自动回收,而static变量在变量的作用域结束时并不会被系统自动回收。
    先看一段代码:

           static int a = 10;
            
            void (^block)(void) = ^{
                
                NSLog(@"%d", a);
            };
            
            a = 20;
            
            block();
    

    我们看一下打印结果:

    2018-09-04 21:09:40.440020+0800 copytest[17949:499740] 20
    

    结果是20,这个和2中的打印结果不一样,为什么局部变量从auto变成了static结果会不一样呢?我们还是从源码来分析:

    int main(int argc, char * argv[]) {
        /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
    
           static int a = 10;
    
            void (*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, &a));
    
            a = 20;
    
            ((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
    
            return 0;
        }
    }
    

    我们把代码化简一下:

           static int a = 10;
    
            void (*block)(void) = &__main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA, &a);
    
            a = 20;
    
            block->FuncPtr(block);
    

    和2不一样的是,这里传入_main_block_impl_0的是&a,也即是a这个变量的地址值。那么这个&a是赋值给谁了呢?我们上翻找到_main_block_impl_0的结构:

    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      int *a;
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int *_a, int flags=0) : a(_a) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    

    这里我们可以看到结构体多了一个指针类型的成员变量int *a,然后在构造函数中,将传递过来的&a,赋值给这个指针变量。也就是说,在_main_block_impl_0这个结构体中多了一个成员变量,这个成员变量是指针,指向a这个变量。所以当a变量的值发生变化时,能够得到最新的值。

    4.变量捕获-全局变量

    2和3分析了两种类型的局部变量,auto局部变量和static局部变量。这一部分则分析全局变量。全局变量会不会像局部变量一样被block所捕获呢?我们还是看一下实例:

    int height = 10;
    static int weight = 20;
    
    int main(int argc, char * argv[]) {
        @autoreleasepool {
            
            void (^block)(void) = ^{
                
                NSLog(@"%d %d", height, weight);
            };
            
            height = 30;
            weight = 40;
            
            block();
            
            return 0;
        }
    }
    

    打印结果:

    2018-09-04 21:41:19.016278+0800 copytest[18774:524773] 30 40
    

    我们还是查看一下源码:

    int height = 10;
    static int weight = 20;
    int main(int argc, char * argv[]) {
        /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
    
            void (*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
    
            height = 30;
            weight = 40;
    
            ((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
    
            return 0;
        }
    }
    

    这里我们可以看到,height和weight这两个全局变量没有作为参数传入_main_block_impl_0中去。然后我们再查看一下_main_block_impl_0的结构:

    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    

    可以看到,_main_block_impl_0中并没有增加成员变量。然后我们再看_main_block_func_0的结构:

    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
    
    
                NSLog((NSString *)&__NSConstantStringImpl__var_folders_74_wk04zv690mz36wn0g18r5nxm0000gn_T_main_46c51b_mi_0, height, weight);
            }
    

    可以看到,这个地方在调用的时候是直接调用的全局变量height和weight。
    所以我们可以得出结论,block并不会不会全局变量。
    总结:

    变量类型 是否捕获到block内部 访问方式
    局部变量auto 值传递
    局部变量static 指针传递
    全局变量 直接访问
    思考 为什么对于不同类型的变量,block的处理方式不同呢?

    这是由变量的生命周期决定的。对于自动变量,当作用域结束时,会被系统自动回收,而block很可能是在超出自动变量作用域的时候去执行,如果之前没有捕获自动变量,那么后面执行的时候,自动变量已经被回收了,得不到正确的值。对于static局部变量,它的生命周期不会因为作用域结束而结束,所以block只需要捕获这个变量的地址,在执行的时候通过这个地址去获取变量的值,这样可以获得变量的最新的值。gao'mi而对于全局变量,在任何位置都可以直接读取变量的值。

    5.变量捕获-self变量

    看下面一段代码:

    @implementation Person
    
    - (void)test{
        
        void(^block)(void) = ^{
            
            NSLog(@"%@", self);
        };
    }
    
    @end
    

    这个Person类中只有一个东西,就是test这个函数,那么这个block有没有捕获self变量呢?
    要搞清这个问题,我们只需要知道搞清楚这里self变量是局部变量还是全局变量,如果是局部变量,那么是一定会捕获的,而如果是全局变量,则一定不会被捕获。
    我们把这个Person.m文件转化为c++的源码,然后找到test函数在c++中的表示:

    static void _I_Person_test(Person * self, SEL _cmd) {
    
        void(*block)(void) = ((void (*)())&__Person__test_block_impl_0((void *)__Person__test_block_func_0, &__Person__test_block_desc_0_DATA, self, 570425344));
    }
    

    我们可以看到,本来Person.m中,这个test函数我是没有传任何参数的,但是转化为c++的代码后,这里传入了两个参数,一个是self参数,一个是_cmd。self很常见,_cmd表示test函数本身。所以我们就很清楚了,self是作为参数传进来,也就是局部变量,那么block应该是捕获了self变量,事实是不是这样呢?我们只需要查看一下_Person_test_block_impl_0的结构就可以知道了。
    _Person_test_block_impl_0的结构:

    struct __Person__test_block_impl_0 {
      struct __block_impl impl;
      struct __Person__test_block_desc_0* Desc;
      Person *self;
      __Person__test_block_impl_0(void *fp, struct __Person__test_block_desc_0 *desc, Person *_self, int flags=0) : self(_self) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    

    可以看到,self确实是作为成员变量被捕获了。

    6.Block的类型

    前面已经说过了,Block的本质就是一个OC对象,既然它是OC对象,那么它就有类型。
    在搞清楚Block的类型之前,先把ARC关掉,因为ARC帮我们做了太多的事,不方便我们观察结果。关掉ARC的方法在Build Settings里面搜索Objective-C Automatic Reference Counting,把这一项置为NO。

    int height = 10;
    static int weight = 20;
    
    int main(int argc, char * argv[]) {
        @autoreleasepool {
            
            int age = 10;
            
            void (^block)(void) = ^{
                
                NSLog(@"%d %d", height, age);
            };
            
            NSLog(@"%@\n %@\n %@\n %@", [block class], [[block class] superclass], [[[block class] superclass] superclass], [[[[block class] superclass] superclass] superclass]);
            
            return 0;
        }
    }
    

    上面的代码的打印结果是:

     __NSStackBlock__
     __NSStackBlock
     NSBlock
     NSObject
    

    这说明上面定义的这个block的类型是NSStackBlock,并且它最终继承自NSObject也说明Block的本质是OC对象。
    Block有三种类型,分别是NSGlobalBlock,MallocBlock,NSStackBlock。
    这三种类型的Block对象的存储区域如下:

    对象的存储域
    NSStackBlock
    NSGlobalBlock 程序的数据区域(.data区)
    NSMallocBlock

    截获了自动变量的Block是NSStackBlock类型,没有截获自动变量的Block则是NSGlobalStack类型,NSStackBlock类型的Block进行copy操作之后其类型变成了NSMallocBlock类型。

    Block的类型 副本的配置存储域 复制效果
    NSStackBlock 从栈复制到堆
    NSGlobalStack 程序的数据区域 什么也不做
    NSMallocBlock 引用计数增加

    下面我们一起分析一下NSStackBlock类型的Block进行copy操作后Block对象从栈复制到了堆有什么道理,我们首先来看一段代码:

    void (^block)(void);
    
    void test() {
        
        int age = 10;
        
        block = ^{
            
            NSLog(@"age=%d", age);
        };
    }
    
    int main(int argc, char * argv[]) {
        @autoreleasepool {
            
            test();
            
            block();
            
            return 0;
        }
    }
    

    不出意外的话,打印结果应该是10,那么结果是不是这样呢?我们打印看一下:

    age=-411258824
    

    很奇怪,打印了一个这么奇怪的数字。这是为什么呢?
    block使用了自动变量age,所以它是NSStackBlock类型的,因此block是存放在栈区,age是被捕获作为结构体的成员变量,其值也是被保存在栈区。所以当test这个函数调用完毕后,它栈上的东西就有可能被销毁了,一旦销毁了,age值就不确定是多少了。通过打印结果也可以看到,确实是影响到了block的执行。
    如果我们对block执行copy操作,结果会不会不一样呢?

    void (^block)(void);
    
    void test() {
        
        int age = 10;
        
        block = [^{
            
            NSLog(@"age=%d", age);
        } copy];
    }
    
    int main(int argc, char * argv[]) {
        @autoreleasepool {
            
            test();
            
            block();
            
            return 0;
        }
    }
    

    打印结果:

    age=10
    

    这个时候得出了正确的输出。
    因为对block进行copy操作后,block从栈区被复制到了堆区,它的成员变量age也随之被复制到了堆区,这样test函数执行完之后,它的栈区被销毁并不影响block,因此能得出正确的输出。

    7.ARC环境下自动为Block进行copy操作的情况

    6中讲的最后一个例子:

    void (^block)(void);
    
    void test() {
        
        int age = 10;
        
        block = ^{
            
            NSLog(@"age=%d", age);
        };
    }
    
    int main(int argc, char * argv[]) {
        @autoreleasepool {
            
            test();
            
            block();
            
            return 0;
        }
    }
    

    这种使用方式其实非常常见,我们在使用的时候也没有发现有什么问题,那为什么在MRC环境下就有问题呢?因为在ARC环境下编译器为我们做了很多copy操作。其中有一个规则就是如果Block被强指针指着,那么编译器就会对其进行copy操作。我们看到这里:

    ^{
            
            NSLog(@"age=%d", age);
        };
    

    这个Block块是被强指针指着,所以它会进行copy操作,由于其使用了自动变量,所以是栈区的Block。经过复制以后就到了堆区,这样由于Block在堆区,所以就不受Block执行完成的影响,随时可以获取age的正确值。

    总结一下ARC环境下自动进行copy操作的情况一共有以下几种:
    • block作为函数返回值时。
    • 将block赋值给__strong指针时。
    • block作为Cocoa API中方法名含有usingBlock的方法参数时。
    • GCD中的API。
    block作为函数返回值时
    typedef void(^PDBlock)(void);
    
    PDBlock test() {
        
        int age = 10;
        
        return ^{
            
            NSLog(@"age=%d", age);
        };
        
        
    }
    
    int main(int argc, char * argv[]) {
        @autoreleasepool {
            
            PDBlock block = test();
            block();
        
            return 0;
        }
    }
    

    test函数的返回值是一个block,那这种情况的时候,在栈区的

    ^{
            
            NSLog(@"age=%d", age);
        };
    

    这个block会被复制到堆区

    将block赋值给强指针时

    7中第一个例子就是将block赋值给强指针时,进行了copy操作的情况。

    block作为Cocoa API中方法名含有usingBlock的方法参数时

    比如说遍历数组的函数:

    NSArray *array = [[NSArray alloc] init];
    [array enumerateObjectsUsingBlock:^(id  _Nonnull obj, NSUInteger idx, BOOL * _Nonnull stop) {
                NSLog(@"%d", idx);
            }];
    

    enumerateObjectsUsingBlock:这个函数中的block会进行copy操作

    GCD中的API

    GCD中的很多API的参数都有block,这个时候都会对block进行一次copy操作,比如下面这个dispatch_after函数:

    dispatch_after(dispatch_time(DISPATCH_TIME_NOW, (int64_t)(3 * NSEC_PER_SEC)), dispatch_get_main_queue(), ^{
                
                NSLog(@"wait");
            });
    

    相关文章

      网友评论

      本文标题:iOS源码解析:Block的本质<一>

      本文链接:https://www.haomeiwen.com/subject/onaubftx.html