美文网首页iOS开发记录
Block 原理和内存管理

Block 原理和内存管理

作者: 雨三楼 | 来源:发表于2019-09-27 11:33 被阅读0次

    Block是什么?

    在oc中它是带有^符号的匿名函数,遵循BN范式: ^ 返回值类型 参数列表 表达式 (参数和返回值为空的时候可以省略)。

    而在C中(OC编译后的C)它会被编译成一堆结构体和几个函数以及静态变量。

    而这几个结构体和函数,正是Block实现的本质.

    1. Block 结构体
    2. 表达式转换成的函数
    3. 描述体
    4. Block主体结构体
    5. Block的调用
    // Block 结构体
    struct __block_imp1 {
      void *isa;
      int Flags;
      int Reserved;
      void *FuncPtr;
    }
    
    // 描述体
    static struct __main_block_desc_0 {
      unsigned long reserved;
      unsigned long Block_size;
    } __main_block_desc_0_DATA = {
      0,
      sizeof(struct __main_block_imp1_0)
    }
    
    // Block主体结构体
    struct __main_block_imp1_0 {
      struct __block_imp1 imp1;
      struct __main_block_desc_0* Desc;
      
      __main_block_imp1_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
        imp1.isa = &_NSConcreteStackBlock;
        imp1.Flags = flags;
        imp1.FuncPtr = fp;
        Desc = desc;
      }
    }
    
    // 表达式转换成的函数
    static void  __main_block_func_0(struct __main_block_imp1_0 *__cself) {
      printf("this is a block");
    }
    
    int main() {
      // Block的调用
      void (*blk)(void) = (void(*)(void))&__main_block_imp1_0((void*)__main_block_func_0,&__main_block_desc_0_DATA);
      ((void(*)(struct __block_imp1 *))((struct __block_imp1 *)blk)->FuncPtr)((struct __block_imp1 *)blk);
      return 0;
    }
    

    逐一来分析一下,这几个结构体的作用。

    // Block 结构体
    struct __block_imp1 {
      void *isa;
      int Flags;
      int Reserved;
      void *FuncPtr;
    }
    

    由于转化后的Block类型结构体的成员中有isa指针,不难得知它和某些OC的类有关系,而在struct __main_block_imp1_0的初始化函数中,isa被赋予了一个_NSConcreteStackBlock的类。这表明该Block属于stack存在于栈中的类。

    _NSConcreteStackBlock  存在于栈中
    _NSConcreteMallocBlock 存在于堆中
    _NSConcreteGlobalBlock 存在于.Data(程序的数据区域)中
    

    // 描述体
    static struct __main_block_desc_0 {
      unsigned long reserved;
      unsigned long Block_size;
    } __main_block_desc_0_DATA = {
      0,
      sizeof(struct __main_block_imp1_0)
    }
    

    只是存储了一些升级区域和结构大小。

    // Block主体结构体
    struct __main_block_imp1_0 {
      struct __block_imp1 imp1;
      struct __main_block_desc_0* Desc;
      
      __main_block_imp1_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
        imp1.isa = &_NSConcreteStackBlock;
        imp1.Flags = flags;
        imp1.FuncPtr = fp;
        Desc = desc;
      }
    }
    

    __main_block_imp1_0结构体从某种程度上封装了前两个结构体,但它的实际意义不止于此。

    // 表达式转换成的函数
    static void  __main_block_func_0(struct __main_block_imp1_0 *__cself) {
      printf("this is a block");
    }
    
    int main() {
      // Block的调用
      void (*blk)(void) = (void(*)(void))&__main_block_imp1_0((void*)__main_block_func_0,&__main_block_desc_0_DATA);
      ((void(*)(struct __block_imp1 *))((struct __block_imp1 *)blk)->FuncPtr)((struct __block_imp1 *)blk);
      return 0;
    }
    

    函数和调用很简单,就是一些类型转换容易让人眼花缭乱,经过删繁就简之后,就是简单的函数声明和调用而已。

    需要注意的是,__main_block_func_0是以__main_block_imp1_0这个主体结构体入参的,这在变量捕捉的时候有很大作用。

    变量捕捉

    熟悉了Block的本质之后,就是对于Block的运用了,Block为什么如此好用的原因之一就在于,我们可以做到一般函数不能做到的事情,例如:局部变量的捕捉。

    int main() {
        int v = 1;
        void (^blk)(void) = ^{
            printf("this is a block %d",v);
        };
        blk();
        return 0;
    }
    

    可以看到,变量v能够在表达式内部获取到。

    然而当我们想要在内部改变这个变量的值的时候,会得到一个编译错误。

    int main() {
        int v = 1;
        void (^blk)(void) = ^{
            printf("this is a block %d",v);
            v = 2; // error: Variable is not assignable (missing __block type specifier)
        };
        blk();
        return 0;
    }
    

    为什么?

    既然错误发生在表达式内,我们就来分析一下编译后的函数static void __main_block_func_0(struct __main_block_imp1_0 *__cself) 捕获变量后,这个函数的实现变成了这样:

    // 表达式转换成的函数
    static void  __main_block_func_0(struct __main_block_imp1_0 *__cself) {
            int v = __cself->v;
        printf("this is a block %d",v);
    }
    

    入参__main_block_imp1_0多了个v的成员变量。

    也就是说,编译后,__main_block_imp1_0结构体负责存储捕获的局部变量。

    然而捕获的变量也是Int类型的,并非指针,所以我们在__main_block_func_0中改变变量V的值是没有任何意义的。编译器很聪明的检测到了这个操作。

    那么我们加入__block之后呢?

    int main() {
        __block int v = 1;
        void (^blk)(void) = ^{
            printf("this is a block %d",v);
            v = 2;
        };
        blk();
        return 0;
    }
    

    编译器的报错消失了。

    意味着我们可以随意在block内改动v这个局部变量了。

    那么内部是怎么实现的呢?

    还是看函数实现:

    // 表达式转换成的函数
    static void  __main_block_func_0(struct __main_block_imp1_0 *__cself) {
            __Block_byref_val_0 *val = __cself->val;
        printf("this is a block %d",(val->_forwarding->v));
        (val->_forwarding->v) = 2;
    }
    

    __main_block_imp1_0里存储的成员V变了,不再是简单的Int类型,而是变成了

    __Block_byref_val_0 指针。

    struct __Block_byref_val_0 {
      void *__isa;
      __Block_byref_val_0 *__forwarding;
      int __flags;
      int __size;
      int __v;
    }
    

    需要稍微分析一下,这几个成员变量的意义。

    找到它初始化的地方,在main函数内:

    __Block_byref_val_0 v = (
      0,
      &v,
      0,
      sizeof(__Block_byref_val_0),
      1
    )
    
    • isa 被赋值为空

    • _forwarding 指向了自己,

    • flags =0

    • size 传入了大小

    • v 赋值成捕获的变量的值

    而原本的int变量v消失了,__Block_byref_val_0变量v取而代之,将此结构体的指针赋值给

    __main_block_imp1_0成员变量后,就可以实现对变量v的修改了。

    这是__block的作用,可是在结构体

    __Block_byref_val_0初始化的时候还有一个有趣的地方,就是:

    __Block_byref_val_0 *__forwarding;

    __forwarding指针有什么意义呢?它指向了自己,并且在函数体内修改存储值时,也访问了"自己"。为何要多此一举?

    Block的存储域

    再弄清__forwarding指针的作用之前,我们先要缕清楚这三种Block的区别以及应用的场景。

    类型 内存分布 场景
    _NSConcreteStackBlock 存在于栈中 定义在函数内部,未被强引用,且捕获了外部变量。
    _NSConcreteMallocBlock 存在于堆中 被强引用,由_NSConcreteStackBlock被拷贝到堆内存。
    _NSConcreteGlobalBlock 存在于.Data(程序的数据区域)中 定义在全局区域,或者未捕获外部变量且定义在函数内部的block

    从内存管理的角度看,_NSConcreteGlobalBlock类型的Block讨论意义不大。

    _NSConcreteStackBlock和 _NSConcreteMallocBlock 才是我们要讨论的重点。

    假定这样一种情况(MRC下):

    blk_t blk;
    {
         NSAutoreleasePool *pool = [NSAutoreleasePool new];
        id array = [[[NSMutableArray alloc] init] autorelease];
        blk = ^( id obj){
            [array addObject:obj];
            NSLog(@"count is %d",[array count]);
        };
         [pool release];
    }
    blk([[NSObject alloc] init]);
    blk([[NSObject alloc] init]);
    blk([[NSObject alloc] init]);
        
    

    由于是MRC环境,加入NSAutoreleasePool来模拟array的释放周期。

    可以看到,在大括号以外调用block,肯定会崩溃,因为array已经释放了。并且在这种情况下,Block属于_NSConcreteStackBlock类型。

    我们稍稍改动一下:

    blk_t blk;
    {
        NSAutoreleasePool *pool = [NSAutoreleasePool new];
        id array = [[[NSMutableArray alloc] init] autorelease];
        blk = [^( id obj){
            [array addObject:obj];
            NSLog(@"count is %d",[array count]);
        } copy];
        [pool release];
    }
    blk([[NSObject alloc] init]);
    blk([[NSObject alloc] init]);
    blk([[NSObject alloc] init]);
    

    程序输出正常了,array也被block正常捕获。

    而Block的类型经过copy之后,变成了_NSConcreteMallocBlock,copy方法实际调用的是:

    id objc_retainBlock(id x) {
        return (id)_Block_copy(x);
    }
    

    _Block_copy 作用按照文档上来说是将Block拷贝到堆内存——这和我们的测试结果一样。

    随着Block被复制到堆内存之后,Block所持有的__block变量也会复制到堆内存并且持有,要证明需要看编译后的代码:

    static void __main_block_copy_0 (struct __main_block_imp1_0*dst ,struct __main_block_imp1_0*src){
      _Block_object_assign(&dst->val, src->val, BLOCK_FIELD_IS_BYREF);
    }
    static void __main_block_dispose_0(struct __main_block_imp1_0*scr){
      _Block_object_dispose(src->val, BLOCK_FIELD_IS_BYREF);
    }
    

    这两个方法是在Block被复制到堆内存和从堆内存释放的时候调用的。

    _Block_object_assign_Block_object_dispose分别是Block持有变量的赋值和释放。

    __forwarding指针:

    这时候我们可以来解释这个指针的作用了:

    __block int v = 1;
    void (^blk)(void) = [^{v++;} copy];
    v++;
    blk();
    printf("num is  %d",v);
    

    可以看到经过copy后的变量v在外部仍然可以改变,试想如果没有__forwarding指针存在的话,v经过编译后,结构体仍然存在于栈上,此时改变v的值结果肯定不是我们想要的3。

    __forwarding保证__Block的变量在赋值时使得位于栈上的结构体内的__forwarding指针指向堆内的Block,从内访问同一个且正确的变量。

    相关文章

      网友评论

        本文标题:Block 原理和内存管理

        本文链接:https://www.haomeiwen.com/subject/zbdykqtx.html