Block技巧与底层解析

作者: tripleCC | 来源:发表于2015-07-20 23:14 被阅读22612次

目录

  • Block底层解析
    • 什么是block?
      • block编译转换结构
      • block实际结构
    • block的类型
      • NSConcreteGlobalBlock和NSConcreteStackBlock
      • NSConcreteMallocBlock
    • 捕捉变量对block结构的影响
      • 局部变量
      • 全局变量
      • 局部静态变量
      • __block修饰的变量
      • self隐式循环引用
    • 不同类型block的复制
      • 栈block
      • 堆block
      • 全局block
    • block辅助函数
      • __block修饰的基本类型的辅助函数
      • 对象的辅助函数
    • ARC中block的工作
      • block试验
      • block作为参数传递
      • block作为返回值
      • block属性
  • 参考博文

Block底层解析

最近看了一些block的资料,并动手做了一些实践,摘录并添加了一些结论。

什么是block?

首先,看一个极简的block:

int main(int argc, const char * argv[]) {
    @autoreleasepool {

        ^{ };
    }
    return 0;
}
block编译转换结构

对其执行clang -rewrite-objc编译转换成C++实现,得到以下代码:

struct __block_impl {
    void *isa;
    int Flags;
    int Reserved;
    void *FuncPtr;
};

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
}

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, const char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
        (void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA);
    }
    return 0;
}

不难看出其中的__main_block_impl_0就是block的一个C++的实现(最后面的_0代表是main中的第几个block),也就是说也是一个结构体

其中__block_impl的定义如下:

struct __block_impl {
  void *isa;
  int Flags;
  int Reserved;
  void *FuncPtr;
};

其结构体成员如下:

  • isa,指向所属类的指针,也就是block的类型
  • flags,标志变量,在实现block的内部操作时会用到
  • Reserved,保留变量
  • FuncPtr,block执行时调用的函数指针
    可以看出,它包含了isa指针(包含isa指针的皆为对象),也就是说block也是一个对象(runtime里面,对象和类都是用结构体表示)。

__main_block_desc_0的定义如下:

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};

其结构成员含义如下:

  • reserved:保留字段
  • Block_size:block大小(sizeof(struct __main_block_impl_0))

以上代码在定义__main_block_desc_0结构体时,同时创建了__main_block_desc_0_DATA,并给它赋值,以供在main函数中对__main_block_impl_0进行初始化。
__main_block_impl_0定义了显式的构造函数,其函数体如下:

  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }

可以看出,

  • __main_block_impl_0isa指针指向了_NSConcreteStackBlock
  • main函数中看, __main_block_impl_0FuncPtr指向了函数__main_block_func_0
  • __main_block_impl_0Desc也指向了定义__main_block_desc_0时就创建的__main_block_desc_0_DATA,其中纪录了block结构体大小等信息。

以上就是根据编译转换的结果,对一个简单block的解析,后面会将block操作不同类型的外部变量,对block结构的影响进行相应的说明。

block实际结构

接下来观察下Block_private.h文件中对block的相关结构体的真实定义:

/* Revised new layout. */
struct Block_descriptor {
    unsigned long int reserved;
    unsigned long int size;
    void (*copy)(void *dst, void *src);
    void (*dispose)(void *);
};


struct Block_layout {
    void *isa;
    int flags;
    int reserved;
    void (*invoke)(void *, ...);
    struct Block_descriptor *descriptor;
    /* Imported variables. */
};

有了上文对编译转换的分析,这里只针对略微不同的成员进行分析:

  • invoke,同上文的FuncPtr,block执行时调用的函数指针,block定义时内部的执行代码都在这个函数中
  • Block_descriptor,block的详细描述
    • copy/dispose,辅助拷贝/销毁函数,处理block范围外的变量时使用

总体来说,block就是一个里面存储了指向函数体中包含定义block时的代码块的函数指针,以及block外部上下文变量等信息的结构体。

block的类型

block的常见类型有3种:

  • _NSConcreteGlobalBlock(全局)
  • _NSConcreteStackBlock(栈)
  • _NSConcreteMallocBlock(堆)

附上APUE的进程虚拟内存段分布图:

进程虚拟内存空间分布

其中前2种在Block.h种声明,后1种在Block_private.h中声明,所以最后1种基本不会在源码中出现。

由于无法直接创建_NSConcreteMallocBlock类型的block,所以这里只对前面2种进行手动创建分析,最后1种通过源代码分析。

NSConcreteGlobalBlock和NSConcreteStackBlock

首先,根据前面两种类型,编写以下代码:

void (^globalBlock)() = ^{

};

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        void (^stackBlock1)() = ^{

        };
    }
    return 0;
}

对其进行编译转换后得到以下缩略代码:

// globalBlock
struct __globalBlock_block_impl_0 {
  struct __block_impl impl;
  struct __globalBlock_block_desc_0* Desc;
  __globalBlock_block_impl_0(void *fp, struct __globalBlock_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteGlobalBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
...

// stackBlock
struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
...
int main(int argc, const char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
        void (*stackBlock)() = (void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA);
    }
    return 0;
}

可以看出globalBlock的isa指向了_NSConcreteGlobalBlock,即在全局区域创建,编译时具体的代码就已经确定在上图中的代码段中了,block变量存储在全局数据存储区;stackBlock的isa指向了_NSConcreteStackBlock,即在栈区创建。

NSConcreteMallocBlock

接下来是在堆中的block,堆中的block无法直接创建,其需要由_NSConcreteStackBlock类型的block拷贝而来(也就是说block需要执行copy之后才能存放到堆中)。由于block的拷贝最终都会调用_Block_copy_internal函数,所以观察这个函数就可以知道堆中block是如何被创建的了:

static void *_Block_copy_internal(const void *arg, const int flags) {
    struct Block_layout *aBlock;
    ...
    aBlock = (struct Block_layout *)arg;
    ...
    // Its a stack block.  Make a copy.
    if (!isGC) {
        // 申请block的堆内存
        struct Block_layout *result = malloc(aBlock->descriptor->size);
        if (!result) return (void *)0;
        // 拷贝栈中block到刚申请的堆内存中
        memmove(result, aBlock, aBlock->descriptor->size); // bitcopy first
        // reset refcount
        result->flags &= ~(BLOCK_REFCOUNT_MASK);    // XXX not needed
        result->flags |= BLOCK_NEEDS_FREE | 1;
        // 改变isa指向_NSConcreteMallocBlock,即堆block类型
        result->isa = _NSConcreteMallocBlock;
        if (result->flags & BLOCK_HAS_COPY_DISPOSE) {
            //printf("calling block copy helper %p(%p, %p)...\n", aBlock->descriptor->copy, result, aBlock);
            (*aBlock->descriptor->copy)(result, aBlock); // do fixup
        }
        return result;
    }
    else {
        ...
    }
}

从以上代码以及注释可以很清楚的看出,函数通过memmove将栈中的block的内容拷贝到了堆中,并使isa指向了_NSConcreteMallocBlock

block主要的一些学问就出在栈中block向堆中block的转移过程中了。

捕捉变量对block结构的影响

接下来会编译转换捕捉不同变量类型的block,以对比它们的区别。

局部变量

前:

- (void)test
{
    int a;
    ^{a;};
}

后:

struct __Person__test_block_impl_0 {
  struct __block_impl impl;
  struct __Person__test_block_desc_0* Desc;
  int a;
  // a(_a)是构造函数的参数列表初始化形式,相当于a = _a。从_I_Person_test看,传入的就是a
  __Person__test_block_impl_0(void *fp, struct __Person__test_block_desc_0 *desc, int _a, int flags=0) : a(_a) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __Person__test_block_func_0(struct __Person__test_block_impl_0 *__cself) {
  int a = __cself->a; // bound by copy
a;}

static struct __Person__test_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __Person__test_block_desc_0_DATA = { 0, sizeof(struct __Person__test_block_impl_0)};

static void _I_Person_test(Person * self, SEL _cmd) {
    int a;
    (void (*)())&__Person__test_block_impl_0((void *)__Person__test_block_func_0, &__Person__test_block_desc_0_DATA, a);
}

可以看到,block相对于文章开头增加了一个int类型的成员变量,他就是用来存储外部变量a的。可以看出,这次拷贝只是一次值传递。并且当我们想在block中进行以下操作时,将会发生错误

^{a = 10;};

编译器会提示


错误提示

。因为_I_Person_test函数中的a和__Person__test_block_func_0函数中的a并没有在同一个作用域,所以在block对a进行赋值是没有意义的,所以编译器给出了错误。我们可以通过地址传递来消除以上错误:

- (void)test
{
    int a = 0;
    // 利用指针p存储a的地址
    int *p = &a;

    ^{
        // 通过a的地址设置a的值
        *p = 10;
    };
}

但是变量a的生命周期是和方法test的栈相关联的,当test运行结束,栈随之销毁,那么变量a就会被销毁,p也就成为了野指针。如果block是作为参数或者返回值,这些类型都是跨栈的,也就是说再次调用会造成野指针错误。

全局变量

前:

// 全局静态
static int a;
// 全局
int b;
- (void)test
{

    ^{
        a = 10;
        b = 10;
    };
}

后:

static int a;
int b;

struct __Person__test_block_impl_0 {
  struct __block_impl impl;
  struct __Person__test_block_desc_0* Desc;
  __Person__test_block_impl_0(void *fp, struct __Person__test_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __Person__test_block_func_0(struct __Person__test_block_impl_0 *__cself) {

        a = 10;
        b = 10;
    }

static struct __Person__test_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __Person__test_block_desc_0_DATA = { 0, sizeof(struct __Person__test_block_impl_0)};

static void _I_Person_test(Person * self, SEL _cmd) {

    (void (*)())&__Person__test_block_impl_0((void *)__Person__test_block_func_0, &__Person__test_block_desc_0_DATA);
}

可以看出,因为全局变量都是在静态数据存储区,在程序结束前不会被销毁,所以block直接访问了对应的变量,而没有在__Person__test_block_impl_0结构体中给变量预留位置。

局部静态变量

- (void)test
{
    static int a;
    ^{
        a = 10;
    };
}

后:

struct __Person__test_block_impl_0 {
  struct __block_impl impl;
  struct __Person__test_block_desc_0* Desc;
  int *a;
  __Person__test_block_impl_0(void *fp, struct __Person__test_block_desc_0 *desc, int *_a, int flags=0) : a(_a) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __Person__test_block_func_0(struct __Person__test_block_impl_0 *__cself) {
  int *a = __cself->a; // bound by copy
        // 这里通过局部静态变量a的地址来对其进行修改
        (*a) = 10;
    }

static struct __Person__test_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __Person__test_block_desc_0_DATA = { 0, sizeof(struct __Person__test_block_impl_0)};

static void _I_Person_test(Person * self, SEL _cmd) {
    static int a;
    // 传入a的地址
    (void (*)())&__Person__test_block_impl_0((void *)__Person__test_block_func_0, &__Person__test_block_desc_0_DATA, &a);
}

需要注意一点的是静态局部变量是存储在静态数据存储区域的,也就是和程序拥有一样的生命周期,也就是说在程序运行时,都能够保证block访问到一个有效的变量。但是其作用范围还是局限于定义它的函数中,所以只能在block通过静态局部变量的地址来进行访问。

关于变量的存储我原来的这篇博客有提及:c语言臆想--全局---局部变量

__block修饰的变量

前:

- (void)test
{
   __block int a;
    ^{
        a = 10;
    };
}

后:

struct __Block_byref_a_0 {
  void *__isa;
__Block_byref_a_0 *__forwarding;
 int __flags;
 int __size;
 int a;
};

struct __Person__test_block_impl_0 {
  struct __block_impl impl;
  struct __Person__test_block_desc_0* Desc;
  __Block_byref_a_0 *a; // by ref
  __Person__test_block_impl_0(void *fp, struct __Person__test_block_desc_0 *desc, __Block_byref_a_0 *_a, int flags=0) : a(_a->__forwarding) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __Person__test_block_func_0(struct __Person__test_block_impl_0 *__cself) {
  __Block_byref_a_0 *a = __cself->a; // bound by ref
        // 注意,这里的_forwarding用来保证操作的始终是堆中的拷贝a,而不是栈中的a
        (a->__forwarding->a) = 10;
    }
static void __Person__test_block_copy_0(struct __Person__test_block_impl_0*dst, struct __Person__test_block_impl_0*src) {_Block_object_assign((void*)&dst->a, (void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

static void __Person__test_block_dispose_0(struct __Person__test_block_impl_0*src) {_Block_object_dispose((void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

static struct __Person__test_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __Person__test_block_impl_0*, struct __Person__test_block_impl_0*);
  void (*dispose)(struct __Person__test_block_impl_0*);
} __Person__test_block_desc_0_DATA = { 0, sizeof(struct __Person__test_block_impl_0), __Person__test_block_copy_0, __Person__test_block_dispose_0};

static void _I_Person_test(Person * self, SEL _cmd) {
    // __block将a包装成了一个对象
   __attribute__((__blocks__(byref))) __Block_byref_a_0 a = {(void*)0,(__Block_byref_a_0 *)&a, 0, sizeof(__Block_byref_a_0)};
;
    (void (*)())&__Person__test_block_impl_0((void *)__Person__test_block_func_0, &__Person__test_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344);
}

可以看到,对比上面的结果,明显多了__Block_byref_a_0结构体,这个结构体中含有isa指针,所以也是一个对象,它是用来包装局部变量a的。当block被copy到堆中时,__Person__test_block_impl_0的拷贝辅助函数__Person__test_block_copy_0会将__Block_byref_a_0拷贝至堆中,所以即使局部变量所在堆被销毁,block依然能对堆中的局部变量进行操作。其中__Block_byref_a_0成员指针__forwarding用来指向它在堆中的拷贝,其依据源码如下:

static void _Block_byref_assign_copy(void *dest, const void *arg, const int flags) {
    struct Block_byref **destp = (struct Block_byref **)dest;
    struct Block_byref *src = (struct Block_byref *)arg;

    ...
    // 堆中拷贝的forwarding指向它自己
    copy->forwarding = copy; // patch heap copy to point to itself (skip write-barrier)
    // 栈中的forwarding指向堆中的拷贝
    src->forwarding = copy;  // patch stack to point to heap copy
    ...
}

这样做是为了保证操作的值始终是堆中的拷贝,而不是栈中的值。(处理在局部变量所在栈还没销毁,就调用block来改变局部变量值的情况,如果没有__forwarding指针,则修改无效)

至于block如何实现对局部变量的拷贝,下面会详细说明。

self隐式循环引用

前:

@implementation Person
{
    int _a;
    void (^_block)();
}
- (void)test
{
  void (^_block)() = ^{
        _a = 10;
    };
}

@end

后:

struct __Person__test_block_impl_0 {
  struct __block_impl impl;
  struct __Person__test_block_desc_0* Desc;
  // 可以看到,block强引用了self
  Person *self;
  __Person__test_block_impl_0(void *fp, struct __Person__test_block_desc_0 *desc, Person *_self, int flags=0) : self(_self) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __Person__test_block_func_0(struct __Person__test_block_impl_0 *__cself) {
  Person *self = __cself->self; // bound by copy

        (*(int *)((char *)self + OBJC_IVAR_$_Person$_a)) = 10;
    }
static void __Person__test_block_copy_0(struct __Person__test_block_impl_0*dst, struct __Person__test_block_impl_0*src) {_Block_object_assign((void*)&dst->self, (void*)src->self, 3/*BLOCK_FIELD_IS_OBJECT*/);}

static void __Person__test_block_dispose_0(struct __Person__test_block_impl_0*src) {_Block_object_dispose((void*)src->self, 3/*BLOCK_FIELD_IS_OBJECT*/);}

static struct __Person__test_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __Person__test_block_impl_0*, struct __Person__test_block_impl_0*);
  void (*dispose)(struct __Person__test_block_impl_0*);
} __Person__test_block_desc_0_DATA = { 0, sizeof(struct __Person__test_block_impl_0), __Person__test_block_copy_0, __Person__test_block_dispose_0};

static void _I_Person_test(Person * self, SEL _cmd) {
  void (*_block)() = (void (*)())&__Person__test_block_impl_0((void *)__Person__test_block_func_0, &__Person__test_block_desc_0_DATA, self, 570425344);
}

如果在编译转换前,将_a改成self.a,能很明显地看出是产生了循环引用(self强引用block,block强引用self)。那么使用_a呢?经过编译转换后,依然可以在__Person__test_block_impl_0看见self的身影。且在函数_I_Person_test中,传入的参数也是self。通过以下语句,可以看出,不管是用什么形式访问实例变量,最终都会转换成self+变量内存偏移的形式。所以在上面例子中使用_a也会造成循环引用。

static void __Person__test_block_func_0(struct __Person__test_block_impl_0 *__cself) {
  Person *self = __cself->self; // bound by copy
        // self+实例变量a的偏移值
        (*(int *)((char *)self + OBJC_IVAR_$_Person$_a)) = 10;
    }

不同类型block的复制

block的复制代码在_Block_copy_internal函数中。

栈block

从以下代码可以看出,栈block的复制不仅仅复制了其内容,还添加了一些额外的东西

  • 1、往flags中并入了BLOCK_NEEDS_FREE(这个标志表明block需要释放,在release以及再次拷贝时会用到)
  • 2、如果有辅助copy函数(BLOCK_HAS_COPY_DISPOSE),那么就调用(这个辅助copy函数是用来拷贝block捕获的变量的)
...
struct Block_layout *result = malloc(aBlock->descriptor->size);
      if (!result) return (void *)0;
      memmove(result, aBlock, aBlock->descriptor->size); // bitcopy first
      // reset refcount
      result->flags &= ~(BLOCK_REFCOUNT_MASK);    // XXX not needed
      result->flags |= BLOCK_NEEDS_FREE | 1;
      result->isa = _NSConcreteMallocBlock;
      if (result->flags & BLOCK_HAS_COPY_DISPOSE) {
          //printf("calling block copy helper %p(%p, %p)...\n", aBlock->descriptor->copy, result, aBlock);
          (*aBlock->descriptor->copy)(result, aBlock); // do fixup
      }
      return result;
...
堆block

从以下代码看出,如果block的flags中有BLOCK_NEEDS_FREE标志(block从栈中拷贝到堆时添加的标志),就执行latching_incr_int操作,其功能就是让block的引用计数加1。所以堆中block的拷贝只是单纯地改变了引用计数

...
if (aBlock->flags & BLOCK_NEEDS_FREE) {
      // latches on high
      latching_incr_int(&aBlock->flags);
      return aBlock;
  }
...
全局block

从以下代码看出,对于全局block,函数没有做任何操作,直接返回了传入的block

...
else if (aBlock->flags & BLOCK_IS_GLOBAL) {
      return aBlock;
  }
...

block辅助函数

上文提及到了block辅助copy与dispose处理函数,这里分析下这两个函数的内部实现。在捕获变量为__block修饰的基本类型,或者为对象时,block才会有这两个辅助函数。

block捕捉变量拷贝函数为_Block_object_assign。在调用复制block的函数_Block_copy_internal时,会根据block有无辅助函数来对捕捉变量拷贝函数_Block_object_assign进行调用。而在_Block_object_assign函数中,也会判断捕捉变量包装而成的对象(Block_byref结构体)是否有辅助函数,来进行调用。

__block修饰的基本类型的辅助函数

编写以下代码:

typedef void(^Block)();
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        __block int a;
        Block block = ^ {
            a;
        };
}

转换成C++代码后:

typedef void(*Block)();
// __block int a
struct __Block_byref_a_0 {
  void *__isa;
__Block_byref_a_0 *__forwarding;
 int __flags;
 int __size;
 int a;
};

// block
struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __Block_byref_a_0 *a; // by ref
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_a_0 *_a, int flags=0) : a(_a->__forwarding) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};

// block函数体
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
  __Block_byref_a_0 *a = __cself->a; // bound by ref

            (a->__forwarding->a);
        }
// 辅助copy函数
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->a, (void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

// 辅助dispose函数
static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
  void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};
int main(int argc, const char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
        // 这里创建了,并将a的flags设置为0
        __attribute__((__blocks__(byref))) __Block_byref_a_0 a = {(void*)0,(__Block_byref_a_0 *)&a, 0, sizeof(__Block_byref_a_0)};
;
        Block block = (void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344);
    }
    return 0;
}

从上面代码中,被__block修饰的a变量变为了__Block_byref_a_0类型,根据这个格式,从源码中查看得到相似的定义:

struct Block_byref {
    void *isa;
    struct Block_byref *forwarding;
    int flags; /* refcount; */
    int size;
    void (*byref_keep)(struct Block_byref *dst, struct Block_byref *src);
    void (*byref_destroy)(struct Block_byref *);
    /* long shared[0]; */
};

// 做下对比
struct __Block_byref_a_0 {
  void *__isa;
__Block_byref_a_0 *__forwarding;
 int __flags;
 int __size;
 int a;
};

// flags/_flags类型
enum {
        /* See function implementation for a more complete description of these fields and combinations */
        // 是一个对象
        BLOCK_FIELD_IS_OBJECT   =  3,  /* id, NSObject, __attribute__((NSObject)), block, ... */
        // 是一个block
        BLOCK_FIELD_IS_BLOCK    =  7,  /* a block variable */
        // 被__block修饰的变量
        BLOCK_FIELD_IS_BYREF    =  8,  /* the on stack structure holding the __block variable */
        // 被__weak修饰的变量,只能被辅助copy函数使用
        BLOCK_FIELD_IS_WEAK     = 16,  /* declared __weak, only used in byref copy helpers */
        // block辅助函数调用(告诉内部实现不要进行retain或者copy)
        BLOCK_BYREF_CALLER      = 128  /* called from __block (byref) copy/dispose support routines. */
    };

可以看出,__block将原来的基本类型包装成了对象。因为以上两个结构体的前4个成员的类型都是一样的,内存空间排列一致,所以可以进行以下操作:

// 转换成C++代码
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->a, (void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

// _Block_object_assign源码
void _Block_object_assign(void *destAddr, const void *object, const int flags) {
...
    else if ((flags & BLOCK_FIELD_IS_BYREF) == BLOCK_FIELD_IS_BYREF)  {
        // copying a __block reference from the stack Block to the heap
        // flags will indicate if it holds a __weak reference and needs a special isa
        _Block_byref_assign_copy(destAddr, object, flags);
    }
...
}

// _Block_byref_assign_copy源码
static void _Block_byref_assign_copy(void *dest, const void *arg, const int flags) {
    // 这里因为前面4个成员的内存分布一样,所以直接转换后,使用Block_byref的成员变量名,能访问到__Block_byref_a_0的前面4个成员
    struct Block_byref **destp = (struct Block_byref **)dest;
    struct Block_byref *src = (struct Block_byref *)arg;
...
    else if ((src->forwarding->flags & BLOCK_REFCOUNT_MASK) == 0) {
        // 从main函数对__Block_byref_a_0的初始化,可以看到初始化时将flags赋值为0
        // 这里表示第一次拷贝,会进行复制操作,并修改原来flags的值
        // static int _Byref_flag_initial_value = BLOCK_NEEDS_FREE | 2;
        // 可以看出,复制后,会并入BLOCK_NEEDS_FREE,后面的2是block的初始引用计数
        ...
        copy->flags = src->flags | _Byref_flag_initial_value;
        ...
    }
    // 已经拷贝到堆了,只增加引用计数
    else if ((src->forwarding->flags & BLOCK_NEEDS_FREE) == BLOCK_NEEDS_FREE) {
        latching_incr_int(&src->forwarding->flags);
    }
    // 普通的赋值,里面最底层就*destptr = value;这句表达式
    _Block_assign(src->forwarding, (void **)destp);
}

主要操作都在代码注释中了,总体来说,__block修饰的基本类型会被包装为对象,并且只在最初block拷贝时复制一次,后面的拷贝只会增加这个捕获变量的引用计数。

对象的辅助函数
  • 没有__block修饰
typedef void(^Block)();
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSObject *a = [[NSObject alloc] init];
        Block block = ^ {
            a;
        };
    }
    return 0;
}

首先,在没有__block修饰时,对象编译转换的结果如下,删除了一些变化不大的代码:

static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
  NSObject *a = __cself->a; // bound by copy
            a;
        }
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->a, (void*)src->a, 3/*BLOCK_FIELD_IS_OBJECT*/);}

static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->a, 3/*BLOCK_FIELD_IS_OBJECT*/);}

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
  void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0),

对象在没有__block修饰时,并没有产生__Block_byref_a_0结构体,只是将标志位修改为BLOCK_FIELD_IS_OBJECT。而在_Block_object_assign中对应的判断分支代码如下:

...
else if ((flags & BLOCK_FIELD_IS_OBJECT) == BLOCK_FIELD_IS_OBJECT) {
    _Block_retain_object(object);
    _Block_assign((void *)object, destAddr);
}
...

可以看到,block复制时,会retain捕捉对象,以增加其引用计数。

  • __block修饰
typedef void(^Block)();
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        __block NSObject *a = [[NSObject alloc] init];
        Block block = ^ {
            a;
        };
    }
    return 0;
}

在这种情况下,编译转换的部分结果如下:

struct __Block_byref_a_0 {
  void *__isa;
__Block_byref_a_0 *__forwarding;
 int __flags;
 int __size;
 void (*__Block_byref_id_object_copy)(void*, void*);
 void (*__Block_byref_id_object_dispose)(void*);
 NSObject *a;
};
int main(int argc, const char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
attribute__((__blocks__(byref))) __Block_byref_a_0 a = {(void*)0,(__Block_byref_a_0 *)&a, 33554432, sizeof(__Block_byref_a_0), __Block_byref_id_object_copy_131, __Block_byref_id_object_dispose_131,....};
Block block = (void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344);
}

// 以下的40表示__Block_byref_a_0对象a的位移(4个指针(32字节)+2个int变量(8字节)=40字节)
static void __Block_byref_id_object_copy_131(void *dst, void *src) {
 _Block_object_assign((char*)dst + 40, *(void * *) ((char*)src + 40), 131);
}
static void __Block_byref_id_object_dispose_131(void *src) {
 _Block_object_dispose(*(void * *) ((char*)src + 40), 131);
}

可以看到,对于对象,__Block_byref_a_0另外增加了两个辅助函数__Block_byref_id_object_copy__Block_byref_id_object_dispose,以实现对对象内存的管理。其中两者的最后一个参数131表示BLOCK_BYREF_CALLER|BLOCK_FIELD_IS_OBJECT,BLOCK_BYREF_CALLER表示在内部实现中不对a对象进行retain或copy;以下为相关源码:

if ((flags & BLOCK_BYREF_CALLER) == BLOCK_BYREF_CALLER) {
    ...
    else {
        // do *not* retain or *copy* __block variables whatever they are
        _Block_assign((void *)object, destAddr);
    }
}

_Block_byref_assign_copy函数的以下代码会对上面的辅助函数(__Block_byref_id_object_copy_131)进行调用;570425344表示BLOCK_HAS_COPY_DISPOSE|BLOCK_HAS_DESCRIPTOR,所以会执行以下相关源码:

if (src->flags & BLOCK_HAS_COPY_DISPOSE) {
    // Trust copy helper to copy everything of interest
    // If more than one field shows up in a byref block this is wrong XXX
    copy->byref_keep = src->byref_keep;
    copy->byref_destroy = src->byref_destroy;
    (*src->byref_keep)(copy, src);
}

ARC中block的工作

苹果说明

苹果文档提及,在ARC模式下,在栈间传递block时,不需要手动copy栈中的block,即可让block正常工作。主要原因是ARC对栈中的block自动执行了copy,将_NSConcreteStackBlock类型的block转换成了_NSConcreteMallocBlock的block。
block试验

下面对block做点实验:

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        int i = 10;
        void (^block)() = ^{i;};

        __weak void (^weakBlock)() = ^{i;};

        void (^stackBlock)() = ^{};

        // ARC情况下

        // 创建时,都会在栈中
        // <__NSStackBlock__: 0x7fff5fbff730>
        NSLog(@"%@", ^{i;});

        // 因为block为strong类型,且捕获了外部变量,所以赋值时,自动进行了copy
        // <__NSMallocBlock__: 0x100206920>
        NSLog(@"%@", block);

        // 如果是weak类型的block,依然不会自动进行copy
        // <__NSStackBlock__: 0x7fff5fbff728>
        NSLog(@"%@", weakBlock);

        // 如果block是strong类型,并且没有捕获外部变量,那么就会转换成__NSGlobalBlock__
        // <__NSGlobalBlock__: 0x100001110>
        NSLog(@"%@", stackBlock);

        // 在非ARC情况下,产生以下输出
        // <__NSStackBlock__: 0x7fff5fbff6d0>
        // <__NSStackBlock__: 0x7fff5fbff730>
        // <__NSStackBlock__: 0x7fff5fbff700>
        // <__NSGlobalBlock__: 0x1000010d0>
    }
    return 0;
}

可以看出,ARC对类型为strong捕获了外部变量的block进行了copy。并且当block类型为strong,但是创建时没有捕获外部变量,block最终会变成__NSGlobalBlock__类型(这里可能因为block中的代码没有捕获外部变量,所以不需要在栈中开辟变量,也就是说,在编译时,这个block的所有内容已经在代码段中生成了,所以就把block的类型转换为全局类型)

block作为参数传递

再来看下使用在栈中的block需要注意的情况:

NSMutableArray *arrayM;
void myBlock()
{
    int a = 5;
    Block block = ^ {
        NSLog(@"%d", a);
    };

    [arrayM addObject:block];
    NSLog(@"%@", block);
}

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        arrayM = @[].mutableCopy;

        myBlock();

        Block block = [arrayM firstObject];
        // 非ARC这里崩溃
        block();
 }

// ARC情况下输出
// <__NSMallocBlock__: 0x100214480>

// 非ARC情况下输出
// <__NSStackBlock__: 0x7fff5fbff738>
// 崩溃,野指针错误

可以看到,ARC情况下因为自动执行了copy,所以返回类型为__NSMallocBlock__,在函数结束后依然可以访问;而非ARC情况下,需要我们手动调用[block copy]来将block拷贝到堆中,否则因为栈中的block生命周期和函数中的栈生命周期关联,当函数退出后,相应的堆被销毁,block也就不存在了。

如果把block的以下代码删除:

NSLog(@"%d", a);

那么block就会变成全局类型,在main中访问也不会出崩溃。

block作为返回值

在非ARC情况下,如果返回值是block,则一般这样操作:

return [[block copy] autorelease];

对于外部要使用的block,更趋向于把它拷贝到堆中,使其脱离栈生命周期的约束。

block属性

这里还有一点关于block类型的ARC属性。上文也说明了,ARC会自动帮strong类型捕获外部变量的block进行copy,所以在定义block类型的属性时也可以使用strong,不一定使用copy。也就是以下代码:

/** 假如有栈block赋给以下两个属性 **/

// 这里因为ARC,当栈block中会捕获外部变量时,这个block会被copy进堆中
// 如果没有捕获外部变量,这个block会变为全局类型
// 不管怎么样,它都脱离了栈生命周期的约束

@property (strong, nonatomic) Block *strongBlock;

// 这里都会被copy进堆中
@property (copy, nonatomic) Block *copyBlock;

参考博文

谈Objective-C Block的实现

iOS中block实现的探究

A look inside blocks: Episode 3

runtime.c

Block_private.h

新增

llvm对于Block的编译规则

ESBlockRuntime

相关文章

  • 【IOS开发高级系列】Block专题

    1 Block机制 (Very Good) Block技巧与底层解析 http://www.jianshu.com...

  • iOS基础:Block底层实现及理解

    本文用于记录近期学习block底层后的理解。本文的参考博文:Block技巧与底层解析谈Objective-C bl...

  • Block技巧与底层解析

    目录 Block底层解析什么是block?block编译转换结构block实际结构block的类型NSConcre...

  • Block底层原理分析

    iOSBlock底层原理解析 目录 Block底层解析什么是block?block编译转换结构block实际结构b...

  • iOS中Block的用法,举例,解析与底层原理(这可能是最详细的

    iOS中Block的用法,举例,解析与底层原理(这可能是最详细的Block解析)

  • block

    iOS中Block的用法,举例,解析与底层原理(这可能是最详细的Block解析)[http://www.cocoa...

  • 5. block

    目录 Block底层解析什么是block?block编译转换结构block实际结构block的类型NSConcre...

  • iOS Block底层解析二

    一、__block 的解析 接上一篇《iOS Block底层解析一》,在block中我们要修改局部变量(自动局部变...

  • 简述Block底层

    Block底层解析 block编译转换结构 对其执行clang -rewrite-objc编译转换成C++实现,得...

  • Block篇

    但是这种解决方案有一个弊端,如果长时间或永远不调用block,这个环就一直存在Block的用法,举例,解析与底层原...

网友评论

  • Unicodeo:首先表示对楼主的膜拜。。其次想问问,block记录大小,有没有记录创建时所在的文件名与行数?
  • 疯子一样男人:楼主、为啥我 clang -rewrite-objc 终端说找不到文件啊
    wuyukobe:因为objc后面要跟你的文件名称:clang -rewrite-objc math.c
  • 敌敌味丶:绝对好文!!!
  • rollingstoneW:"从main函数中看, __main_block_impl_0的FuncPtr指向了函数__main_block_func_0"
    这里不太懂,不应该是__main_block_impl_0这个结构体的变量impl的FuncPtr指向了函数__main_block_func_0吗
  • 111浪子111:非常详细,多谢楼主分享
  • 破弓:NSLog(@"zc count start");
    __block NSObject *a = [[NSObject alloc] init];
    Block block1 = ^ {
    a = [[NSObject alloc] init];
    };
    NSLog(@"zc count end");
    //我给_Block_object_assign加了符号断点
    --------------------------------------------------
    打印结果:
    2017-08-19 16:46:46.186 addProTrain[23705:1230540] zc count start
    zc _Block_object_assign
    2017-08-19 16:46:55.745 addProTrain[23705:1230540] zc count end

    照本文分析:
    __main_block_copy_0 --> _Block_object_assign
    __Block_byref_id_object_copy_131 --> _Block_object_assign
    应该有两次调用啊?
  • Lion_Liu:很深刻,刚看完狮子头,对比补充下,印象更深刻了,:+1:
  • Remantou:self隐式循环调用应用那段:
    - (void)test
    {
    void (^_block)() = ^{
    _a = 10;
    };
    }
    应该是:
    - (void)test
    {
    _block = ^{
    _a = 10;
    };
    }
    才会造成循环引用吧?
  • 飞鱼湾:博主厉害,希望多出好文
  • 骑毛驴的小强:最近也研究了很多block,一直想写出像AFN 等这样的不要解决循环引用的block,水平不够,博主有没有好的思路?
  • 半块:- (void)test
    {
    int a = 0;
    // 利用指针p存储a的地址
    int *p = &a;

    ^{
    // 通过a的地址设置a的值
    *p = 10;
    };
    }
    这样修改一样是改变不了 a的值 亲测
    tripleCC:@半块 嗯,是的,我关于这一块的内容都只是创建了block,并没有调用。
  • Alonso_Feng:写的确实很深入,想问下博主,下面的这些源码在哪里可以看到?runtime源码中没找到啊!

    _Block_object_assign源码
    void _Block_object_assign(void *destAddr, const void *object, const int flags) {
    ...
    else if ((flags & BLOCK_FIELD_IS_BYREF) == BLOCK_FIELD_IS_BYREF) {
    // copying a __block reference from the stack Block to the heap
    // flags will indicate if it holds a __weak reference and needs a special isa
    _Block_byref_assign_copy(destAddr, object, flags);
    }
    ...
    }

    // _Block_byref_assign_copy源码
    8fd97c19fbae:你好,我想请问下,__block 修饰的自动变量捕获的时候,这个自动变量被封装到了一个结构体中,他是作为这个结构体的一个成员变量,当这个结构体被复制到堆上的时候,他的成员变量不会一起复制吗,为什么还要在 des 中有那个 copy 将自动变量复制过去呢,还是我理解错了
    Lion_Liu:https://opensource.apple.com/source/clang/clang-800.0.42.1/src/projects/compiler-rt/lib/BlocksRuntime/runtime.c.auto.html
  • 01207e981f18:自己看了下源码,对于__block的原理不是特别理解,看了你的解释之后明白了,多谢分享
  • OldSix1987:对象在没有__block修饰时,并没有产生__Block_byref_a_0结构体,只是将标志位修改为BLOCK_FIELD_IS_OBJECT。而在_Block_object_assign中对应的判断分支代码如下

    block内部只是引用外部oc对象而没有做blockcopy的话,oc对象的引用计数器不会+1,源码调用了block_retain,但是里面什么也没做。只有在block_copy且没有加__block修饰时,外部oc对象的引用计数器才会+1
    OldSix1987:感谢楼主如此认真诚恳的回复!之前留言有些仓促,应该是我错了。源码看起来确认比较蛋疼,简单的代码的调试其实可以看出来引用计数器肯定是+1的,源码应该是你说的那样。受教了,希望多多分享好文! :+1:
    tripleCC:@OldSix1987 嗯,多谢提醒。
    这里我后面也指明了《可以看到,block`复制`时,会retain捕捉对象,以增加其引用计数。》,也就是在copy block时会retain捕捉对象,可能写的不太清晰吧。
    还有《oc对象的引用计数器不会+1,源码调用了block_retain,但是里面什么也没做》这里我不是很同意。你说的代码应该是下面这一部分吧:
    ******************************************
    // 1
    static void _Block_assign_default(void *value, void **destptr) {
    *destptr = value;
    }
    static void (*_Block_retain_object)(const void *ptr) = _Block_retain_object_default;
    // 2
    void _Block_use_GC( void *(*alloc)(const unsigned long, const bool isOne, const bool isObject),
    void (*setHasRefcount)(const void *, const bool),
    void (*gc_assign)(void *, void **),
    void (*gc_assign_weak)(const void *, void *),
    void (*gc_memmove)(void *, void *, unsigned long)) {

    _Block_retain_object = _Block_do_nothing;
    _Block_release_object = _Block_do_nothing;
    _Block_assign_weak = gc_assign_weak;
    _Block_memmove = gc_memmove;
    }
    ******************************************
    上面部分代码都表明_Block_retain_object里面实际上并没有执行真正有效的代码,在默认和GC情况都是。不过我感觉下面一段代码可能会改变里面的动作:

    ******************************************
    void _Block_use_RR( void (*retain)(const void *),
    void (*release)(const void *)) {
    _Block_retain_object = retain;
    _Block_release_object = release;
    }
    ******************************************
    从block的copy来看,确实会有retain的动作,所以我猜测可能有这样一段代码:
    ******************************************
    // ESBlockRuntime的实现
    _Block_use_RR( (retain)&CFRetain, &CFRelease );
    ******************************************

    指定了_Block_retain_object的动作,实际上是有进行retain的,只是我没有对block进行copy动作,也就没有调用_Block_object_assign函数。
    以上是我的一些粗略的看法==
  • ryugaku:好详细(✪▽✪)
  • S7iang:超赞,看了这篇才更加深入的理解block的机制了。。
  • Joy___:mark
  • ftxbird:楼主写的很棒 通俗易懂
  • SeanKChan:正在看,楼主写的很不错
  • 落叶纷飞:make
    仰望星空之Rocky:@落叶纷飞 mark
  • 不知什么人: :+1: 很透彻,感谢博主~
  • Kent_Zhang:一开始我还以为是和static inline 类似的东西,现在看来有不少区别啊
  • ddaa8dae50b0:__block int a, 如果在block中对a进行修改, 之后在block外部访问a时得到的是被block修改之后的a.

    __block修饰的基本类型 包装成对象后, 是怎么完成对基本类型变量的修改的?

    如果基本类型变量a所在的栈被销毁了, 之后在block中对包裹成对象的a进行修改, block会不会尝试也对栈中的a进行修改(因为要将修改保存到外部), 会不会发生崩溃? 不崩溃的话是怎么做到的?
    139f64266ee5:@Ian_He 感觉这么说不严谨,应该是在block被copy(到堆上)后,__block修饰的变量才会被copy到堆上(__forwarding指向了堆上的__block修饰的变量)。
    ddaa8dae50b0:@tripleCC 也就是说, 编译器把用__block修饰的基本类型变量全部放到堆上包装成对象了, "栈里面的那个变量"在block内外都不会用到, 或者说是不存在.

    以前觉得加了__block修饰后, 就能访问到外面了, 其实是加了__block之后, 外面全部都访问堆了.

    学到很多, 感谢楼主的无私奉献(´ε`)
    tripleCC:1、修改是通过block转化后结构体中的FuncPtr函数指针所指向的函数执行以下语句:
    **************************
    (a->__forwarding->a) = 10;
    **************************

    2、不会,借鉴1,__forwarding指向的是堆中包装的对象a,后面对栈中a的访问
    ,编译器会把它全部转换成对堆中a的访问。我写个例子给你吧:

    - 方法代码
    **************************
    - (void)test
    {
    __block int a;
    _block = ^{
    a = 10;
    };
    _block();
    a;
    }
    **************************
    - 编译转换后的方法代码
    **************************
    // 这个就是你问的问题1
    **************************
    static void __Person__test_block_func_0(struct __Person__test_block_impl_0 *__cself) {
    __Block_byref_a_0 *a = __cself->a; // bound by ref
    // 这里的__forwarding指针指向的是堆中包装成对象的a
    (a->__forwarding->a) = 10;
    }
    **************************

    **************************
    // 这个就是你问的问题2
    static void _I_Person_test(Person * self, SEL _cmd) {
    __attribute__((__blocks__(byref))) __Block_byref_a_0 a = {(void*)0,(__Block_byref_a_0 *)&a, 0, sizeof(__Block_byref_a_0)};
    ;
    (*(void (**)())((char *)self + OBJC_IVAR_$_Person$_block)) = (void (*)())&__Person__test_block_impl_0((void *)__Person__test_block_func_0, &__Person__test_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344);

    ((void (*)(__block_impl *))((__block_impl *)(*(void (**)())((char *)self + OBJC_IVAR_$_Person$_block)))->FuncPtr)((__block_impl *)(*(void (**)())((char *)self + OBJC_IVAR_$_Person$_block)));

    // 可以看到这里对a的访问变成了对堆中a的访问
    (a.__forwarding->a);
    }
    **************************@OrlAnd0
  • tripleCC:@OrlAnd0 有些东西,知道所以然才爽…
    Edgarss:大赞 写的真好 看过的 blcok 文章研究最全面的:+1:
  • ddaa8dae50b0:总之 把总结记住就行了 每天都来看几遍记住==!
    zedxpp:没毛病, 总结的很全了.
  • 我是乔忘记疯狂:底层实现源码几乎看不懂,但每段分析总结还是挺好理解的,读完确实加深了自己对block的理解,绝对好文!
    Edgarss:上边写的很清楚的啊 大致终端在桌面touch 个 block.c 的文件,然后点进去或者 vim 进去修改代码 之后 clang rewrite-objc block.c 桌面就是生成的 clang 后的.cpp 文件 也就是楼主说的内容了。
    VenpleD:默默地问下,怎么搞出底层实现源码啊?有没有帖子啊?
    表哥it分享:@我是乔忘记疯狂 底层源码 你可以把一些桥接给注释掉 然后整理下 大致能看懂

本文标题:Block技巧与底层解析

本文链接:https://www.haomeiwen.com/subject/dnppqttx.html