發表於 2015-12-16
特别声明
本文转自https://www.zybuluo.com/MicroCai/note/51120 – MicroCai
最近使用到block , 虽说是会用, 但是对原理及其模糊, 和在什么情况下该注意些什么东西, 脑海中印象比较模糊, 顾整理一些资料, 方便学习和查阅吧.
block的实现
什么是block
block 顾名思义就是代码块
,将同一逻辑的代码放在一个块,使代码更简洁紧凑,易于阅读,而且它比函数使用更方便,代码更美观,因而广受开发者欢迎。但同时 block 也是 iOS 开发中坑最多的地方之一,因此有必要了解下 block 的实现原理,知其然,更知其所以然,才能从根本上避免挖坑和踩坑。
需要知道的是,block 只是 Objective-C 对闭包的实现,并不是 iOS 独有的概念,在 C++、Java 等语言也有实现闭包,名称不同而已。
特别声明
以下研究所用的过程代码由 clang 编译前端生成,仅作理解之用。实际上 clang 根本不会将 block 转换成人类可读的代码,它对 block 到底做了什么,谁也不知道。
所以,切勿将过程代码当做block的实际实现,切记切记!!!
将下面的test.m
代码用 clang
工具翻译 test.cpp
代码
clang -rewrite-objc test.m
test.m 代码
1
|
/************* Objective-C 源码 *************/
|
test.cpp
1
|
/************* 使用 clang 翻译后如下 *************/
|
接着,我们逐一来看下这些函数和结构体
block 结构体信息详解
struct __block_impl
1
|
// __block_impl 是 block 实现的结构体
|
-
isa
指向实例对象,表明 block 本身也是一个 Objective-C 对象。block 的三种类型:_NSConcreteStackBlock
、_NSConcreteGlobalBlock
、_NSConcreteMallocBlock
,即当代码执行时,isa 有三种值impl.isa = &_NSConcreteStackBlock; // 保存在栈中的 block,当函数返回时会被销毁
impl.isa = &_NSConcreteMallocBlock; //保存在堆中的 block,当引用计数为 0 时会被销毁。
impl.isa = &_NSConcreteGlobalBlock; //全局的静态 block,不会访问任何外部变量。 -
Flags
按位承载 block 的附加信息; -
Reserved
保留变量; -
FuncPtr
函数指针,指向 Block 要执行的函数,即{ printf(“Block\n”) };
struct __main_block_impl_0
1
2
3
4
5
6
7
8
9
10
11
12
13// __main_block_impl_0 是 block 实现的结构体,也是 block 实现的入口
struct __main_block_impl_0
{
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0)
{
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
-
impl
block 实现的结构体变量,该结构体前面已说明; -
Desc
描述 block 的结构体变量; -
__main_block_impl_0
结构体的构造函数,初始化结构体变量 impl、Desc;
static void __main_block_func_0
1
2
3
4
5// __main_block_func_0 是 block 要最终要执行的函数代码
static void __main_block_func_0(struct __main_block_impl_0 *__cself)
{
printf("Block\n");
}
static struct __main_block_desc_0
1
2
3
4
5
6// __main_block_desc_0 是 block 的描述信息结构体
static struct __main_block_desc_0
{
size_t reserved;
size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0) };
-
reserved
结构体信息保留字段 -
Block_size
结构体大小
此处已定义了一个该结构体类型的变量 __main_block_desc_0_DATA
block 获取外部变量
运行下面的代码
1
2
3
4
5
6
7int main()
{
int intValue = 1;
void (^blk)(void) = ^{ printf("intValue = %d\n", intValue); };
blk();
return 0;
}
打印结果
intValue = 1
和第一段源码不同的是,这里多了个局部变量intValue
,而且还在 block 里面获取到了。
通过前一段对 block 源码的学习,我们已经了解到 block 的函数定义在 main() 函数之外,那它又是如何获取 main() 里面的局部变量呢?为了解开疑惑,我们再次用 clang 重写这段代码
1
|
struct __block_impl
|
原来 block 通过参数值传递获取到intValue
变量,通过函数
main_block_impl_0 (void *fp, struct main_block_desc_0 *desc, int _intValue, int flags=0) : intValue(_intValue)
保存到__main_block_impl_0
结构体的同名变量intValue
,通过代码 int intValue = __cself->intValue
; 取出 intValue
,打印出来。
构造函数 __main_block_impl_0 冒号后的表达式 intValue(_intValue) 的意思是,用 _intValue 初始化结构体成员变量 intValue。
有四种情况下应该使用初始化表达式来初始化成员:
1:初始化const成员
2:初始化引用成员
3:当调用基类的构造函数,而它拥有一组参数时
4:当调用成员类的构造函数,而它拥有一组参数时参考:C++类成员冒号初始化以及构造函数内赋值: http://blog.csdn.net/zj510/article/details/8135556
block和变量的内存管理
了解了 block的实现,我们接着来聊聊 block 和变量的内存管理。将介绍可写变量、block的内存段、__block变量的内存段等内容,看完本文会对 block 和变量的内存管理有更加清晰的认识。
- 全局变量
- 全局静态变量
- 静态变量
全局变量
和全局静态变量
由于作用域在全局,所以在 block 内访问和读写这两类变量和普通函数没什么区别,而 静态变量
作用域在 block 之外,是怎么对它进行读写呢?通过clang
工具,我们发现原来 静态变量
是通过指针传递,将变量传递到 block 内,所以可以修改变量值。而上文中的外部变量是通过值传递,自然没法对获取到的外部变量进行修改。由此,可以给我们一个启示,当我们需要修改外部变量时,是不是也可以像 静态变量
这样通过指针来修改外部变量的值呢?
Apple 早就为我们准备了这么一个东西 —— “__block”
__block 说明符
按照惯例,重写一小段代码看看 __block 的真身
1
|
/************* 使用 __block 的源码 *************/
|
1
|
/************* 使用 clang 翻译后如下 *************/
|
在加了__block
之后,代码量增加了不少,仔细查看,其实只是比原来多了
- Block_byref_intValue_0 结构体:用于封装 block 修饰的外部变量。
- _Block_object_assign 函数:当 block 从栈拷贝到堆时,调用此函数。
- _Block_object_dispose 函数:当 block 从堆内存释放时,调用此函数。
OC源码中的 __block intValue
翻译后变成了__Block_byref_intValue_0
结构体指针变量 intValue,通过指针传递到 block
内,这与前面说的静态变量
的指针传递是一致的。除此之外,整体的执行流程与不加__block
基本一致,不再赘述。但 __Block_byref_intValue_0
这个结构体需特别注意下
1
|
// 存储 __block 外部变量的结构体
|
在已有结构体指针指向__Block_byref_intValue_0
时,结构体里面还多了个__forwarding
指向自己的指针变量,难道不显得多余吗?一点也不,本文后面会阐述。
block 的内存管理
在前文中,已经提到了 block 的三种类型 NSConcreteGlobalBlock
、_NSConcreteStackBlock
、_NSConcreteMallocBlock
,见名知意,可以看出三种 block 在内存中的分布
_NSConcreteGlobalBlock
1、当 block 字面量写在全局作用域时,即为 global block;
2、当 block 字面量不获取任何外部变量时,即为 global block;
除了上述描述的两种情况,其他形式创建的 block 均为 stack block。
// 下面 block 虽然定义在 for 循环内,但符合第二种情况,所以也是 global block
1
|
typedef int (^blk_t)(int);
|
_NSConcreteGlobalBlock
类型的 block 处于内存的 ROData 段,此处没有局部变量的骚扰,运行不依赖上下文,内存管理也简单的多。
_NSConcreteStackBlock
_NSConcreteStackBlock
类型的 block
处于内存的栈区。global bloc
k 由于处在 data 段,可以通过指针安全访问,但 stack block
处在内存栈区,如果其变量作用域结束,这个 block
就被废弃,block 上的__block
变量也同样会被废弃。
为了解决这个问题,block 提供了 copy 的功能,将 block 和__block
变量从栈拷贝到堆,就是下面要说的 _NSConcreteMallocBlock
。
_NSConcreteMallocBlock
当 block 从栈拷贝到堆后,当栈上变量作用域结束时,仍然可以继续使用 block
1
impl.isa = &_NSConcreteMallocBlock;
如果你细心的观察上面的转换后的代码,会发现访问结构体 __Block_byref_intValue_0
内部的成员变量都是通过访问 __forwarding
指针完成的。为了保证能正确访问栈上的__block
变量,进行 copy
操作时,会将栈上的__forwarding
指针指向了堆上的block
结构体实例。
block 的自动拷贝和手动拷贝
在开启 ARC 时,大部分情况下编译器通常会将创建在栈上的 block 自动拷贝到堆上,只有当
block 作为方法或函数的参数传递时,编译器不会自动调用 copy 方法;
但方法/函数在内部已经实现了一份拷贝了 block 参数的代码,或者如果编译器自动拷贝,那么调用者就不需再手动拷贝,比如:
- 当
block
作为函数返回值返回时,编译器自动将block
作为_Block_copy
函数,效果等同于 block 直接调用copy
方法;- 当
block
被赋值给__strong id
类型的对象或block
的成员变量时,编译器自动将block
作为_Block_copy
函数,效果等同于block
直接调用copy
方法;- 当
block
作为参数被传入方法名带有usingBlock
的Cocoa Framework
方法或 GCD 的 API 时。这些方法会在内部对传递进来的block
调用copy
或_Block_copy
进行拷贝;
让我们看个 block 自动拷贝的例子
1
|
/************ ARC下编译器自动拷贝block ************/
|
上面的 block 获取了外部变量,所以是创建在栈上,当 func 函数返回给调用者时,脱离了局部变量 rate 的作用范围,如果调用者使用这个 block 就会出问题。那 ARC 开启的情况呢?运行这个 block 一切正常。和我们的预期结果不一样,ARC 到底给 block 施了什么魔法?我们将上面的代码翻译下
1
|
blk_t func(int rate)
|
转换后出现两个新函数 objc_retainBlock
、objc_autoreleaseReturnValue
。如果你看过runtime 库(点此下载:http://opensource.apple.com/tarballs/objc4/objc4-493.9.tar.gz) ,在runtime/objc-arr.mm
文件中就有这两个函数的实现:
1
|
/*********** objc_retainBlock() 的实现 ***********/
|
1
|
/*********** objc_autoreleaseReturnValue() 的实现 ***********/
|
通过上面的代码和注释,意思就很明显了,由于 block
字面量是创建在栈内存,通过 objc_retainBlock()
函数拷贝到堆内存,让 tmp
重新指向堆上的 block
,然后将tmp
所指的堆上的block
作为一个Objective-C
对象放入 autoreleasepool
里面,从而保证了返回后的block
仍然可以正确执行。
看完了block
的自动拷贝,那么看看在ARC
下需要手动拷贝block
的例子
1
|
/************ ARC下编译器手动拷贝block ************/
|
一个例子就了然,返回的数组里面的 block 是不可用的,需要再手动拷贝一次才可以,这个较为简单,就不作过多解释。
关于 block 的拷贝操作可以用一张表总结下
__block 变量的内存管理
上面啰嗦一堆,这小节主要用图说话,必要时加文字说明。
- 当 block 从栈内存被拷贝到堆内存时,block 变量的变化如下图。需要说明的是,当栈上的 block 被拷贝到堆上,堆上的 block 再次被拷贝时,对 block 变量已经没有影响了。
-
当多个 block 获取同一个 __block 变量,block 从栈被拷贝到堆时
-
当 block 被废弃时,__block 变量被释放
-
forwarding
前文已经说过,当block
从栈被拷贝到堆时,forwarding指针变量也会指向堆区的结构体。但是为什么要这么做呢?为什么要让原本指向栈区的结构体的指针,去指向堆区的结构体呢?看起来匪夷所思,实则原因很简单,要从__forwarding
产生的缘由说起。想想起初为什么要给block
添加copy
的功能,就是因为block
获取了局部变量,当要在其他地方(超出局部变量作用范围)使用这个 block 的时候,由于访问局部变量异常,导致程序崩溃。为了解决这个问题,就给 block 添加了 copy 功能。在将 block 拷贝到堆上的同时,将__forwarding
指针指向堆上结构体。后面如果要想使用__block
变量,只要通过__forwarding
访问堆上变量,就不会出现程序崩溃了。
1
|
/*************** __forwarding 的作用 ***************/
|
一定有很多人会猜1
,其实打印2
。原因很简单,当栈上的bloc
k 被拷贝到堆上时,栈上的 __forwarding
也会指向堆上的__block
变量的结构体。
上面的代码中^{++val;}
和 ++val
; 都会被转换成 ++(val.__forwarding->val)
;,堆上的 val
被加了两次,最后打印堆上的 val
为2
。
block 和变量的内存管理终于讲完了,看似很长,只要了解本质,其实很简单(PS: 其实我也是看的迷迷糊糊的, 似懂非懂. 留下来慢慢研究吧)
block和对象的内存管理
获取对象
照例先来段代码轻松下,瞧瞧 block 是怎么获取外部对象的
1
|
/********************** capturing objects **********************/
|
翻译后的关键代码摘录如下
1
|
/* a struct for the Block and some functions */
|
在本例中,当变量变量作用域结束时,array
被废弃,强引用失效,NSMutableArray
类的实例对象会被释放并废弃。在这危难关头,block 及时调用了copy
方法,在 _Block_object_assign
中,将 array
赋值给 block
成员变量并持有。所以上面代码可以正常运行,打印出来的 array count
依次递增。
总结代码可正常运行的原因关键就在于 block
通过调用copy
方法,持有了 __strong
修饰的外部变量,使得外部对象在超出其作用域后得以继续存活,代码正常执行。
在以下情形中, block 会从栈拷贝到堆:
- 当 block 调用 copy 方法时,如果 block 在栈上,会被拷贝到堆上;
- 当 block 作为函数返回值返回时,编译器自动将 block 作为 _Block_copy 函数,效果等同于 block 直接调用 copy 方法;
- 当 block 被赋值给 __strong id 类型的对象或 block 的成员变量时,编译器自动将 block 作为 _Block_copy 函数,效果等同于 block 直接调用 copy 方法;
- 当 block 作为参数被传入方法名带有 usingBlock 的 Cocoa Framework 方法或 GCD 的 API 时。这些方法会在内部对传递进来的 block 调用 copy 或 _Block_copy 进行拷贝;
其实后三种情况在上篇文章block的自动拷贝已经做过说明
除此之外,都需要手动调用。
__延伸阅读:Objective-C 结构体中的 strong 成员变量__
注意到 main_block_impl_0 结构体有什么异常没?在 C 结构体中出现了 strong 关键字修饰的变量。
通常情况下, Objective-C 的编译器因为无法检测 C 结构体初始化和释放的时间,不能进行有效的内存管理,所以 Objective-C 的 C 结构体成员是不能用 strong、weak 等等这类关键字修饰。然而 runtime 库是可以在运行时检测到 block 的内存变化,如 block 何时从栈拷贝到堆,何时从堆上释放等等,所以就会出现上述结构体成员变量用 __strong 修饰的情况。
__block 变量和对象
__block 说明符可以修饰任何类型的自动变量。下面让我们再看个小例子,啊,愉快的代码时间又到啦。
1
|
/******* block 修饰对象 *******/
|
ARC 下,对象所有权修饰符默认为 __strong
,即
1
|
__block id __strong obj = [[NSObject alloc] init];
|
1
|
/******* block 修饰对象转换后的代码 *******/
|
__block id __strong obj
的作用和 id __strong obj
的作用十分类似。当__block id __strong obj
从栈上拷贝到堆上时,_Block_object_assig
n 被调用,block
持有 obj;当 __block id __strong obj
从堆上被废弃时,_Block_object_dispose
被调用用以释放此对象,block 引用消失。
所以,只要是堆上的 __strong
修饰符修饰的 __block
对象类型的变量,和 block
内获取到的 __strong
修饰符修饰的对象类型的变量,编译器都能对它们的内存进行适当的管理。
如果上面的 __strong
换成 __weak
,结果会怎样呢?
1
|
********************** capturing __weak objects **********************/
|
结果是:
array2 count = 0
array2 count = 0
array2 count = 0
原因很简单,array2 是弱引用,当变量作用域结束,array 所指向的对象内存被释放,array2 指向 nil,向 nil 对象发送 count 消息就返回结果 0 了。
如果 weak 再改成 unsafe_unretained 呢?__unsafe_unretained 修饰的对象变量指针就相当于一个普通指针。使用这个修饰符有点需要注意的地方是,当指针所指向的对象内存被释放时,指针变量不会被置为 nil。所以当使用这个修饰符时,一定要注意不要通过悬挂指针(指向被废弃内存的指针)来访问已经被废弃的对象内存,否则程序就会崩溃。
如果 unsafe_unretained 再改成 autoreleasing 会怎样呢?会报错,编译器并不允许你这么干!如果你这么写
1
|
_block id __autoreleasing obj = [[NSObject alloc] init];
|
编译器就会报下面的错误,意思就是 block 和 autoreleasing 不能同时使用。
1
|
error: __block variables cannot have __autoreleasing ownership __block id __autoreleasing obj = [[NSObject alloc] init];
|
循环引用
千辛万苦,重头戏终于来了。block 如果使用不小心,就容易出现循环引用,导致内存泄露。到底哪里泄露了呢?通过前面的学习,各位童鞋应该有个底了,下面就让我们一起进入这泄露地区瞧瞧,哪儿出了问题!
愉快的代码时间到
1
|
// ARC enabled
|
由于 self 是__strong
修饰,在 ARC 下,当编译器自动将代码中的 block 从栈拷贝到堆时,block 会强引用和持有 self,而 self 恰好也强引用和持有了 block
,就造成了传说中的循环引用。
再看一个例子
1
|
@interface MyObject : NSObject
|
上面的例子中,虽然没有直接使用 self,却也存在循环引用的问题。因为对于编译器来说,obj 就相当于 self->obj,所以上面的代码就会变成
1
|
blk_ = ^{ NSLog(@"obj_ = %@", self->obj_); };
|
所以这个例子只要用 __weak,在 init 方法里面加一行即可
1
|
id __weak obj = obj_;
|
破解循环引用还有一招,使用 __block 修饰对象,在 block 内将对象置为 nil 即可,如下
1
|
typedef void (^blk_t)(void);
|
这个例子挺有意思的,如果执行 execBlock 方法,就没有循环引用,如果不执行就有循环引用,挺值得玩味的。一方面,使用 block 挺危险的,万一代码中不执行 block ,就造成了循环引用,而且编译器还没法检查出来;另一方面,使用 block 可以让我们通过 block 变量去控制对象的生命周期,而且有可能在一些非常老旧的 MRC 代码中,由于不支持 weak,我们可以使用此方法来代替 __unsafe_unretained,从而避免悬挂指针的问题。
还有个值得一提的时,在 MRC 下,使用 block 说明符也可以避免循环引用。因为当 block 从栈拷贝到堆时,block 对象类型的变量不会被 retain,没有 block 说明符的对象类型的变量则会被 retian。正是由于 block 在 ARC 和 MRC 下的巨大差异,我们在写代码时一定要区分清楚到底是 ARC 还是 MRC。
尽管 ARC 已经如此普及,我们可能已经可以不用去管 MRC 的东西,但要有点一定要明白,ARC 和 MRC 都是基于引用计数的内存管理,其本质上是一个东西,只不过 ARC 在编译期自动化的做了内存引用计数的管理,使得系统可以在适当的时候保留内存,适当的时候释放内存。
循环引用到此为止,东西并不多。如果明白了之前的知识点,就会了解循环引用不过是前面知识点的自然延伸点罢了。
Copy 和 Release
在 ARC 下,有时需要手动拷贝和释放 block。在 MRC 下更是如此,可以直接用 copy 和 release 来拷贝和释放
1
|
void (^blk_on_heap)(void) = [blk_on_stack copy];
|
拷贝到堆后,就可以 用 retain 持有 block
1
|
[blk_on_heap retain];
|
void (^blk_on_heap)(void) = Block_copy(blk_on_stack);
Block_release(blk_on_heap);
```
Block_copy 的作用相当于之前看到过的 _Block_copy 函数,而且 Objective-C runtime 库在运行时拷贝 block 用的就是这个函数。同理,释放 block 时,runtime 调用了 Block_release 函数。
最后这里有一篇总结 block 的文章的很不错,推荐大家看看:http://tanqisen.github.io/blog/2013/04/19/gcd-block-cycle-retain/
block在美团iOS的实践:http://tech.meituan.com/block-in-Meituan-iOS.html
唐巧的技术博客:http://blog.devtang.com/blog/2013/07/28/a-look-inside-blocks/
总结:虽说是转载别人的帖子过来的. 但是还是收益匪浅…. 说实话这个看起来真的是很长, 但是慢慢的屡下来. 那么还是多少有一些明白的….