理解GCD死锁

作者: 写Blog不取名 | 来源:发表于2016-05-21 16:35 被阅读1757次

因为本文只做分享用,非学术性文章,所以某些理论并不是非常严谨,望大家见谅。写下这篇文章有以下的目:

1. 巩固自己的知识,只有把自己知道的东西系统地组织出来,才知道自己到底知不知道。
2. 分享心得,希望刚入门开发的朋友,能够知其然且知其所以然,而不是仅仅死记硬背哪些情况会造成死锁。
3. 希望看到我博客的朋友,能够为我指出我理解中的不足与错误之处,共同进步。
  • 我写这篇文章时,假设你已具备:
    - GCD的基础知识,能够使用

一、搞清线程(Thread)和队列(Queue)的区别

网上一些讲解关于GCD死锁的文章,有一些非常明显的错误,比如:认为死锁的原因是线程阻塞造成的,这是非常大的误解,GCD死锁的原因是队列阻塞,而不是线程阻塞

Thread与Queue的关系
在开发中,我们会把block(也就是swift中的closure),也就是我们想做的任务,交给GCD函数。GCD函数会把任务放进我们指定的队列(Queue),当然GCD函数内部不止是把任务放进队列,还包括一些其他不为我们所知的操作。队列遵循严格的先进先出原则,同一个Queue中,最早入列的block,会最早被分配给线程执行。系统(“系统”指所有被苹果黑盒封装,未公开源码,我们不能得知的操作,下同)会依据顺序从队列中取出block,并且交由线程执行。GCD队列只是组织待执行任务的一个数据结构封装,而线程,才是执行任务的人。

二、回顾程序执行顺序

要往下面讲,不得不回顾一个再基础不过的知识点,我想,这是每一个程序员,入门就知道的超级简单的知识。虽然它非常基础,但是,这正是造成我们GCD死锁的重要因素。很多困难的问题,它们背后隐藏的东西往往非常简单,因为事物永远不会脱离本质。

让我们来看看下面的这个C程序:

#include <stdio.h>

void printFiveNumbers(){
    printf("开始执行printFiveNumbers函数了\n");
    for (int i = 0; i < 5; i++) {
        printf("printFiveNumbers - %d\n",i);
    }
    printf("执行完printFiveNumbers函数了\n");
}

//main函数是程序的入口
int main(){
    printf("main函数开始执行了\n");
    printFiveNumbers();
    printf("main函数执行完了\n");
    return 0;
}
运行结果
大家都知道,运行的结果是怎么样了,程序的入口是main函数,于是Run这个程序后,马上就会进入main函数执行,执行了第一句打印后,会跳入printFiveNumbers这个函数执行,直到printFiveNumbers执行完,才会返回到main函数继续执行下一句。重点是:外层方法会等待内层方法返回后,再执行下一句指令。就好像把printFiveNumbers函数的所有语句,都复制粘贴到了main方法里一样。

三、GCD死锁的本质

让我们看看下面这个程序:

    override func viewDidLoad() {
        super.viewDidLoad()
        print("Start \(NSThread.currentThread())")
        //GCD同步函数
        dispatch_sync(dispatch_get_main_queue(), {
            for i in 0...100{
                print("\(i) \(NSThread.currentThread())")
            }
        })
        print("End \(NSThread.currentThread())")
    }
运行结果(已造成GCD死锁)
这个程序就是典型的死锁,可以看到,只打印了“Start”一行,就再也没有响应了,已经造成了GCD死锁。为什么会这样呢?让我们来解读一下这段程序的运行顺序:首先会打印“Start”,然后将主队列和一个block传入GCD同步函数dispatch_sync中,等待sync函数执行,直到它返回,才会执行打印“End”的语句。可是,竟然没有反应了?block中的101个数字没有被打印出来任何一个,viewDidLoad()中的End也没有被打印出来。也就是说,block没有得到执行的机会,viewDidLoad也没有继续执行下去。为什么block不执行呢?因为viewDidLoad也是执行在主队列的,它是正在被执行的任务,也就是说,viewDidLoad()是主队列的队头。主队列是串行队列,任务不能并发执行,同时只能有一个任务在执行,也就是队头的任务才能被出列执行。我们现在被执行的任务是viewDidLoad(),然后我们又将block入列到同一个队列,它比viewDidLoad()后入列,遵循先进先出的原理,它必须等到viewDidLoad()执行完,才能被执行。但是,dispatch_sync函数的特性是,等待block被执行完毕,才会返回,因此,只要block一天不被执行,它就一天不返回。我们知道,内部方法不返回,外部方法是不会执行下一行命令的。不等到sync函数返回,viewDidLoad打死也不会执行print End的语句,因此,viewDidLoad()一直没有执行完毕。block在等待着viewDidLoad()执行完毕,它才能上,sync函数在等待着block执行完毕,它才能返回,viewDidLoad()在等待着sync函数返回,它才能执行完毕。这样的三方循环等待关系,就造成了死锁。
也许文字描述比较抽象,我们再来配一幅图:
串行队列阻塞的原因
可以这么理解:每一个队列,有自己的执行室,串行队列的执行室,只能容纳一个任务,并发队列的执行室,可以同时容纳若干个任务。队头的任务,只要执行室有空位,就会被放入执行室执行。viewDidLoad任务在执行中,我们的主队列又是串行队列,执行室只能容纳一个任务,那么队头的block就需要等待viewDidLoad执行完毕才能进入执行室,那么就造成了,viewDidLoad永远不会执行完毕,block永远不能执行。
三方等待 2016-05-25 上午10.01.35.png
sync函数永远不能返回,最终,就是GCD死锁。
  • 那么我们可以总结出GCD被阻塞(blocking)的原因有以下两点:
    1. GCD函数未返回,会阻塞正在执行的任务
    2. 队列的执行室容量太小,在执行室有空位之前,会阻塞同一个队列中在等待的任务
      注意:阻塞(blocking)和死锁(deadlock)是不同的意思,阻塞表示需要等待A事件完成后才能完成B事件,称作A会阻塞B,通俗来讲就是强制等待的意思。而死锁表示由于某些互相阻塞,也就是互相的强制等待,形成了闭环,导致大家永远互相阻塞下去了,Always and Forever,也就是死锁。

以上两点阻塞情景,同时只出现一个,并不会出现死锁,但是如果两个同时出现,就会出现阻塞闭环,造成死锁。因此,造成GCD死锁的原因就是同时具备这两个因素,只要大家理解了这点,就再也不用死记硬背哪些情况会造成GCD死锁了。

四、解决GCD死锁

我们已经有结论,造成GCD死锁,是由于同时具备以下两点因素:

1. GCD函数未返回,会阻塞正在执行的任务
2. 队列的执行室容量太小,在执行室有空位之前,会阻塞同一个队列中在等待的任务

死锁是由于阻塞闭环造成的,那么我们只用消除其中一个因素,就能打破这个闭环,避免死锁。
#######方法1:解决GCD函数未返回造成的阻塞
先提出两个知识点:

    1. dispatch_sync是同步函数,不具备开启新线程的能力,交给它的block,只会在当前线程执行,不论你传入的是串行队列还是并发队列,并且,它一定会等待block被执行完毕才返回
    1. dispatch_async是异步函数,具备开启新线程的能力,但是不一定会开启新线程,交给它的block,可能在任何线程执行,开发者无法控制,是GCD底层在控制。它会立即返回,不会等待block被执行
      注意:以上两个知识点,有例外,那就是当你传入的是主队列,那两个函数都一定会安排block在主线程执行。记住,主队列是最特殊的队列
      只要看懂了以上两个知识点,大家就知道,sync函数未返回会造成阻塞,只要换成aysnc函数,就会立即返回,而不会等待block执行,那么GCD函数未返回这个阻塞因素就会被解决掉。不用大家也不要盲目的换函数,毕竟两个函数是有不同之处的,要考虑实际期望。

#######方法2:解决队列(Queue)阻塞
解决队列阻塞,有两种方法:

  1. 为队列的执行室扩容,让它可以并发执行多个任务,那么就不会因为A任务,造成B任务被阻塞了。
  2. 把A和B任务放在两个不同的队列中,A就再也没有机会阻塞B了。因为每个队列都有自己的执行室。
    首先来说第一个思路,如何为队列的执行室扩容呢?我们当然没有办法为执行室扩容,但是我们可以选择用容量大的队列。使用并发队列替代串行队列。因为并发队列的执行室可以同时容纳若干任务
    再来说第二个思路,我们来看代码:
override func viewDidLoad() {
        super.viewDidLoad()
        print("Start \(NSThread.currentThread())")
        let serialQueue = dispatch_queue_create("这是一个串行队列", DISPATCH_QUEUE_SERIAL)
        dispatch_sync(serialQueue, {
            for i in 0...100{
                print("\(i) \(NSThread.currentThread())")
            }
        })
        print("End \(NSThread.currentThread())")
}
运行结果(成功运行,并未死锁)

我们自己新建了一个串行队列,将block放入自己的串行队列,不再和viewDidLoad()处于一个队列,解决了队列阻塞,因此避免了死锁问题。
网上有一些帖子说“在主线程使用sync函数就会造成死锁”或者“在主线程使用sync函数,同时传入串行队列就会死锁”,都是非常错误的观念,希望大家能够真正理解GCD死锁的原理,而不是死记硬背。

相关文章

  • 理解GCD死锁

    因为本文只做分享用,非学术性文章,所以某些理论并不是非常严谨,望大家见谅。写下这篇文章有以下的目: 我写这篇文章时...

  • GCD死锁的理解

    以上代码会造成死锁,原因是viewDidLoad函数会在主线程执行,当主线程中有任务在执行时,主队列内的任务会被阻...

  • iOS GCD 死锁理解

    关键字:串行,并行,同步,异步,阻塞,死锁。作者:周辉All rights reserved. 同步(dispat...

  • 说说GCD中的死锁

    本文主要举例说明GCD里的死锁场景,分析造成死锁的原因以及解决方案 在开始说GCD死锁之前,我们先了解一下GCD的...

  • 552,GCD的死锁(面试点:gcd死锁:一,主线程调用主线程。

    本文主要举例说明GCD里的死锁场景,分析造成死锁的原因以及解决方案 在开始说GCD死锁之前,我们先了解一下GCD的...

  • GCD让我死锁的死锁(Two)

    本文目录: 同步执行主队列(在主线程中) 另几种死锁情况 本文参考文章链接: 理解GCD死锁 五个案例让你明白GC...

  • GCD 死锁

    GCD死锁 同步 异步 串行 并发

  • IOS开发 GCD产生死锁的总结

    在IOS开发中GCD的使用频率很高,但是使用不当,则会产生死锁,以下是我的对GCD产生死锁的总结。 了解死锁之前首...

  • 死锁 GCD 多线程

    死锁 GCD 多线程 Ios - LDSmallCat - 博客园 Ios中GCD死锁困扰很多人,分享一点个人经...

  • 带你分分钟了解GCD多线程的死锁

    带你了解GCD多线程的死锁 阐述: 1.什么是GCD? GCD,全称 Grand Central Dispatch...

网友评论

  • louuXinnn:写得真的很棒
  • 蚂蚁牙齿不黑:理解很透彻啊
  • 31eb57435995:写得非常好!简洁但是很清楚。谢谢楼主。
  • 牵线小丑:我们自己新建了一个串行队列,将block放入自己的串行队列,不再和viewDidLoad()处于一个队列,解决了队列阻塞,因此避免了死锁问题。

    但新建的这个串行队列也是放到当前线程(主线程)执行,而执行室(主线程)已经被 viewDidLoad 占领了呀,为什么不会造成死锁?
    ios_duzhi:@牵线小丑 我也疑惑这一点能否给小弟讲讲
    牵线小丑:@MotoLv 但是新建的队列也是放到当前线程(主线程)运行,而主线程已经被 viewDidLoad 了,那新建的队列要等 viewDidLoad 执行完成,这样不是会造成死锁么?
    31eb57435995:新建这个队列里没有 viewDidLoad 这个任务,只有 for 循环任务。都执行完毕之后 GCD 返回,然后 viewDidLoad 继续执行,这样就没有问题了啊。
  • 4622736b50c4:如果是在自己创建的一个串行队列中同步派发任务,就不会死锁。按照楼主的理解,是不是线程可以在不同的队列中切换执行
  • fba08aef555c:解释的很详细,也很有说服力,之前看别的解释,感觉都是错的
  • yangye_2016:“GCD死锁的原因是队列阻塞,而不是线程阻塞!”上面的这句话概括的有点不合适,应该也有线程阻塞的,比如创建两个串行队列,然后执行这两个队列的线程同时争夺同一个资源,这时也就是死锁
    写Blog不取名:不知道你说的“两个队列同时争抢一个资源”是什么具体情况?有好久没做iOS开发了,貌似之前也没遇到这种情况。
  • 小怡情ifelse:楼主讲解的非常好👍
    写Blog不取名:@厦大 感谢感谢 :grin: 对大家有帮助就好!
    ttys苹果核:@厦大 嗯 好啊
  • zczb:楼主,你说的那个执行室,可不可以理解为系统给任务分配的唯一的线程呢?
    写Blog不取名:@zczb 任务是在线程中执行的。我觉得你可能漏掉了我博客中的什么,我提到了线程的。你可以再看看,也许你漏掉了什么。
    zczb:@Erum 任务不是在线程中执行的吗?
    写Blog不取名:@zczb “把任务拿出放到执行室”意思就是开始执行这个任务。一个形象比喻而已。而不是指线程。并行队列的执行室容量很大(意思就是并行队列允许同时执行N个任务),串行队列执行室只能容纳1个任务(意思是串行队列只能在同一时间执行一个任务)
  • 狸猫副园长:博主,想再请教一个问题,你这里有说“因为viewDidLoad也是执行在主队列的,它是正在被执行的任务,也就是说,viewDidLoad()是主队列的队头。”。我看很多地方也是做了这种默认,所以才分析出那个代码会死锁,但是我困惑的是viewDidLoad也是执行在主队列的说法出自哪呢?所有在主线程上执行的系统任务都是先放入主队列中再等待执行的吗?
    写Blog不取名:@狸猫副园长 其实我这里说得很不严谨。viewDidLoad其实并不是经过主队列的任务。因为GCD是线程之上的抽象,而苹果底层viewDidLoad应该是直接对线程,而不是对GCD。因此,其实viewDidLoad是执行在主线程,而没有经过GCD的主队列的安排和等待。但是,因为主线程有viewDidLoad在执行,GCD的主队列里的任务会被阻塞,不能取出。毕竟这个东西研究起来,又要加很长一段话,绕到另一个地方去了,讲得太杂,反而不利于读者理解主题,所以我就直接说viewDidLoad执行在主队列了。
  • 狸猫副园长:博主写得挺好的,另外我是结合http://ju.outofmemory.cn/entry/213827这篇文章一起看的,两者结合感觉更清晰~
    写Blog不取名:@狸猫副园长 @鼻毛长长 说的那篇文章里的案例一,如果那三行代码是放在主线程的,那么就会造成GCD死锁。只会打印1。2、3都不会打印了。
    狸猫副园长:@鼻毛长长 麻烦能指正一下吗?我并没有看出是哪里错了 :joy:
    另外,从楼主这篇文章的原理讲得更清晰,但我发的那篇文章所画的示意图我感觉会比较容易理解。当然也并不是完美,里面的使用任务来讲,使得这个概念让人混淆。不过我还是觉得他有借鉴的地方的,正如楼主所说,很多讲这个GCD死锁的文章其实并没有讲透,看完容易让人迷惑,所以才会在这里推荐,可以让其他人也看到的。
    事先声明,我跟原文作者并无任何关系 :grin:
    鼻毛长长:@狸猫副园长 这篇文章案例一都写错了好嘛。。。
  • 鼻毛长长:dispatch_queue_t queue = dispatch_get_main_queue();
    NSLog(@"%@", [NSThread currentThread]);
    NSLog(@"before");
    dispatch_async(queue, ^{
    NSLog(@"thread %@", [NSThread currentThread]);
    NSLog(@"queue %@", queue);
    });
    NSLog(@"after");

    有个问题,如果是阻塞是队列,为什么block会在after之后才执行?明明是先放到主队列里的?
    鼻毛长长:@Erum 好的,明白了 viewDidLoad也是个任务 这样就说得通了
    写Blog不取名:@狸猫副园长 说得对。可以这么理解:每个方法算是一个任务,既然这个方法得以执行,那么就说明,它已经被队列取出,意思是它早已被加入队列中。在这个方法执行的过程中,你再加入一个block作为新任务,那么这个新的任务,在逻辑上肯定是排在这个方法之后的。因此会在方法执行完后,再执行你加入的block。
    狸猫副园长:@鼻毛长长 这里你不要分开来看,首先是这一整个任务
    dispatch_queue_t queue = dispatch_get_main_queue();
    NSLog(@"%@", [NSThread currentThread]);
    NSLog(@"before");
    dispatch_async(queue, ^{
    NSLog(@"thread %@", [NSThread currentThread]);
    NSLog(@"queue %@", queue);
    });
    NSLog(@"after");
    放在队列中了,而这个任务中的
    dispatch_async(queue, ^{
    NSLog(@"thread %@", [NSThread currentThread]);
    NSLog(@"queue %@", queue);
    });
    这部分代码将
    ^{
    NSLog(@"thread %@", [NSThread currentThread]);
    NSLog(@"queue %@", queue);
    }
    这个block放进队列中
  • zczb:楼主讲的很好,看完之后能够很好的理解GCD的死锁问题了,谢谢!!
    写Blog不取名:@zczb 谢谢支持!很高兴对你有帮助!说一声迟来的端午祝福 :smiley:

本文标题:理解GCD死锁

本文链接:https://www.haomeiwen.com/subject/krcorttx.html