线程安全

作者: sindri的小巢 | 来源:发表于2017-09-10 02:03 被阅读457次

atomic & nonatomic
ConcurrentHashMap源码设计分析
HashMap 和 Hashtable 的区别
Java 的 StringBuffer 和 StringBuil
Java单例模式，线程安全
2018-06-12 第三十七天
线程安全知多少
JAVA 线程安全
synchronized锁
线程安全的NSMutableDictionary

前言

多线程技术对于计算机开发带来了巨大的性能提升，同样也来带了新的伤痛——线程安全问题。在开发中，稍不注意，我们就可能写出让代码陷入不安全的境地，线程锁是一种用来帮助我们保护临界资源的手段。事实上，现代语言提供了多种不同的线程锁来保护代码。通过深入挖掘，可以发现线程锁的核心无非是Compare and Set，基于这简单的核心，衍化出了多种安全方案，本文就来讲讲锁的原理。

数据破坏

在理解如何保障临界代码的安全之前，我们需要了解数据为什么在多线程环境下被破坏。以简单的i++为例，这句代码将i自增一次，在编译成汇编代码后实际上会有三步操作：

movl -0x24(%rbp), %r8d
addl $0x1, %r8d
movl %r8d, -0x24(%rbp)

完成一次i++总共分为三步（把大象放进冰箱）：

取出i存放到临时寄存器上
对寄存器的值+1
将计算后的值存放回i的内存

假设线程A执行i++这句代码，在完成将计算后的数值存储回i的内存之前，线程B也开始执行这句代码，最终的结果是两次i++之后，值仍然为1，这时候数据就发生了破坏。如果这时候使用线程锁，那么B就会等待A完成存储数据后才能执行：

加锁后，B在执行i++之前会检测指令是否被锁住。如果被锁住，则开始休眠，直到A完成操作后被唤醒继续执行代码。这时候i++在多线程环境下是安全的

原子性

所谓原子操作是指不会被线程调度机制打断的操作；这种操作一旦开始，就一直运行到结束，中间不会有任何 context switch

我用原子性来表示某段多线程环境下的安全代码。从上面的代码来说，加锁之后的i++是具有原子性，因为代码在执行的过程中是线程安全的。此外，单条汇编一般也可以认为是具有原子性。而具有原子性的汇编指令也可以称作原子操作

原子（atom）指化学反应不可再分的基本微粒，原子在化学反应中不可分割

正常来说，代码分割到最小的单位就是单句汇编指令，比如上面的addl $0x1 %r8d可以被当做是代码中的原子。之所以说单条汇编是原子操作是因为在多线程环境下，汇编是不可再分割的，所以不会出现上面的破坏执行次序的问题。但是这并不是绝对的，比如系统中断可以中止正在执行的命令，这时候%r8d仍然是可能被意外修改。在汇编语言层面上，提供了LOCK指令前缀来保护指令执行过程层中的数据安全：

lock addl $0x1 %r8d

除此之外，在80486指令集中还有xadd、cmpxchg和xchg等指令是多处理器安全的。加了lock修饰的单条编译指令以及这些特殊的安全指令才算是真正的原子操作

线程锁

单条的汇编指令可以通过lock来保证原子操作，有通过锁住地址总线的方式保证指令执行过程中的读取安全的手段。当然，鉴于笔者水平，也不多做深究。

而在非汇编指令的代码层面上来说，我们使用互斥锁、自旋锁、条件锁等等工具来保护代码安全。那么这些锁具体是怎么实现的呢？锁分为信号量和互斥锁，他们两者的使用区别如下：

互斥锁
互斥锁应当是排它的，意思是锁在被某个线程获取之后，只有获取锁的线程才能释放这个锁。其他线程必须等到获取锁的线程不再拥有锁之后，才能继续执行。在我使用NSLock的测试中，发现可以unlock其他线程的锁，因此严格来说NSLock并不适合被称作互斥锁
信号量
信号量拥有比互斥锁更多的用途。当信号量的value大于0时，所有的线程都能访问临界资源。在线程进入临界区后，value减一，反之亦然。如果信号量初始化为0时，可以看做是等待任务执行完成而非资源保护。value的操作应当是采用原子操作来保证指令的安全性的

互斥

锁的实现方式之一是互斥方式实现的（想了半天，还是决定用这个词）。即当线程B访问已经加锁了的临界资源时，检测到代码加锁，于是切换至内核态进行进一步的操作。伪代码大致实现如下，假定下面的代码是线程安全的：

if (!lock.try_lock()) {
    /// 切换至内核态
    thread current = this;
    list queue = get_global_wait_list();
    queue.push(current);
    current.sleep(forever);
}

此时，线程会进行休眠状态避免继续占用CPU资源，然后等待锁持有者执行完成释放锁。一旦任务完成，会检测是否存在等待执行代码的线程，如果存在，唤醒继续执行任务：

list queue = get_global_wait_list();
if ((t = queue.pop())) {
    t.wakeup();
}

在具体实现中互斥的实现要复杂的多，但是不妨碍它基于一个简单的机制实现。互斥的实现涉及到了可能发生的内核态切换，线程休眠、唤醒等，如果临界执行代码足够小而快，互斥的线程锁可能并不是最佳的实践方案

自旋

自旋的实现要比互斥简单的多。对于自旋实现的线程锁来说，存在一个线程间共享的标记变量。当某个线程进入临界区后，变量被标记，此时其他线程再想进入临界区，会进入while循环中空转等待：

while(flag) {
    continue;
}

自旋的实现逻辑足够简单，只要标记位的修改被设计为原子操作，就能保证多线程环境下的安全。对比互斥方案，自旋没有线程切换、休眠唤醒的开销。但是空转的代码会导致CPU在等待期间是满负荷执行的，如果加锁的代码不够小而快，甚至会直接影响到程序的运行

信号

信号的性能在自旋和互斥之间，通常的性能表现总是仅次于自旋。这里基于GCD的信号量实现来看，在进入等待时，会根据传入的超时时间出现三种表现：

DISPATCH_TIME_NOW

  while ((orig = dsema->dsema_value) < 0) {
      if (dispatch_atomic_cmpxchg2o(dsema, dsema_value, orig, orig + 1)) {
  #if USE_MACH_SEM
          return KERN_OPERATION_TIMED_OUT;
          
  #elif USE_POSIX_SEM || USE_FUTEX_SEM
          errno = ETIMEDOUT;
          return -1;
  #endif
      }
  }

DISPATCH_TIME_FOREVER

  #if USE_MACH_SEM
  do {
      kr = semaphore_wait(dsema->dsema_port);
  } while (kr == KERN_ABORTED);
  DISPATCH_SEMAPHORE_VERIFY_KR(kr);
  
  #elif USE_POSIX_SEM
  do {
      ret = sem_wait(&dsema->dsema_sem);
  } while (ret == -1 && errno == EINTR);
  DISPATCH_SEMAPHORE_VERIFY_RET(ret);
  
  #elif USE_FUTEX_SEM
  do {
      ret = _dispatch_futex_wait(&dsema->dsema_futex, NULL);
  } while (ret == -1 && errno == EINTR);
  DISPATCH_SEMAPHORE_VERIFY_RET(ret);
  #endif

根据超时时间的设置，信号量最终会表现为互斥或者自旋的方式实现，这也是为什么评测中信号量性能总是优于互斥低于自旋。虽然信号量的性能不是最优，但是这种结合方案保证了它的作用范围更大

barrier

barrier的任务总是保证在执行过程中，并发队列中有且只有barrier的任务在执行。最初笔者一度认为barrier的操作不过是加锁实现，后来在libdispatch的源码中得以窥见真容：

void dispatch_barrier_async_f(dispatch_queue_t dq, void *ctxt,
    dispatch_function_t func)
{
    dispatch_continuation_t dc;

    dc = fastpath(_dispatch_continuation_alloc_cacheonly());
    if (!dc) {
        return _dispatch_barrier_async_f_slow(dq, ctxt, func);
        }

    dc->do_vtable = (void *)(DISPATCH_OBJ_ASYNC_BIT | DISPATCH_OBJ_BARRIER_BIT);
    dc->dc_func = func;
    dc->dc_ctxt = ctxt;

    _dispatch_queue_push(dq, dc);
}

相比dispatch_async的实现，barrier只是简单的将任务标记为DISPATCH_OBJ_ASYNC_BIT。但在执行队列任务的_dispatch_queue_drain会循环获取任务并且判断，barrier任务的真正实现在这个函数中。由于函数实现稍长，笔者只放上去除额外参数的伪代码：

void _dispatch_queue_drain() {
    while((task = queue.next())) {
        if (queue.excute_barrier()) {
            return;
        } else if (task.do_vtable & DISPATCH_OBJ_ASYNC_BIT) {
          return;
        } else {
           task.execute();
        }
    }
}

当循环取出队列任务执行的时候，检测到当前存在barrier的任务，则停止任务获取，直到当前所有的任务执行完成。并且在barrier执行过程中，不允许执行其他任务

Compare and Set

上面总结了很多种线程锁方案，包括从伪代码和源代码窥探实现，线程锁的实现机制其实基于很简单的概念：标志是否被占用。而在这其中，核心确实无非Compare and Set，这两个是最核心的操作，通过原子操作实现这两个步骤来保证多线程锁的获取中不会出现另外的线程安全问题。笔者用八个字总结了线程锁的特性：

因为简单，所以可靠

最后

从入职新东家以来，深感到经济基础决定上层建筑这句话的意义。基础薄弱影响了笔者难以突破很多技术上的关口，是以未来很长一段时间都要将自己曾经欠下的债慢慢补上。同时，规范化的开发流程也是对自己的一个巨大挑战。我想，仅仅是实现功能就能自称工程师的话，无疑显得廉价。如何构建更稳健的代码，学会编写应对异常环境下的代码，等到那时候，我才有资格自称工程师

参考

互斥锁的实现
 用汇编实现原子操作

atomic & nonatomic
什么是线程安全？？？线程安全：多线程操作共享数据不会出现想不到的结果就是线程安全的，否则，是线程不安全的。 at...
ConcurrentHashMap源码设计分析
二、线程安全(Thread-safe)的集合对象：● Vector 线程安全● HashTable 线程安全● S...
HashMap 和 Hashtable 的区别
线程安全： HashMap 是非线程安全的，而 Hashtable 是线程安全的，因为 Hashtable 内部的...
Java 的 StringBuffer 和 StringBuil
区别就是：线程安全，StringBuffer 是线程安全的，StringBuilder 不是线程安全的。他俩的实...
Java单例模式，线程安全
懒汉式:线程安全，开销大双重检查锁：线程安全，根据需求使用静态内部类锁：线程安全，比较推荐饿汗式：线程安全，...
2018-06-12 第三十七天
一、线程安全线程安全的问题，是针对多线程的程序。单线程的情况下，是不存在线程安全问题。产生线程安全问题的原因：...
线程安全知多少
1. 如何定义线程安全线程安全，拆开来看：线程：指多线程的应用场景下。安全：指数据安全。多线程就不用过多介...
JAVA 线程安全
线程安全定义一个类在可以被多个线程安全调用时就是线程安全的。线程安全分类线程安全不是一个非真即假的命题，可以...
synchronized锁
一、线程安全的概念与synchronized 1、线程安全概念并发程序开发的一大关注重点就是线程安全，线程安全就...
线程安全的NSMutableDictionary
NSDictionary是线程安全的，NSMutableDictionary是线程不安全的。利用锁来保证线程的安全...

网友评论

Liusr:每次用到线程总是处于理解又不理解的边缘
sindri的小巢:@Liu_sr 多用吧，坑是要踩的才能了解
hewking:楼主对于补足基础的学习有什么推荐的吗比如书籍，不得不说同样写代码层次差得很大有清华姚班的大神毕业年薪百万都能够从容放弃也有培训班四个月的
sindri的小巢:@tooyoungt 慢慢看吧，不懂就先放下。我也是技术到了一定程度的时候才越来越能看懂
hewking: @sindri的小巢多谢推荐这些书籍确实是内功你看的过程中有遇到啥问题吗有时看一些我就继续不下去了惭愧希望能够共同进步
sindri的小巢:程序员的自我修养，编译系统透视，计算机网络自顶向下方法，HTTP权威指南，深入了解计算机系统，操作系统真象还原，EOC，Objective-C高级编程，面向对象分析与设计，设计模式:可复用面向对象软件的基础，数据结构与算法分析，剑指offer。

这些都是计算机的基础，我也在补习中。这些书都值得回看几遍
再见远洋:向你学习。

线程安全

前言

数据破坏

原子性

线程锁

互斥

自旋

信号

barrier

Compare and Set

最后

参考

相关文章

atomic & nonatomic

ConcurrentHashMap源码设计分析

HashMap 和 Hashtable 的区别

Java 的 StringBuffer 和 StringBuil

Java单例模式，线程安全

2018-06-12 第三十七天

线程安全知多少

JAVA 线程安全

synchronized锁

线程安全的NSMutableDictionary

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

暂时没看却需要看的

人猿星球

iOS精学选辑

待读清单

将来跳槽用

移动开发技术前沿

iOS开发深入探索

IOS