线程与进程
进程拥有代码和打开的文件资源、数据资源、独立的内存空间。
线程属于进程,是CPU执行的最小单元。一个进程至少包含一个主线程,也可以拥有多个子线程。线程拥有独立的栈空间。而各个线程共享着进程的代码、内存
、文件FD等。
而线程有如下几种状态:
- 初始化
- 可执行
- 执行中
- 阻塞
- 销毁
线程的调度
对于线程调度,Linux以及其他的操作系统都采用了CFS调度策略(完全公平调度),在操作系统的Ring0的层面来进行线程的调度,来保证每个线程可以根据nice值以及其他的策略来保证每个线程所执行的虚拟时间相对公平。
每次线程的切换,都必须通过系统调用从Ring3的应用层调用到Ring0的内核层进行切换,而在内核层保存切换的线程Context,包括当前各个寄存器的值、缓存读取等等。这一切都是一笔不小的开销。
协程的原理
协程的概念从很早之前就提出来了,协程的介绍可以从Coroutine中了解。而每种语言的协程实现也有不同,Go,Lua等等的实现方式也不经相同,但是大体一致。
协程是在应用层模拟的线程,避免了线程在应用层与内核层切换的消耗,同时也对并发提供了不错的支持。
协程会在当前线程中建立协程的上下文环境,以保存当前执行的代码、栈帧、变量等等,当协程切换时,上下文环境也会切换,但是这些环境的切换仅仅只局限于应用层对于协程的调度,而不会陷入内核进行切换。
而协程切换完成后,也会继续在当前线程执行切换完成的协程。
协程的优势
- 线程中建立协程的函数调用栈,不需要深入内核创建
- 协程中任务阻塞时,线程会切换协程,减少陷入内核后的线程Context切换
- 减少线程休眠与阻塞的时间,更加拟合CPU的运行状态
Kotlin中的协程
在Kotlin1.3版本中,也提供了对应的协程库。而在1.3之前的Kotlin版本中,Coroutine则是作为Experimental的功能提供的。
Kotlin中的协程也是通过线程池来实现的。而在Kotlin中,在线程之上也建立了在线程中类似于Looper+Handler的机制,让协程可以在多个线程中切换,以及进行数据的传递。
举例
例如,有A线程需要等待50个任务执行完后,才能继续执行,通常我们会开一个线程池来复用线程,以避免创建和销毁线程的开销。而当使用CountDownLatch
或者CyclicBarrier
来检测已经完成任务的个数时,会需要切换到A线程,进行自旋检测是否任务均已完成,而每次自旋时,CPU都是打满的状态,无法执行其他有意义的任务,直到线程切换。
这也就造成了CPU确实在运行,但是执行的都是无意义的代码。
而协程则可以比较好的避免这一点,虽然协程也是通过多线程实现的,并且协程也都会在多线程中执行。但是当该协程需要等待时,则协程会进行切换,但是切换的另一个协程还是运行在同一个线程中。但是也有可能协程会在多个线程中执行。所以数据必须要进行同步。
也就是:当某个协程需要等待或者阻塞时,它并不会导致线程的阻塞,而是会在当前线程保存当前协程的上下文环境(调用栈、执行代码偏移量等等),再获取下一个要执行的协程,切换上下文环境,执行该协程。
所以,协程的切换不会导致线程的阻塞,也不会让线程提前陷入内核进行切换,有效的提高了CPU的使用率,并且减少了线程上下文切换所消耗的时间。不过,数据的同步与操作的原子性依然还需要继续保持。
总结
- 协程是Ring3级别的"线程",但是一切操作都在Ring3中完成
- 协程的实现也是通过线程,也可以实现异步
- 协程也支持各个协程间的通信
- 协程之间的切换的损耗小于线程
- 协程间的数据也需要做同步
- 协程之间的切换也需要保存当前协程的状态,但是不需要陷入内核态
参考资料
golang的协程原理
深入浅出Kotlin协程
Kotlin Coroutines(协程)
深入理解 Kotlin Coroutine (一)
深入理解 Kotlin coroutine (二)
网友评论