美文网首页程序员我爱编程
JVM:Java内存模型与线程

JVM:Java内存模型与线程

作者: 北方先森丶 | 来源:发表于2017-10-05 21:06 被阅读270次

    Java虚拟机规范中试图定义一种Java内存模型来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。

    一.Java内存模型

    1. 主内存与工作内存

    Java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存从内存中取出变量这样的底层细节。

    此处的变量与Java编程中所说的变量有所区别,它包括了实例字段、静态字段和构成数组对象的元素,但不包括局部变量与方法参数,因为后者是线程私有的(如果局部变量是一个reference引用类型,它引用的对象在Java堆中可被各个线程共享,但是reference本身在Java栈的局部变量表中,它是线程私用的),不会被共享,自然就不存在竞争问题。

    Java 内存模型规定了所有的变量都存在主内存中。

    每条线程还有自己的工作内存,线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量。不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值得传递均需要通过主内存来完成。

    如果对应Java内存来说(硬要说的话),主内存主要对应于Java堆中的对象实例数据部分,而工作内存则对应于虚拟机栈中的部分区域。

    2. 内存间交互操作

    关于主内存与工作内存之间具体的交换协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存之类的实现细节,Java内存模型中定义了一下八种操作来完成,虚拟机实现时必须保证下面提及的每一种操作都是原子的、不可再分的。

    ①.lock:(锁定)作用于主内存的变量,它把一个变量标识为一条线程独占的状态

    ②.unlock:(解锁)作用与主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。

    ③.read:(读取)作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用。

    ④.load:(载入)作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。

    ⑤.use:(使用)作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。

    ⑥.assign:(赋值)作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时将会执行这个操作。

    ⑦.store:(存储)作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用。

    ⑧.write:(写入)作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。

    其中,read load、store write必须按顺序执行,但不保证是连续执行。这些定义相当严谨但又十分繁琐,实践起来很麻烦,所以我们一个等效判断原则-------先行发生原则,用来确定一个访问在并发环境下是否安全。

    3. 对于 volatile 型变量的特殊规则

    关键字 volatile 可以说是Java虚拟机提供的最轻量级的同步机制,但是它并不容易完全被正确、完整地理解。

    当一个变量定义为volatile之后,它将具备两种特性。

    第一是保证此变量对所有线程的可见性,这里的“可见性”是指当一条线程修改了这个变量的值,新值对于其他线程来说是可以立即得知的。而普通变量不能做到这一点,普通变量的值在线程间传递均需要通过主内存来完成,线程A修改了一个普通变量的值,然后向主内存进行回写,另外一个线程B在线程A回写完成了之后再从主内存进行读取操作,新变量值才会对线程B可见。

    由于Java里面的运算并非原子操作导致volatile变量的运算在并发下一样是不安全的

    这段代码发起了20个线程,每个线程对race变量进行10000自增操作,如果这段代码能够正确并发的话,最后的输出结果应该是200000,但是运行后我们会发现输出的结果都不一样,都是小于200000的数字。

    由于volatile变量只能保证可见性,在不符合一下两条规则的运算场景中,我们仍然要通过加锁来保证原子性。

    ①.运算结果并不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值。

    ②.变量不需要与其他的状态变量共同参与不变约束

    第二个特性是禁止指令重排序优化,普通的变量仅仅会保证在该方法的执行过程中所有依赖赋值结果的地方都能获取到正确的结果,而不能保证变量赋值操作的顺序与程序代码中的执行顺序一致。因为在一个线程的方法执行过程中无法感知到这点,这也就是Java内存模型中描述的所谓的“线程内表现为串行的语义”。

    4.原子性、可见性与有序性

    Java内存模型是围绕着在并发过程中如何处理原子性、可见性和有序性这3个特征来建立的。

    4.1 原子性

    由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write,我们大致可以认为基本数据类型的访问续写是具备原子性的。同样,synchronized块之间的操作也是具备原子性的。

    4.2 可见性

    可见性是指当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。我们之前说的volatile的特殊规则就是保证了新增能立即同步到主内存,以及每次使用前立即从主内存刷新,因此可以说,volatile保证了多线程操作时变量的可见性,而普通变量则不能保证这一点。

    除了volatile之外,Java还有两个关键字能实现可见性,即 synchronized 和 final 。同步块的可见性是由“对一个变量执行unlock操作之前,必须先把此变量同步回主内存中”这条获得的,而 final 关键字的可见性是指:被 final 修饰的字段在构造器中一旦初始化完成,并且构造器没有把 this 的引用传递出去,那么在其他线程中就能看见 final 字段的值,它们无需同步就能被其他线程正确访问。

    4.3 有序性

    Java 程序有个天然的有序性可以总结为一句话:如果在本线程内观察,所有的操作都是有序的;如果在一个线程中观察另一个线程,所有的操作都是无序的。前半句是指“线程内表现为串行的语义”,后半句是指“指令重排序”现象和“工作内存与主内存同步延迟”现象。

    Java语言提供了 volatile 和 synchronized 两个关键字来保证线程之间操作的有序性,volatile 关键字本身就包含了禁止指令重排序的语义,而 synchronized 则是由“一个变量在同一个时刻只允许一条线程对其进行lock操作”这条规则获得的,这条规则决定了持有同一个锁的两个同步块只能串行地进入。

    5. 先行发生原则

    如果Java内存模型中所有的有序性都仅仅靠 volatile 和 synchronized 来完成,那么有一些操作将会变得很烦琐,但是我们在编写Java代码时并没有感觉到这一点,这是因为Java语言中有个“先行发生原则”。这个原则非常重要,它是判断数据是否存在竞争、线程是否安全的主要依据。

    先行发生是指 Java 内存模型中定义的两项操作之间的偏序关系,如果说操作A先行发生于操作B,其实就是说在发生操作B之前,操作A产生的影响能被操作B观察到。

    下面是Java内存模型下一些“天然的”先行发生关系,这些先行发生关系无需任何同步器协助就已经存在。

    ①.程序次序规则:在一个线程内,按照程序代码顺序,书写在前面的操作先行发生于书写在后面的操作。

    ②.管理锁定规则:一个 unlock 操作先行发生于后面对同一个锁的lock操作。这里必须强调是同一个锁,而“后面”是指时间上的先后顺序。

    ③.volatile变量规则:对一个 volatile 变量的写操作先行发生于后面对这个变量的读操作。“后面”是指时间上的先后顺序。

    ④.线程启动规则:Thread 对象的 start() 方法先行发生于此线程的每一个动作。

    ⑤.线程终止规则:线程中的所有操作都先行发生于对此线程的终止检测。

    ⑥.线程中断规则:对线程 interrupt() 方法的调优先行发生于被中断线程的代码检测到中断事件的发生。

    ⑦.对象终结规则:一个对象的初始化完成(构造函数执行结束)先行发生于它的 finalize() 方法的开始。

    ⑧.传递性:如果操作A先行发生于操作B,操作B先行发生于操作C,那就可以得出结论操作A先生发生于操作C的结论。

    二.Java与线程

    1.线程的实现(现在还没有涉及到Java线程 而是统一的线程实现)

    线程是比进程更轻量级的调度执行单位,线程的引入,可以把一个进程的资源分配和执行调度分开,各个线程可以共享进程资源,又可以独立调度(线程是CPU调度的基本单位)。

    主流的操作系统都提供了线程实现,Java线程:每个已经执行 start() 且还未结束的 Java.lang.Thread 类的实例就代表了一个线程。

    实现线程主要有3种方式:使用内核线程实现、使用用户线程实现和使用用户线程加轻量级进程混合实现。

    1.1 使用内核线程实现

    内核线程就是直接由操作系统内核支持的线程,这种线程由内核来完成线程切换,内核通过操纵调度器对线程进行调度,并负责将线程的任务映射到各个处理器上。

    程序一般不会直接去使用内核线程,而是去使用内核线程的一种高级接口------轻量级进程,也就是我们通常意义上的线程,由于每个轻量级进程都由一个内核线程支持,因此只有先支持内核线程,才能有轻量级进程。这种轻量级进程与内核线程之间1:1的关系成为一对一的线程模型。

    由于内核线程的支持,每个轻量级进程都成为一个独立的调度单元,即使有一个轻量级进程在系统调用中阻塞了,也不会影响整个进程继续工作。但是轻量级进程具有它的局限性:首先,由于是基于内核线程是实现的,所以各种线程操作,如创建、析构及同步,都需要进行系统调用。而系统调用的代价相对较高,需要在用户态与内核态中来回切换。其次,每个轻量级进程都需要有一个内核线程的支持,所以要消耗一定的内核资源。

    1.2 使用用户线程实现

    从广义上讲,一个线程只要不是内核线程,就可以认为是用户线程。而狭义上的用户线程指的是完全建立在用户空间的线程库上,系统内核不能感知线程存在的实现。

    用户线程的建立、同步、销毁和调度完全在用户态中完成,不需要内核的帮助。这种进程与用户线程之间1:N的关系称为一对多的线程模型。

    使用用户线程的优势在于不需要系统内核支援,劣势也在于不需要系统内核支援,所有的线程操作都需要用户程序自己处理,很多问题解决起来会异常困难,所以现在很多语言都放弃了。

    1.3 使用用户线程加轻量级进程混合实现

    这是一种将内核线程与用户线程一起使用的实现方式,在这种混合实现下,既存在用户线程,也存在轻量级进程。

    操作系统提供支持的轻量级进程作为用户线程和内核线程之间的桥梁,这样可以使用内核提供的线程调度功能及处理器映射,并且用户线程的系统调用要通过轻量级线程来完成,大大降低了整个进程被完全阻塞的风险。在这种混合模式中,用户线程与轻量级进程的数量比是不定的,即为N:M。

    1.4 Java线程的实现

    在目前的JDK版本中,操作系统支持怎样的线程模型,在很大程度上决定了Java虚拟机的线程是怎样映射的。线程模型只对线程的并发规模和操作成本产生影响,对Java程序的编码和运行来说,这些差异都是透明的。

    2. Java线程调度

    线程调度是指系统为线程分配处理器使用权的过程,主要调度方式有两种,分别是协同式调度抢占式调度

    2.1 协同式调度

    如果使用协同式调度的多线程系统,线程的执行时间由线程本身控制,线程把自己的工作执行完了之后,就主动通知系统切换到另一个线程上。

    协同式调度的最大好处是实现简单,而且由于线程要把自己的事情干完后才会进行线程切换,切换操作对线程自己是可知的,所以没有什么线程同步的问题。

    同时,它的坏处是:线程执行时间不可控制,甚至如果一个线程编写有问题,一直不告诉系统进行线程切换,那么程序就会一直阻塞在那里。

    2.2 抢占式调度

    如果使用抢占式调度的多线程系统,那么每个线程将由系统来分配执行时间,线程的切换不由线程本身来决定(在Java中,Thread.yield() 可以让出执行时间)。在这种实现线程调度的方式下,线程的执行时间是系统可控的,也不会有一个线程导致整个进程阻塞的问题,Java使用的线程调度方式就是抢占式调度。例如 Windows ,当一个进程出现问题,我们还可以使用任务管理器把 这个进程“杀掉”。

    虽然Java线程的调度室系统自动完成的,但是我们还可以“建议”系统给某些线程多分配一点执行时间,另外的一下线程则可以少分配一点-----这项操作可以通过设置线程优先级来完成。

    在两个线程同时处于Ready状态时,优先级越高的线程越容易被系统选择执行。

    不过线程游戏家也并不是太靠谱,原因是Java的线程是通过映射到系统的原生线程上来实现的,所以线程调度最终还是取决于操作系统,在Windows系统存在一个成为“优先级推进器”的功能,它的大致作用就是当系统发现一个线程执行得特别“勤奋努力”的话,可能会越过线程优先级去为它分配执行时间。

    3. 状态交换

    Java语言定义了5种线程状态,在任意个时间点,一个线程只能有且只有其中的一种状态。

    1.新建(New):创建后尚未启动的线程处于这种状态。

    2.运行(Runable): 包括了操作系统线程状态中的 Running 和 Ready,也就是处于次状态的线程有可能正在执行,也有可能正在等待着 CPU 为它分配执行时间。

    3.无限期等待 (Waiting):线程不会被分配CPU执行时间,它们要等待被其他线程显示地唤醒,以下方法会让线程陷入无限期的等待状态。

    ①.没有设置 Timeout 参数的 Object.wait() 方法。

    ②.没有设置 Timeout 参数的 Thread.join() 方法。

    ③.LockSupport.park() 方法

    4.有限期等待(Timed Waiting): 线程也不会被分配 CPU 执行时间,不过无需等待被其他线程显示的唤醒,在一定时间之后它们会由系统自动唤醒。以下方法会让线程陷入有限期的等待状态。

    ①.Thread.sleep() 方法

    ②.设置 Timeout 参数的 Object.wait() 方法。.

    ③.设置 Timeout 参数的 Thread.join() 方法。

    ④.LockSupport.parkNanos() 

    ⑤.LockSupport.parkUnitl()

    5.阻塞(Blocked):线程被阻塞了,“阻塞状态”与“等待状态”的区别是:阻塞状态在等待着获取一个排它锁,这个时间将在另外一个线程放弃这个锁的时候发生;而“等待状态”则是在等待一段时间,或者唤醒动作的发生,在程序等待进入同步区域的时候,线程将进入这种状态。

    6.结束:已终止的线程状态。

    摘自《深入理解Java虚拟机》

    相关文章

      网友评论

        本文标题:JVM:Java内存模型与线程

        本文链接:https://www.haomeiwen.com/subject/yuycyxtx.html