volatile 关键字
volatile关键字是与Java的内存模型有关的,因此需要先了解一下与内存模型相关的概念和知识,然后分析了volatile关键字的实现原理。
1. 内存模型相关概念
计算机在执行程序的时候,每条指令都是在CPU中执行的,而执行指令的过程中,会涉及到数据的读取和写入。由于程序在运行过程中,数据是存储在主存(物理内存)上,这时就存在一个问题,由于CPU的执行速度很快,而从内存读取数据和向内存中写入数据的过程跟CPU执行指令的速度比起来慢很多,因此如果任何数据的操作都要和内存交互的话,会大大降低指令的执行速度。因此,CPU里面有了高速缓存。
也就是说,程序在运行的过程中,会将运算需要的数据从主存中复制一份到CPU的高速缓存中,那么CPU在在运算过程就可以直接从高速缓存读取数据和写入数据,当运算结束之后,再将高数缓存的数据刷新到主存中。
但是这里面是有问题的。举个例子
i = i + 1;
当线程执行这段代码的时候,会先从主存中读取i的值,然后复制一份到高速缓存中,当CPU执行指令对i进行+1操作,然后将数据写入高速缓存,最后高速缓存再将数据刷新到主存中。
这段代码在单线程中运行没有任何问题,但在多线中运行就有问题了。在多核CPU中,线程可能运行在不同的CPU,因此每个线程都有自己的高速缓存。
比如同时有2个线程执行这段代码,初始i=0,希望2个线程运行结束后i的值为2,事实上不一定出现想要的结果。
可能的情况:2个线程分别从主存种读取i的值到存入各自的高速缓存中,线程1进行加1操作后,把最新的i值刷新到主存中,此时,线程2的高速缓存中的i值还是0,线程2进行加1操作,把最新的i值刷新到主存中。最终的结果i=1不是2。
这就是著名的缓存一致性问题,通常这种被多个线程访问的变量称为共享变量。
解决这种缓存不一致行的问题,一般有2中解决方案:
- 通过在总线上加LOCK锁的方式
- 通过缓存一致性协议
这两种方式都是硬件层面上提供支持。
在早期的CPU当中,是通过在总线上加LOCK#锁的形式来解决缓存不一致的问题。因为CPU和其他部件进行通信都是通过总线来进行的,如果对总线加LOCK#锁的话,也就是说阻塞了其他CPU对其他部件访问(如内存),从而使得只能有一个CPU能使用这个变量的内存。
但是上面的方式会有一个问题,由于在锁住总线期间,其他CPU无法访问内存,导致效率低下。
所以就出现了缓存一致性协议。最出名的就是Intel 的MESI协议,MESI协议保证了每个缓存中使用的共享变量的副本是一致的。
它的核心思想是:在CPU写数据的时候,如果发现该变量是共享变量,即其它CPU中也存在该变量的副本,那么会发出信号,通知其它CPU将该变量的缓存行置为无效状态。当其它CPU需要读取该变量的时候,发现自己缓存里面该变量的缓存行是无效的,那么它就会从内存里面重新读取。
2. 并发编程中三个概念
1. 原子性
一个操作或者多个操作,要么全部执行完,并且执行过程中不会被别的因素中断,要么全部不执行。
2. 可见性
当多个线程访问同一个变量的时候,一个线程修改了这个变量的值,其它线程能够立即看到修改的值
3. 有序性
程序的执行,按照代码的顺序执行。
JVM在执行代码的时候,可能会发生指令重排序。处理器为了提高程序运行效率,可能会对输入的代码进行优化,它不保证程序中的代码按照顺序执行,但它保证代码执行的最终结果和顺序执行的结果一致。
处理器在进行重排序时是会考虑指令之间的数据依赖性,如果一个指令Instruction 2必须用到Instruction 1的结果,那么处理器会保证Instruction 1会在Instruction 2之前执行。
虽然重排序不会影响单个线程内程序执行的结果,但是多线程就可能出错。
举例子说明:
//线程1:
context = loadContext(); //语句1
inited = true; //语句2
//线程2:
while(!inited ){
sleep()
}
doSomethingwithconfig(context);
由于语句1,语句2没有数据依赖性,可能被重排序。
如果线程1先执行语句2,此时线程2会以为初始化已经完成,那么会跳出while循环,执行下面的doSomethingwithconfig(context);而此时context 还没有初始化,导致程序出错。
也就是说,要想并发程序正确地执行,必须要保证原子性、可见性以及有序性。只要有一个没有被保证,就有可能会导致程序运行不正确。
3. Java内存模型
在Java虚拟机规范中试图定义一种Java内存模型(Java Memory Model,JMM)来屏蔽各个硬件平台和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。
为了获得较好的执行性能,Java内存模型并没有限制执行引擎使用处理器的寄存器或者高速缓存来提升指令执行速度,也没有限制编译器对指令进行重排序。也就是说,在java内存模型中,也会存在缓存一致性问题和指令重排序的问题。
1. 原子性
在Java中,对基本数据类型的变量的读取和赋值操作是原子性操作,即这些操作是不可被中断的,要么执行,要么不执行。
举个例子:
x = 10; //语句1
y = x; //语句2
x++; //语句3
x = x + 1; //语句4
语句1:将数值10赋值给变量,也就是线程在执行该语句时将10直接写入到工作内存中,是原子性操作
语句2:先读取x在内存中的值,再将该值写如y的内存中,2个操作是原子性,但是合起来就不是原子操作了
语句3,语句4:读取x值,进行+1操作,再将结果写入x内中,非原子性操作。
Java内存模型只保证了基本读取和赋值是原子性操作,如果要实现更大范围操作的原子性,可以通过synchronized和Lock来实现
2. 可见性
Java提供了volatile关键字来保证可见性。当一个共享变量被volatile修饰时,它会保证修改的值会立即被更新到主存,当有其他线程需要读取时,它会去内存中读取新值。
另外,通过synchronized和Lock也能够保证可见性。
3. 有序性
在Java内存模型中,允许编译器和处理器对指令进行重排序,但是重排序过程不会影响到单线程程序的执行,却会影响到多线程并发执行的正确性。
在Java里面,可以通过volatile关键字来保证一定的“有序性”(具体原理在下一节讲述)。另外可以通过synchronized和Lock来保证有序性.
Java内存模型具备一些先天的“有序性”,即不需要通过任何手段就能够得到保证的有序性,这个通常也称为 happens-before 原则。如果两个操作的执行次序无法从happens-before原则推导出来,那么它们就不能保证它们的有序性,虚拟机可以随意地对它们进行重排序。
4. 深入剖析volatile关键字
1.volatile关键字两层语义
一旦一个变量被volatile修饰后,就具备了2层语义:
- 保证了不同线程对这个变量进行操作时的可见性,即一个线程修改了某个变量的值,这新值对其他线程来说是立即可见的。
- 禁止指令重排序
//线程1
boolean stop = false;
while(!stop){
doSomething();
}
//线程2
stop = true;
那么当线程2更改了stop变量的值之后,但是还没来得及写入主存当中,线程2转去做其他事情了,那么线程1由于不知道线程2对stop变量的更改,因此还会一直循环下去。
但是用volatile修饰之后就变得不一样了:
-
第一:使用volatile关键字会强制将修改的值立即写入主存;
-
第二:使用volatile关键字的话,当线程2进行修改时,会导致线程1的工作内存中缓存变量stop的缓存行无效(反映到硬件层的话,就是CPU的L1或者L2缓存中对应的缓存行无效);
-
第三:由于线程1的工作内存中缓存变量stop的缓存行无效,所以线程1再次读取变量stop的值时会去主存读取。
那么在线程2修改stop值时(当然这里包括2个操作,修改线程2工作内存中的值,然后将修改后的值写入内存),会使得线程1的工作内存中缓存变量stop的缓存行无效,然后线程1读取时,发现自己的缓存行无效,它会等待缓存行对应的主存地址被更新之后,然后去对应的主存读取最新的值。
那么线程1读取到的就是最新的正确的值。
2.volatile保证原子性吗?
volatile 能保证对变量的操作的可见性,但不能保证对变量操作的原子性
举个例子:
public class Test {
public volatile int inc = 0;
public void increase() {
inc++;
}
public static void main(String[] args) {
final Test test = new Test();
for(int i=0;i<10;i++){
new Thread(){
public void run() {
for(int j=0;j<1000;j++)
test.increase();
};
}.start();
}
while(Thread.activeCount()>1) //保证前面的线程都执行完
Thread.yield();
System.out.println(test.inc);
}
}
volatile修饰了inc 变量,但是不能保证inc++
操作的原子性,所以最后的运行结果肯定会小于1000*10,可以使用java.util.concurrent.atomic包下提供了一些原子操作类
3. volatile能保证有序性吗?
volatile关键字能禁止指令重排序,所以volatile能在一定程度上保证有序性。
- 程序执行到volatile变量的读操作或者写操作时,在其前面的操作的更改肯定全部已经进行,且结果已经对后面的操作可见;在其后面的操作肯定还没有进行;
- 在进行指令优化时,不能将在对volatile变量访问的语句放在其后面执行,也不能把volatile变量后面的语句放到其前面执行。
举例:
//x、y为非volatile变量
//flag为volatile变量
x = 2; //语句1
y = 0; //语句2
flag = true; //语句3
x = 4; //语句4
y = -1; //语句5
由于flag变量是volatile的变量,那么指令再进行重排序的过程中,不会将语句3放在语句1,或者语句2前面,也不会将语句3放在语句4或语句5后面
语句1和语句2的顺序、语句4和语句5的顺序是不作任何保证的。
并且volatile关键字能保证,执行到语句3时,语句1和语句2必定是执行完毕了的,且语句1和语句2的执行结果对语句3、语句4、语句5是可见的。
4. volatile的原理和实现机制
观察加入volatile关键字和没有加入volatile关键字时所生成的汇编代码发现,加入volatile关键字时,会多出一个lock前缀指令。
lock前缀指令实际上相当于一个内存屏障(也成内存栅栏),内存屏障会提供3个功能:
- 它确保指令重排序时不会把其后面的指令排到内存屏障之前的位置,也不会把前面的指令排到内存屏障的后面;即在执行到内存屏障这句指令时,在它前面的操作已经全部完成;
- 它会强制将对缓存的修改操作立即写入主存;
- 如果是写操作,它会导致其他CPU中对应的缓存行无效。
网友评论