volatile的作用

作者: Ella_Eric | 来源:发表于2021-01-24 00:25 被阅读0次

volatile学习
volatile 作用
volatile的作用
volatile的作用
Java 并发编程—volatile 关键字
volatile关键字作用及原理
volatile关键字
架构师五分钟带你读懂，Volatile的作用及原理
(七)Volatile的作用及原理
谈谈对Volatile的理解

[TOC]

缓存

计算机最大的存储空间就是磁盘（硬盘），但是访问的速度也是最慢的，价格最便宜；再就是内存，容量更小，造价更高，但是速度也更快。不过跟cpu的计算速度比起来，那就太慢了。可以想像，如果cpu每次计算都要从内存读取数据，那大部分的时间估计都浪费在这上面了。所以就引入了缓存的概：

image.png

缓存的结构大概是这样的，从1级到3级速度越来越慢，最后通过总线与内存连接。如果时多核多cpu，那么结构大概是这样的：

image.png

多线程造成的缓存不一致

由于现在大部分的机器都有多个cpu，这就导致如果是运行多线程的任务，就可能运行在不同的cpu上。试想一下：

int a = 0;
int b = a;
b += 1;

如果开启两个线程执行，我们想要的结果是3，但是最后的结果只是2。这是因为在做加法运算的时候，cpu会先把a的值读入cpu的缓存，然后更新缓存，在更新内存。很有可能两个线程分散在两个cpu，每个都是对自己缓存内的数据进行读写，这样就造成了结果不一致的现象。

volatile 的作用

从多核CPU的缓存中我们知道volatile的作用就是当一个线程更新某个volatile声明的变量时，会通知其他的cpu使缓存失效，从而其他cpu想要做更新操作时，需要从内存重新读取数据。具体的通知方式，一种是通过某种协议，比如MESI；再就是对总线加锁，控制变量的读取。

在多线程中，volatile和synchronized都起到非常重要的作用，synchronized是通过加锁来实现线程的安全性。而volatile的主要作用是在多处理器开发中保证共享变量对于多线程的可见性。
可见性的意思是，当一个线程修改一个共享变量时，另外一个线程能读取到修改以后的值。接下来通过一个简单的案例来演示可见性问题

public class VolatileDemo {
    private /*volatile*/ static boolean stop=false; //添加volatile修饰和不添加volatile修饰的演示效果
    public static void main(String[] args) throws InterruptedException {
        Thread thread=new Thread(()->{
            int i=0;
            while(!stop){
                i++;
            }
        });
        thread.start();
        System.out.println("begin start thread");
        Thread.sleep(1000);
        stop=true;
    }
}

定义一个共享变量 stop
在main线程中创建一个子线程 thread，子线程读取到 stop的值做循环结束的条件
main线程中修改stop的值为 true
当 stop没有增加volatile修饰时，子线程对于主线程的 stop=true的修改是不可见的，这样将导致子线程出现死循环
当 stop增加了volatile修饰时，子线程可以获取到主线程对于 stop=true的值，子线程while循环条件不满足退出循环

增加volatile关键字以后，main线程对于共享变量 stop值的更新，对于子线程 thread可见，这就是volatile的作用

什么是可见性

在并发编程中，线程安全问题的本质其实就是原子性、有序性、可见性；接下来主要围绕这三个问题进行展开分析其本质，彻底了解可见性的特性

原子性 和数据库事务中的原子性一样，满足原子性特性的操作是不可中断的，要么全部执行成功要么全部执行失败
有序性 编译器和处理器为了优化程序性能而对指令序列进行重排序，也就是你编写的代码顺序和最终执行的指令顺序是不一致的，重排序可能会导致多线程程序出现内存可见性问题
可见性 多个线程访问同一个共享变量时，其中一个线程对这个共享变量值的修改，其他线程能够立刻获得修改以后的值

1. 原子性

即一个操作或者多个操作，要么全部执行并且执行的过程不会被任何因素打断，要么就都不执行。

i = 0;       //1
j = i ;      //2
i++;         //3
i = j + 1;   //4

上面四个操作，有哪个几个是原子操作，那几个不是？如果不是很理解，可能会认为都是原子性操作，其实只有1才是原子操作，其余均不是。

在Java中，对基本数据类型的变量和赋值操作都是原子性操作；
中包含了两个操作：读取i，将i值赋值给j
中包含了三个操作：读取i值、i + 1 、将+1结果赋值给i；
中同三一样

在单线程环境下我们可以认为整个步骤都是原子性操作，但是在多线程环境下则不同，Java只保证了基本数据类型的变量和赋值操作才是原子性的（注：在32位的JDK环境下，对64位数据的读取不是原子性操作，如long、double）。

要想在多线程环境下保证原子性，则可以通过锁、synchronized来确保。volatile是无法保证复合操作的原子性。

2. 可见性

可见性是指当多个线程访问同一个变量时，一个线程修改了这个变量的值，其他线程能够立即看得到修改的值。
举个简单的例子，看下面这段代码：

//线程1执行的代码
int i = 0;
i = 10;

//线程2执行的代码
j = i;

假若执行线程1的是CPU1，执行线程2的是CPU2。由上面的分析可知，当线程1执行 i = 10这句时，会先把i的初始值加载到CPU1的高速缓存中，然后赋值为10，那么在CPU1的高速缓存当中i的值变为10了，却没有立即写入到主存当中。此时线程2执行 j = i，它会先去主存读取i的值并加载到CPU2的缓存当中，注意此时内存当中i的值还是0，那么就会使得j的值为0，而不是10。这就是可见性问题，线程1对变量i修改了之后，线程2没有立即看到线程1修改的值。

在上面已经分析了，在多线程环境下，一个线程对共享变量的操作对其他线程是不可见的。

对于可见性，Java提供了volatile关键字来保证可见性。当一个共享变量被volatile修饰时，它会保证修改的值会立即被更新到主存，当有其他线程需要读取时，它会去内存中读取新值。而普通的共享变量不能保证可见性，因为普通共享变量被修改之后，什么时候被写入主存是不确定的，当其他线程去读取时，此时内存中可能还是原来的旧值，因此无法保证可见性。

另外，通过synchronized和Lock也能够保证可见性，synchronized和Lock能保证同一时刻只有一个线程获取锁然后执行同步代码，并且在释放锁之前会将对变量的修改刷新到主存当中。因此可以保证可见性。

3. 有序性

即程序执行的顺序按照代码的先后顺序执行。
举个简单的例子，看下面这段代码：

int i = 0;              
boolean flag = false;
i = 1;                //语句1  
flag = true;          //语句2

上面代码定义了一个int型变量，定义了一个boolean类型变量，然后分别对两个变量进行赋值操作。从代码顺序上看，语句1是在语句2前面的，那么JVM在真正执行这段代码的时候会保证语句1一定会在语句2前面执行吗？不一定，为什么呢？这里可能会发生指令重排序（Instruction Reorder）。

下面解释一下什么是指令重排序，一般来说，处理器为了提高程序运行效率，可能会对输入代码进行优化，它不保证程序中各个语句的执行先后顺序同代码中的顺序一致，但是它会保证程序最终执行结果和代码顺序执行的结果是一致的。

比如上面的代码中，语句1和语句2谁先执行对最终的程序结果并没有影响，那么就有可能在执行过程中，语句2先执行而语句1后执行。但是要注意，虽然处理器会对指令进行重排序，但是它会保证程序最终结果会和代码顺序执行结果相同，那么它靠什么保证的呢？再看下面一个例子：

int a = 10;    //语句1
int r = 2;    //语句2
a = a + 3;    //语句3
r = a*a;     //语句4

这段代码有4个语句，那么可能的一个执行顺序是：
语句2 -> 语句1 -> 语句3 -> 语句4
那么可不可能是这个执行顺序：
语句2 -> 语句1 -> 语句4 -> 语句3。
不可能，因为处理器在进行重排序时是会考虑指令之间的数据依赖性，如果一个指令Instruction 2必须用到Instruction 1的结果，那么处理器会保证Instruction 1会在Instruction 2之前执行。虽然重排序不会影响单个线程内程序执行的结果，但是多线程呢？下面看一个例子：

//线程1:
context = loadContext();   //语句1
inited = true;             //语句2

//线程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

上面代码中，由于语句1和语句2没有数据依赖性，因此可能会被重排序。假如发生了重排序，在线程1执行过程中先执行语句2，而此时线程2会以为初始化工作已经完成，那么就会跳出while循环，去执行doSomethingwithconfig(context)方法，而此时context并没有被初始化，就会导致程序出错。

从上面可以看出，指令重排序不会影响单个线程的执行，但是会影响到线程并发执行的正确性。也就是说，要想并发程序正确地执行，必须要保证原子性、可见性以及有序性。只要有一个没有被保证，就有可能会导致程序运行不正确。

在Java内存模型中，允许编译器和处理器对指令进行重排序，但是重排序过程不会影响到单线程程序的执行，却会影响到多线程并发执行的正确性。

在Java里面，可以通过volatile关键字来保证一定的“有序性”。另外可以通过synchronized和Lock来保证有序性，很显然，synchronized和Lock保证每个时刻是有一个线程执行同步代码，相当于是让线程顺序执行同步代码，自然就保证了有序性。另外，Java内存模型具备一些先天的“有序性”，即不需要通过任何手段就能够得到保证的有序性，这个通常也称为 happens-before 原则。如果两个操作的执行次序无法从happens-before原则推导出来，那么它们就不能保证它们的有序性，虚拟机可以随意地对它们进行重排序。

如何保证有序性

synchronized 和lock
happens-before原则，即不需要通过任何手段就能够得到保证的有序性，这个通常也称为 happens-before 原则。如果两个操作的执行次序无法从happens-before原则推导出来，那么它们就不能保证它们的有序性，虚拟机可以随意地对它们进行重排序。
volatile 关键字， JVM 内存屏障：屏障两边的指令不可以重排！保障有序！
as if serial : 不管怎么重排序，单线程程序的执行结果不能被改变。编译器、runtime和处理器都必须遵守as-if-serial语义。所以编译器和处理器不会对存在数据依赖关系的操作做重排序，因为这种重排序会改变执行结果。但是，如果操作之间不存在数据依赖关系，这些操作就可能被编译器和处理器重排序

一些细节

MESI

所谓缓存一致性，就是多个CPU核心中缓存的同一共享数据的数据一致性，而(MESI)使用比较广泛的缓存一致性协议。MESI协议实际上是表示缓存的四种状态

M(Modify) 表示共享数据只缓存在当前CPU缓存中，并且是被修改状态，也就是缓存的数据和主内存中的数据不一致
E(Exclusive) 表示缓存的独占状态，数据只缓存在当前CPU缓存中，并且没有被修改
S(Shared) 表示数据可能被多个CPU缓存，并且各个缓存中的数据和主内存数据一致
I(Invalid) 表示缓存已经失效`

每个CPU核心不仅仅知道自己的读写操作，也会监听其他Cache的读写操作
CPU的读取会遵循几个原则

image.png

如果缓存的状态是I，那么就从内存中读取，否则直接从缓存读取
如果缓存处于M或者E的CPU 嗅探到其他CPU有读的操作，就把自己的缓存写入到内存，并把自己的状态设置为S
只有缓存状态是M或E的时候，CPU才可以修改缓存中的数据，修改后，缓存状态变为

如何实现一致性

MESI如果能解决，就使用MESI
如果不能，就锁总线

singleton DCL (double check lock)

public class MySingleon{
        private static volatile MySingleon instance; // 需要加上 volatile
        public static MySingleon getInstance(){
            if(null == instance){
                synchronized (MySingleon.class){
                    if(null == instance){
                        instance = new MySingleon();
                    }
                }
             }
            return instance;
        }
}

对于上述创建object的过程会经历三个阶段

new 一块内存，变量为默认值 0，半初始化
初始化为类的初始值
将对象和指针关联起来

3和2 无法推导happens before, 因此可能会被指令重排序，指令重排序之后， 3 可能在2 前面，其他线程拿到半初始化的指针去用。导致变量的值和类初始值不一样。
因此，对于double check 与synchronized创建的singleton，我们需要对成员变量加上 volatile。

JRS 内存屏障

在两条指令之间加屏障就可以阻止重排序。 java 虚拟机的几种屏障规范实现（底层硬件没有）：

LoadLoad, 两条load之间的屏障
StoreStore，两条store之间的屏障
LoadStore， load和store之间的屏障
StoreLoad， store和load之间的屏障

volatile 阻止指令冲排序过程：

write:
StoreStoreBarrier 所有写操作完了才写
volatile write
StoreLoadBarrier 我写完了后面才能读
read
LoadLoadBarrier 我读完了后面才能读
volatile read
LoadStoreBarrier 我读完了后面才能写

参考文献

volatile学习
目录：1.volatile是什么2.volatile的作用3.volatile的原理4.volatile与sync...
volatile 作用
volatile 作用例如线程A依赖 boolean b 作为退出条件. 但是b的值在线程B中改变的. 如果...
volatile的作用
Volatile的介绍：使用volatile的原因：用在多线程，目的同步变量 Volatile变量相对于锁更简...
volatile的作用
[TOC] 缓存计算机最大的存储空间就是磁盘（硬盘），但是访问的速度也是最慢的，价格最便宜；再就是内存，容量更小...
Java 并发编程—volatile 关键字
volatile 关键字 volatile 作用 volatie 用于修饰变量，它有两个作用。它可以保证变量在多...
volatile关键字作用及原理
volatile的作用 volatile的两层语义： 1、volatile保证变量对所有线程的可见性：当volat...
volatile关键字
java中关键字volatile的作用; volatile vs synchronized的区别 Java并发编...
架构师五分钟带你读懂，Volatile的作用及原理
文章简介分析volatile的作用以及底层实现原理，这也是大公司喜欢问的问题内容导航 volatile的作用 ...
(七)Volatile的作用及原理
文章简介分析volatile的作用以及底层实现原理，这也是大公司喜欢问的问题内容导航 volatile的作用 ...
谈谈对Volatile的理解
谈谈对Volatile的理解带着BAT大厂的面试问题去理解volatile volatile关键字的作用是什么?...

volatile的作用

缓存

多线程造成的缓存不一致

volatile 的作用

什么是可见性

1. 原子性

2. 可见性

3. 有序性

如何保证有序性

一些细节

MESI

如何实现一致性

singleton DCL (double check lock)

JRS 内存屏障

参考文献

相关文章

volatile学习

volatile 作用

volatile的作用

volatile的作用

Java 并发编程—volatile 关键字

volatile关键字作用及原理

volatile关键字

架构师五分钟带你读懂，Volatile的作用及原理

(七)Volatile的作用及原理

谈谈对Volatile的理解

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读