本文参考:
面试必问的volatile,你了解多少?
深入分析Volatile的实现原理
- 轻量级的synchronized,执行成本低,不会执行加锁操作,避免了线程的上下文切换。
- 禁止重排序和内存可见性
- 对于写操作,例如 count++ 这种需要依赖变量当前值的,volatile也没用
public class Test {
private static boolean tag;
private static int number;
public static void main(String[] args) {
new ReaderThread().start();
number = 2;
tag = true;
}
private static class ReaderThread extends Thread {
@Override
public void run() {
while (!tag) {
Thread.yield();
System.out.println(number);
}
}
}
}
此段代码输出可能什么都没有,也可能为2,因为不确定线程是否读取到线程启动之后的赋值操作。这种现象称为重排序
使用Volatile 修饰时,在生成汇编代码时,即使是无效动作也会被保留下来,禁止了指令 优化,因此不会造成重排序情况。
在x86处理器下,生成汇编指令发现Volatile指令修饰过后,会多个lock前缀。这个前缀会保证两件事:
- 将当前处理器的缓存行写入内存
- 写入内存后会引起其他CPU缓存了该内存地址的数据无效。
处理器为了提高处理速度,并不是直接跟内存打交道,而是先将内存中的数据读取到缓存,然后再进行操作。 被volatile修饰过后的,会由于有一条Lock 指令,该指令会将这个变量所在的缓存行写入内存,由于此缓存行被写入了内存,因此其他处理器的缓存值将会被失效。需要使用到这个变量时,将会被重新从内存中取数据。
其他相关
此处将其他处理器被失效是因为 处理器一般都遵循MESI缓存一致协议
- M(Modified)
这行数据有效,但是被修改了,和内存中的数据不一致,数据只存在于本Cache中 - E(Exclusive)
这行数据有效,和内存中的数据一致,数据只存在于本Cache中 - S(Shared)
这行数据有效,和内存中的数据一致,数据分布在很多Cache中 - I(Invalid) 这行数据无效
对于一个变量 int x=10 的操作,对于四核处理器
- Core1 加载变量x,值为10,Core的状态为E
- Core2也加载变量x,值为10,这个时候,Core1 Core2缓存变量x的缓存行就会变成S
- Core3加载x,把x的值变为20,这个时候Core3的x变量所在的缓存行变为E,Core1和Core2对应的缓存行变为I,失效。
此协议就保证了上述的将缓存行写入内存后,使其他处理器相应缓存行失效。
使用优化
采用追加字节进行优化
在JDK7的并发包里有个LinkedTransferQueue ,该类中会把共享的变量追加到64个字节。一个对象占4个字节,追加15个变量共占了60个字节,加上开始自身一起共64个字节。
原因:
因为对于酷睿i7等处理器的L1、L2或者L3缓存的高速缓存行是64个字节宽,不支持部分填充缓存行。这就意味着,如果队列的头节点和尾节点都不足64字节的话,将会被放到同一个高速缓存行中,在多处理器下,每个处理器都会缓存同样的头尾节点。当一个处理器进行修改头节点时,会将整个缓存行锁定,在缓存一致性机制的作用下,其他的处理器并不能读取自己缓存行中的尾节点,这样影响了整体的入队和出队效率。如果凑足了64个字节,就可以避免头尾节点出现在同一缓存行中了。
局限
- 并不是所有处理器都支持(非64位字节宽的处理器)
- 共享变量不会被频繁的写(追加字节会造成读取更多的字节到缓冲区,本身带有一定的性能消耗)
网友评论