CAS(Compare And Swap)比较与交换:一种无锁算法。在不使用锁(没有线程被阻塞)的情况下实现多线程之间的变量同步。java.util.concurrent包中的原子类就是通过CAS来实现了乐观锁。
CAS算法涉及到三个操作数:1,需要读写的内存值V;2,旧的预期值A;3,要写入的新值B。
当且仅当V的值等于A时,CAS通过原子方式用新值B来更新V的值(“比较+更新”整体是一个原子操作),否则不会执行任何操作。一般情况下,“更新”是一个不断重试的操作。
通过查看AtomicInteger源码来看看具体的CAS算法。
![](https://img.haomeiwen.com/i10579521/664674795af1a287.png)
unsafe:获取并操作内存的数据。
valueOffset:存储value在AtomicInteger中的偏移量。
value:存储AtomicInteger的int值,该属性借助volatile关键字保证其在线程间是可见的。
看看AtomicInteger中自增方法incrementAndGet()
![](https://img.haomeiwen.com/i10579521/df2c2e11b78b4806.png)
![](https://img.haomeiwen.com/i10579521/539a85da38fb8f2d.png)
![](https://img.haomeiwen.com/i10579521/c2fbc4e0e8fa5827.png)
CAS通过调用JNI(Java native interface:Java本地调用)的代码实现,允许Java代码调用其他语言。compareAndSwapInt()是本地方法调用CPU底层指令来实现(通过CPU的cmpxchg指令:作用是将指定内存地址的内容与所给的某个值相比,如果相等,则将其内容替换为指令中提供的新值,如果不相等,则更新失败)。
其实要保持数据的一致性,都需要加锁,唯一的区别就是在哪里加锁,加什么锁。本地方法调用CPU底层来实现的CAS,最终也是通过加锁来完成的,这里的加锁就是在CPU上面了。
CPU的锁:
1,处理器自动保证基本内存操作的原子性:当一个处理器读取一个字节时,其他处理器不能访问这个字节的内存地址。这个自动保证是在单处理器对同一个缓存行里进行的操作是原子的,但是复杂的内存操作处理不能自动保证其原子性(跨总线宽度,跨多个缓存行,跨页表的访问)。在这种情况下处理器提供总线锁定和缓存锁定来保证复杂内存操作的原子性。
2,总线锁保证其原子性:如果多个处理器同时对共享变量进行读改写操作。那么共享变量就会被多个处理器同时进行操作,这样读改写操作就不是原子的,操作完之后共享变量的值会和期望的不一致。例如i++操作,多个处理器同时从各自的缓存中读取变量i,分别进行加一操作,然后分别写入系统内存当中。那么想要保证读改写共享变量的操作是原子的,就必须保证一个CPU读改写共享变量的时候,其他CPU不能操作缓存了该共享变量内存地址的缓存。
总线锁可以解决这个问题,总线锁就是使用处理器提供的一个LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占使用共享内存(其他处理器暂时无法通过总线访问内存)。总线锁把CPU和内存之间的通信锁住了,这使得锁定期间,其他处理器不能操作其他内存地址的数据,这个开销比较大,往往也不需要。其实大多数的时候只需要锁定和处理数据相关的缓存的内存地址就行了。
3,缓存锁保证原子性:在同一时刻我们只需保证对某个内存地址的操作是原子性,所以出现了缓存锁。频繁使用的内存会缓存在处理器高速缓存里。那么原子操作就可以直接在处理器内部缓存中进行,并不需要进行总线锁。缓存锁定:如果缓存在处理器缓存行中的内存区域在LOCK操作期间被锁定,当它执行锁操作回写内存时,处理器不在总线上声明LOCK#信号,而是修改内部的内存地址。并允许它的缓存一致性机制来保证操作的原子性,因为缓存一致性机制会阻止同时修改被两个以上处理器缓存的内存区域数据,当其他处理器回写已被锁定的缓存行的数据时会起缓存行无效(缓存一致性机制:是当某块CPU对缓存中的数据进行操作了之后,就通知其他CPU放弃储存在它们内部的缓存,或者从主内存中重新读取)。参考:MESI协议
例外:在处理器支持缓存锁的情况下,以下情况处理器不会使用缓存锁定:1,当操作的数据不能被缓存在处理器内部或者操作的数据跨多个缓存行,则处理器调用总线锁。
疑问:在CPU层面的缓存一致性机制已经保持了共享变量的一致性问题,那么在代码层面上的多线程代码为什么还需要同步?
刚刚网上看到了一种说法:有了缓存一致性协议为什么还需要多线程同步? - 知乎
CAS的缺点:
1,ABA问题:因为CAS需要在操作值的时候检查下值有没有发生变化,如果没有发生变化则更新,但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查时会发现它的值没有发生变化,但是实际上却变化了。ABA问题的解决思路就是使用版本号。在变量前面追加上版本号,每次变量更新的时候把版本号加一,那么A-B-A 就会变成1A-2B-3A。
2,循环时间长开销大:自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。
3,只能保证一个共享变量的原子操作:当对一个共享变量执行操作时,我们可以使用循环CAS的方式来保证原子操作,但是对多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候就可以用锁,或者有一个取巧的办法,就是把多个共享变量合并成一个共享变量来操作。比如有两个共享变量i=2,j=a,合并一下ij=2a,然后用CAS来操作ij。从Java1.5开始JDK提供了AtomicReference类来保证引用对象之间的原子性,你可以把多个变量放在一个对象里来进行CAS操作。
参考:
网友评论