JDK容器学习之CopyOnWriteArrayList
列表容器常见的有
ArrayList
和LinkedList
,然而两者都是非线程安全的,若应用场景对线程安全有需求,则可以使用CopyOnWriteArrayList
来代替传统的Vector
I. 存储结构
先看下类中定义的成员变量, 一个数组和一个锁
/** The lock protecting all mutators */
final transient ReentrantLock lock = new ReentrantLock();
/** The array, accessed only via getArray/setArray. */
private transient volatile Object[] array;
array: 保存了列表中的数据
lock: 修改时加锁,用于保证线程安全
底层数据结构依然是数组,相交于ArrayList
而言,少了一个表示数组长度的size
变量,获取列表长度是通过下面的方法
public int size() {
return getArray().length;
}
final Object[] getArray() {
return array;
}
留一个问题:
为什么获取链表的长度个ArrayList的使用姿势不同,这样做有什么好处
II. 读取,删除,添加实现逻辑
1. 读取数据
读数据,带两个疑问进行看源码
- 读取是否加锁
- 若加锁性能如何保证;若不加锁线程安全如何保证
先看实现源码
private E get(Object[] a, int index) {
return (E) a[index];
}
/**
* {@inheritDoc}
*
* @throws IndexOutOfBoundsException {@inheritDoc}
*/
public E get(int index) {
return get(getArray(), index);
}
结果比较清晰
- 读数据不加锁
- 线程安全保障先给个简单的说明,后面内容详细补充
- 数组定义为volatile,确保最新改动对多线程可见
private transient volatile Object[] array;
2. 删除元素
直接在源码中加上一些注释
public E remove(int index) {
final ReentrantLock lock = this.lock;
// 加锁,保证同一时刻只能有一个线程对链表进行写操作
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
E oldValue = get(elements, index);
int numMoved = len - index - 1;
if (numMoved == 0) { // 删除最后一个元素时
//直接进行数组拷贝,然后将tables数组引用指向拷贝后的数组
setArray(Arrays.copyOf(elements, len - 1));
} else {
// 创建一个新的数组,将旧数组内容拷贝到新数组中
// 然后将tables数组引用指向新的数组
Object[] newElements = new Object[len - 1];
System.arraycopy(elements, 0, newElements, 0, index);
System.arraycopy(elements, index + 1, newElements, index,
numMoved);
setArray(newElements);
}
return oldValue;
} finally {
lock.unlock();
}
}
从删除的实现,可确定以下几点:
- 修改加锁,确保同一时刻只有一个线程对数组进行修改
- 修改并不是在原数组上进行的,而是创建一个新的数组,在新的数组上进行操作操作,然后将tables引用指向新的数组
- 修改必然会涉及到数组内容的拷贝
3. 新增元素
ArrayList
新增元素时,可能导致数组扩容;CopyOnWriteArrayList
在列表的修改时,采用数组拷贝,在新的数组上进行操作,从这点出发,应该不存在扩容的问题,因为每次修改都会导致数组的重新拷贝
从代码出发,验证上面的观点
public void add(int index, E element) {
final ReentrantLock lock = this.lock;
// 新增,先加锁
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
if (index > len || index < 0) {
// 数组越界判断
throw new IndexOutOfBoundsException("Index: "+index+
", Size: "+len);
}
Object[] newElements;
int numMoved = len - index;
// 将原数组拷贝到新的数组中
if (numMoved == 0) { // 添加在最后一个
newElements = Arrays.copyOf(elements, len + 1);
} else { // 添加到中间,需要两次拷贝
newElements = new Object[len + 1];
System.arraycopy(elements, 0, newElements, 0, index);
System.arraycopy(elements, index, newElements, index + 1,
numMoved);
}
// 直接将数据添加到新的数组
newElements[index] = element;
// 将tables引用指向新的数组
setArray(newElements);
} finally {
lock.unlock();
}
}
从实现得出以下几个结论
-
CopyOnWriteArrayList
没有数组扩容一说,因为每次修改都会创建一个新的数组 - 修改加锁,确保只有一个线程对列表进行修改
III. 线程安全测试
在List的遍历过程中,新增,删除or修改其中元素值时,会出现什么问题?
先写个测试demo
public class CopyOnWriteTest {
List<String> list = new CopyOnWriteArrayList<>(
new String[]{
"1", "2", "3", "4", "5", "6", "7", "8", "9"
}
);
private void modify() {
new Thread(() -> {
list.add(8, "a8");
list.remove(9);
list.set(6, "6666");
System.out.println("----修改完成----");
}).start();
}
@Test
public void testModify() throws InterruptedException {
Iterator<String> iterable = list.iterator();
int i = 0;
while (iterable.hasNext()) {
if (i++ == 1) {
modify();
} else if (i == 4) {
Thread.sleep(1000);
}
System.out.println("index: " + i + " value: " + iterable.next());
}
Thread.sleep(1000);
System.out.println(list);
}
}
输出结果
index: 1 value: 1
index: 2 value: 2
index: 3 value: 3
----修改完成----
index: 4 value: 4
index: 5 value: 5
index: 6 value: 6
index: 7 value: 7
index: 8 value: 8
index: 9 value: 9
[1, 2, 3, 4, 5, 6, 6666, 8, a8]
发现在迭代的过程中,对列表进行修改,是不会影响迭代过程的,遍历的依然是原来的数组;(顺带说一句,如果换成ArrayList会抛并发修改的异常)
探究下原理,主要是因为 CopyOnWriteArrayList
的迭代器的实现方式
static final class COWIterator<E> implements ListIterator<E> {
/** Snapshot of the array */
private final Object[] snapshot;
/** Index of element to be returned by subsequent call to next. */
private int cursor;
private COWIterator(Object[] elements, int initialCursor) {
cursor = initialCursor;
snapshot = elements;
}
public boolean hasNext() {
return cursor < snapshot.length;
}
public boolean hasPrevious() {
return cursor > 0;
}
@SuppressWarnings("unchecked")
public E next() {
if (! hasNext())
throw new NoSuchElementException();
return (E) snapshot[cursor++];
}
@SuppressWarnings("unchecked")
public E previous() {
if (! hasPrevious())
throw new NoSuchElementException();
return (E) snapshot[--cursor];
}
public int nextIndex() {
return cursor;
}
public int previousIndex() {
return cursor-1;
}
/**
* Not supported. Always throws UnsupportedOperationException.
* @throws UnsupportedOperationException always; {@code remove}
* is not supported by this iterator.
*/
public void remove() {
throw new UnsupportedOperationException();
}
/**
* Not supported. Always throws UnsupportedOperationException.
* @throws UnsupportedOperationException always; {@code set}
* is not supported by this iterator.
*/
public void set(E e) {
throw new UnsupportedOperationException();
}
/**
* Not supported. Always throws UnsupportedOperationException.
* @throws UnsupportedOperationException always; {@code add}
* is not supported by this iterator.
*/
public void add(E e) {
throw new UnsupportedOperationException();
}
}
从源码分析可得知
- 构造方法,确保迭代器持有一份对数组的引用,后续的迭代是针对这个数组进行的;若在迭代过程中,列表发生修改,使得List的数组引用指向新的数组,也不会改变迭代器中对原数组的引用,所以依然遍历的是旧数组
- 因为上面的原则,迭代过程中,不允许对数组进行修改
IV. 对比&小结
List容器中,
Vector
和CopyOnWriteArrayList
都是线程安全的,下面则主要对比下两者的实现逻辑
1. Vector
- 所有接口都加锁
- 多线程访问时,导致锁的竞争,导致效率低下
2. CopyOnWriteArrayList
- 底层结构:数组
- 读取接口,无锁
- 修改列表,加锁,确保始终只有一个线程在修改列表内容
- 修改方式:
- 将原数组内容拷贝到新的数组,直接修改新数组
- 然后将新数组赋值给列表的数组引用(
array
)
- 每次修改都会先上锁,然后进行数组拷贝,所以性能较
ArrayList
低;读取无锁,所以读的性能比Vector
高(没有竞争) - 遍历时,是对列表中当前所指向的数组进行遍历,遍历过程中对数组的修改,不会影响遍历的内容
- 默认初始容量为0
网友评论