美文网首页并发编程java并发编程android
谈谈写入时复制的思想---以CopyOnWriteArrayLi

谈谈写入时复制的思想---以CopyOnWriteArrayLi

作者: EakonZhao | 来源:发表于2016-09-27 17:15 被阅读3433次

    写入时复制(CopyOnWrite)思想

    写入时复制(CopyOnWrite,简称COW)思想是计算机程序设计领域中的一种优化策略。其核心思想是,如果有多个调用者(Callers)同时要求相同的资源(如内存或者是磁盘上的数据存储),他们会共同获取相同的指针指向相同的资源,直到某个调用者视图修改资源内容时,系统才会真正复制一份专用副本(private copy)给该调用者,而其他调用者所见到的最初的资源仍然保持不变。这过程对其他的调用者都是透明的(transparently)。此做法主要的优点是如果调用者没有修改资源,就不会有副本(private copy)被创建,因此多个调用者只是读取操作时可以共享同一份资源。

    CopyOnWriteArrayList
    CopyOnWriteArrayList是Java中的并发容器类,同时也是符合写入时复制思想的CopyOnWrite容器。关于CopyOnWriteArrayList的介绍我就不过多赘述了,可以参考我这篇博客来了解-----《Java并发编程实战》学习笔记--并发容器类

    下面将通过CopyOnWriteArrayList的源码来了解写入时复制思想

    ReentrantLock锁

    CopyOnWriteArrayList中有一个ReentrantLock锁,这是一个可重入的锁,提供了类似于synchronized的功能和内存语义,但是ReentrantLock的功能性更为全面。由于本文重点是介绍CopyOnWrite思想,所以对于ReentrantLock就不过多介绍,只要知道它是用来保证线程安全性的即可。

    容器自身的数组,仅当使用getArray/setArray方法时才能获得

    下面这个两个方法是CopyOnWriteArrayList实现写入时复制的关键:
    一个是获得当前容器数组的一个副本,另一个是将容器数组的引用指向一个修改之后的数组。

    获得容器数组 将容器数组的引用指向a

    下面来看看使用了写入时复制的set方法:

    public E set(int index, E element) {
            final ReentrantLock lock = this.lock;
            lock.lock();//获得锁
            try {
                Object[] elements = getArray();//得到目前容器数组的一个副本
                E oldValue = get(elements, index);//获得index位置对应元素目前的值
    
                if (oldValue != element) {
                    int len = elements.length;
                    //创建一个新的数组newElements,将elements复制过去
                    Object[] newElements = Arrays.copyOf(elements, len);
                    //将新数组中index位置的元素替换为element
                    newElements[index] = element;
                    //这一步是关键,作用是将容器中array的引用指向修改之后的数组,即newElements
                    setArray(newElements);
                } else {
                    //index位置元素的值与element相等,故不对容器数组进行修改
                    setArray(elements);
                }
                return oldValue;
            } finally {
                lock.unlock();//解除锁定
            }
        }
    

    我们可以看到,在set方法中,我们首先是获得了当前数组的一个拷贝获得一个新的数组,然后在这个新的数组上完成我们想要的操作。当操作完成之后,再把原有数组的引用指向新的数组。并且在此过程中,我们只拥有一个事实不可变对象,即容器中的array。这样一来就很巧妙地体现了CopyOnWrite思想。

    其实这也是读写分离的一种体现。当线程在对线程进行读或者写的操作时,其实操作的是不同的容器。这么一来我们可以对容器进行并发的读,而不需要加锁。实际上就是这么做的:

    没有加锁的读操作

    那么问题来了

    • 如果每次都要对原有的容器进行复制,岂不是很消耗内存?
    • 还有,假如说一个线程正在对容器进行修改,另一个线程正在读取容器的内容,这其实是两个容器数组。那么读线程读到的不是旧数据吗?

    没错,这正是CopyOnWrite容器t的不足:

    • 存在内存占用的问题,因为每次对容器结构进行修改的时候都要对容器进行复制,这么一来我们就有了旧有对象和新入的对象,会占用两份内存。如果对象占用的内存较大,就会引发频繁的垃圾回收行为,降低性能;
    • CopyOnWrite只能保证数据最终的一致性,不能保证数据的实时一致性。

    所以对于CopyOnWrite容器来说,只适合在读操作远远多于写操作的场景下使用,比如说缓存。

    相关文章

      网友评论

      • 6ffbe88266b6:“存在内存占用的问题,因为每次对容器结构进行修改的时候都要对容器进行复制,这么一来我们就有了旧有对象和新入的对象,会占用两份内存。“
        这个旧有对象和新对象指的是哪个呀?假设数组存放对象,如add时虽然新建了一个数组,但System.arraycopy应该只是浅复制,数组中存放的只是引用。这个过程中应该只是数组里的引用复制了吧。这里的旧和新不会指的是数组吧??
      • 叽哩叽哩鸡:楼主, 为什么Object[] snapshot = elements是复制呢, 这不应该是引用么? 难道是多线程下的=操作就是cow了?
        叽哩叽哩鸡:@EakonZhao 能查看自己的评论
        EakonZhao:@叽哩叽哩鸡 时隔这么多天你还记得我的博客……
        叽哩叽哩鸡:我怕是傻了, 这就只是引用

      本文标题:谈谈写入时复制的思想---以CopyOnWriteArrayLi

      本文链接:https://www.haomeiwen.com/subject/jggcyttx.html