关于Java ArrayList那些事

作者: 不爱牧羊的牧羊犬 | 来源:发表于2019-12-11 22:01 被阅读0次

关于Java ArrayList那些事
关于Java集合的部分复习知识点整理
Java ArrayList操作英文书目录
源码分析：ArrayList扩容机制
java 集合 1 - ArrayList
java基础-泛型中的extends和super
ArrayList 源码分析
ArrayList源码分析
关于java LinkedList那些事
一篇文章，全面解读Android面试知识点

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, 
        Cloneable, java.io.Serializable

ArrayList继承自AbstractList，并实现了List、RandomAccess、Cloneable、Serializable4个接口
咱先不管这玩意是啥，有啥优点缺点，原理是啥，直接看看api咋用，撸起袖子一把唆就完事了

image.png

具体的使用还是需要自己一行一行代码去敲，实践的，这边就不多讲ArrayList的用法啦

我们来看看get的方法的源码

    transient Object[] elementData;
    public E get(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        return (E) elementData[index];
    }

我们发现ArrayList取值是从一个叫elementData的数组获取的，其实我们对ArrayList的所有get、set、add、remove都是通过管理elementData数组实现的。
那么问题来了：

数组一旦声明，其大小是不可变的，那么我们add的时候内部发生了什么呢

其实正是因为数组的长度是不可变的，所以每次add的时候都是对数组进行扩容处理，我们来看看扩容是怎么实现的（add方法）

    ArrayList<String> list = new ArrayList<>();
    list.add("这是第一个参数");

此时刚new出来的ArrayList的size为0，我们来看看该场景下add方法里面做了什么

   /**
     * Appends the specified element to the end of this list.
     *
     * @param e element to be appended to this list
     * @return <tt>true</tt> (as specified by {@link Collection#add})
     */
    public boolean add(E e) {
       这里我们可以知道传参的值 0+1 =>1
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

    private void ensureCapacityInternal(int minCapacity) {
       
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            这边特判为空时候，取DEFAULT_CAPACITY（10）
            与minCapacity（1）的最大值
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
        这个先不管，这是父类AbstractList的值
        modCount++;

        // overflow-conscious code
        这个注解的意思为溢出考虑
        我一开始乍一看的时候感觉这步有点多此一举的感觉，
        回过头发现原来是自己思维固定在ArrayList为空时扩容的情景下
        我们回到上面的ensureCapacityInternal方法，如果elementData 本身就不为空时扩容，
        那是会直接进入ensureExplicitCapacity这个方法，那么就有可能存在minCapacity>int的最大值（也就是变为了负数）
        if (minCapacity - elementData.length > 0)
       
            grow(minCapacity);
    }

     */
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    /**
     * Increases the capacity to ensure that it can hold at least the
     * number of elements specified by the minimum capacity argument.
     *
     * @param minCapacity the desired minimum capacity
     */
    private void grow(int minCapacity) {
        // overflow-conscious code（这里还是溢出考虑）

        int oldCapacity = elementData.length;

        注意：这里是有可能出现溢出的问题，>>1相当于右移1位即除以2
        那么newCapacity 就相当于oldCapacity x1.5有可能存在溢出
        这里jdk1.7、1.8是1.5倍扩容，1.6则是1.5倍+1扩容
        至于为啥是1.5倍扩容呢，俺也不知道，有知道的大佬带带小弟
        int newCapacity = oldCapacity + (oldCapacity >> 1);

        如果上方int值溢出了，那这步得到的结果也是小于0
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
         所以会在这步进行溢出检测
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
     检测到溢出后进入到该方法
    private static int hugeCapacity(int minCapacity) {
        这个抛异常没有看懂，因为理论上<0是连上方grow()这个方法也无法进入的
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
       /这个就是溢出处理了没啥好讲的，大家都懂XD
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

我们总结一下上方add干的事情

判断扩容数组传入的值minCapacity（size+1）是否int溢出，溢出则不作操作，否则进行扩容

取原先的ArrayList的size进行1.5倍扩容，判断1.5size的值是否小于minCapacity，小于则取minCapacity为最后扩容数组的长度，否则取1.5size。接着判断最后的扩容数组长度是否溢出int最大值，溢出则做溢出处理，最后进行扩容处理（new一个新的数组，并将旧的数组的值拷贝过去）

所以我们平时对ArrayList做的add、remove操作都是极其耗时的，因为需要将数组整个前移或后移，但是读取则是非常快

上方的总结其实比较片面，因为不单单只有add(E e)（size+1）会进入该方法，addAll(Collection<? extends E> c)(size+c.lengh)最后也是会进入该方法的，删除的话也是同理，这里就不谈了

我们再来看看ArrayList的构造方法跟一些变量


    /**
     * Default initial capacity.
     * 默认的数组扩容长度
     */
    private static final int DEFAULT_CAPACITY = 10;

    /**
     * Shared empty array instance used for empty instances.
     * 用于空实例的共享空数组实例
     */
    private static final Object[] EMPTY_ELEMENTDATA = {};

    /**
     * Shared empty array instance used for default sized empty instances. We
     * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
     * first element is added.
     * 用于默认长度的空实例的共享空数组。我们以第一次添加元素的时候即可知道我们需要
     *填充多少来区分EMPTY_ELEMENTDATA 
     */
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};


    // Android-note: Also accessed from java.util.Collections


    transient Object[] elementData; 

    /**
     * The size of the ArrayList (the number of elements it contains).
     * 用来返回ArrayList的长度
     * @serial
     */
    private int size;


    /**
     * Constructs an empty list with the specified initial capacity.
     *
     * @param  initialCapacity  the initial capacity of the list
     * @throws IllegalArgumentException if the specified initial capacity
     *         is negative
     */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
         
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

    /**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    /**
     * Constructs a list containing the elements of the specified
     * collection, in the order they are returned by the collection's
     * iterator.
     *
     * @param c the collection whose elements are to be placed into this list
     * @throws NullPointerException if the specified collection is null
     */
    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

elementData为什么被transient修饰

关于为什么使用transient 修饰，大家可以看看这位大佬的解释
ArrayList中elementData为什么被transient修饰？

为什么ArrayList.size()不直接返回elementData.size，而是另外记录一个size值返回

我们可以发现ArrayList.size()方法


    /**
     * Returns the number of elements in this list.
     *
     * @return the number of elements in this list
     */
    public int size() {
        return size;
    }

是返回的size的长度而不是elementData 的数组长度，这是因为扩容以后数组的长度不一定就等于实际ArrayList元素的个数，譬如本来ArrayList长度为10，我们给新加一个参数此时就需要扩容了，假设扩容到了15，那么此时的ArrayList的元素实际只占了11个位置，自然就不能返回elementData.size（15）了

EMPTY_ELEMENTDATA 与DEFAULTCAPACITY_EMPTY_ELEMENTDATA 区别？

然后再是Object[] EMPTY_ELEMENTDATA = {}与Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}这两个值，从三个构造方法中我们可以看出：

当指定了默认的数组长度，但数组长度为0时，则被赋值为EMPTY_ELEMENTDATA

但是有的时候我又不想指定数组长度，譬如我们上方ArrayList<String> list = new ArrayList<>();，这个时候则被赋值DEFAULTCAPACITY_EMPTY_ELEMENTDATA

“唯一”有“大用”的地方在

    public void ensureCapacity(int minCapacity) {
        int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
            // any size if not default element table
            ? 0
            // larger than default for default empty table. It's already
            // supposed to be at default size.
            : DEFAULT_CAPACITY;

        if (minCapacity > minExpand) {
            ensureExplicitCapacity(minCapacity);
        }
    }

扩容数组时候，elementData为EMPTY_ELEMENTDATA，只要minCapacity（扩容传参）不为0则扩容，为DEFAULTCAPACITY_EMPTY_ELEMENTDATA时，若minCapacity>10则扩容
其实，讲道理，在笔者看来这二者没有什么区别，在jdk1.7中甚至是没有DEFAULTCAPACITY_EMPTY_ELEMENTDATA这个变量的，看代码嘛，别把自己绕进去，不然一天很快就过去了= =

总结

ArrayList 增删慢，查询快,存放的数据有序

注： 本文基于jdk1.8，关于上方的c.toArray might (incorrectly) not return Object[] (see 6260652)的问题；clone()延伸的浅拷贝深拷贝问题；其余List对比问题等一系列问题会在后续的集合系列的文章一一展开讨论

关于Java ArrayList那些事
ArrayList继承自AbstractList，并实现了List、RandomAccess、Cloneable、...
关于Java集合的部分复习知识点整理
关于Java集合的部分复习知识点整理 ArrayList ArrayList本质上继承了AbstractList，...
Java ArrayList操作英文书目录
Java ArrayList ListIterator example Java ArrayList Iterat...
源码分析：ArrayList扩容机制
ArrayList是我比较常用的Java容器，最近研究了一下它的底层实现部分。关于ArrayList的继承关系请参...
java 集合 1 - ArrayList
java 集合 1 - ArrayList 参考文章：图解集合1：ArrayList ArrayList使用的数据...
java基础-泛型中的extends和super
List numbers = new ArrayList (); java的ArrayList有一...
ArrayList 源码分析
ArrayList简介： ArrayList 属于 Java 中的高级数据的集合框架。项目包在 java.uti...
ArrayList源码分析
ArrayList 原文见：Java 容器源码分析之 ArrayList 概述 ArrayList是使用频率最高的...
关于java LinkedList那些事
LinkedList继承自AbstractSequentialList，实现了List、 Deque、 Clone...
一篇文章，全面解读Android面试知识点
Java Java基础 Java集合框架 Java集合——ArrayList Java集合——LinkedList...