美文网首页
关于Java ArrayList那些事

关于Java ArrayList那些事

作者: 不爱牧羊的牧羊犬 | 来源:发表于2019-12-11 22:01 被阅读0次
    public class ArrayList<E> extends AbstractList<E>
            implements List<E>, RandomAccess, 
            Cloneable, java.io.Serializable
    

    ArrayList继承自AbstractList,并实现了List、RandomAccess、Cloneable、Serializable4个接口
    咱先不管这玩意是啥,有啥优点缺点,原理是啥,直接看看api咋用,撸起袖子一把唆就完事了

    image.png
    image.png

    具体的使用还是需要自己一行一行代码去敲,实践的,这边就不多讲ArrayList的用法啦

    我们来看看get的方法的源码

        transient Object[] elementData;
        public E get(int index) {
            if (index >= size)
                throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    
            return (E) elementData[index];
        }
    
    

    我们发现ArrayList取值是从一个叫elementData的数组获取的,其实我们对ArrayList的所有get、set、add、remove都是通过管理elementData数组实现的。
    那么问题来了:

    数组一旦声明,其大小是不可变的,那么我们add的时候内部发生了什么呢

    其实正是因为数组的长度是不可变的,所以每次add的时候都是对数组进行扩容处理,我们来看看扩容是怎么实现的(add方法)

        ArrayList<String> list = new ArrayList<>();
        list.add("这是第一个参数");
    

    此时刚new出来的ArrayList的size为0,我们来看看该场景下add方法里面做了什么

       /**
         * Appends the specified element to the end of this list.
         *
         * @param e element to be appended to this list
         * @return <tt>true</tt> (as specified by {@link Collection#add})
         */
        public boolean add(E e) {
           这里我们可以知道传参的值 0+1 =>1
            ensureCapacityInternal(size + 1);  // Increments modCount!!
            elementData[size++] = e;
            return true;
        }
    
        private void ensureCapacityInternal(int minCapacity) {
           
            if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
                这边特判为空时候,取DEFAULT_CAPACITY(10)
                与minCapacity(1)的最大值
                minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
            }
    
            ensureExplicitCapacity(minCapacity);
        }
    
        private void ensureExplicitCapacity(int minCapacity) {
            这个先不管,这是父类AbstractList的值
            modCount++;
    
            // overflow-conscious code
            这个注解的意思为溢出考虑
            我一开始乍一看的时候感觉这步有点多此一举的感觉,
            回过头发现原来是自己思维固定在ArrayList为空时扩容的情景下
            我们回到上面的ensureCapacityInternal方法,如果elementData 本身就不为空时扩容,
            那是会直接进入ensureExplicitCapacity这个方法,那么就有可能存在minCapacity>int的最大值(也就是变为了负数)
            if (minCapacity - elementData.length > 0)
           
                grow(minCapacity);
        }
    
         */
        private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
    
        /**
         * Increases the capacity to ensure that it can hold at least the
         * number of elements specified by the minimum capacity argument.
         *
         * @param minCapacity the desired minimum capacity
         */
        private void grow(int minCapacity) {
            // overflow-conscious code(这里还是溢出考虑)
    
            int oldCapacity = elementData.length;
    
            注意:这里是有可能出现溢出的问题,>>1相当于右移1位即除以2
            那么newCapacity 就相当于oldCapacity x1.5有可能存在溢出
            这里jdk1.7、1.8是1.5倍扩容,1.6则是1.5倍+1扩容
            至于为啥是1.5倍扩容呢,俺也不知道,有知道的大佬带带小弟
            int newCapacity = oldCapacity + (oldCapacity >> 1);
    
            如果上方int值溢出了,那这步得到的结果也是小于0
            if (newCapacity - minCapacity < 0)
                newCapacity = minCapacity;
             所以会在这步进行溢出检测
            if (newCapacity - MAX_ARRAY_SIZE > 0)
                newCapacity = hugeCapacity(minCapacity);
            // minCapacity is usually close to size, so this is a win:
            elementData = Arrays.copyOf(elementData, newCapacity);
        }
         检测到溢出后进入到该方法
        private static int hugeCapacity(int minCapacity) {
            这个抛异常没有看懂,因为理论上<0是连上方grow()这个方法也无法进入的
            if (minCapacity < 0) // overflow
                throw new OutOfMemoryError();
           /这个就是溢出处理了没啥好讲的,大家都懂XD
            return (minCapacity > MAX_ARRAY_SIZE) ?
                Integer.MAX_VALUE :
                MAX_ARRAY_SIZE;
        }
    
    

    我们总结一下上方add干的事情

    • 判断扩容数组传入的值minCapacity(size+1)是否int溢出,溢出则不作操作,否则进行扩容
    • 取原先的ArrayList的size进行1.5倍扩容,判断1.5size的值是否小于minCapacity,小于则取minCapacity为最后扩容数组的长度,否则取1.5size。接着判断最后的扩容数组长度是否溢出int最大值,溢出则做溢出处理,最后进行扩容处理(new一个新的数组,并将旧的数组的值拷贝过去)
    • 所以我们平时对ArrayList做的addremove操作都是极其耗时的,因为需要将数组整个前移或后移,但是读取则是非常快

    上方的总结其实比较片面,因为不单单只有add(E e)(size+1)会进入该方法,addAll(Collection<? extends E> c)(size+c.lengh)最后也是会进入该方法的,删除的话也是同理,这里就不谈了

    我们再来看看ArrayList的构造方法跟一些变量

    
        /**
         * Default initial capacity.
         * 默认的数组扩容长度
         */
        private static final int DEFAULT_CAPACITY = 10;
    
        /**
         * Shared empty array instance used for empty instances.
         * 用于空实例的共享空数组实例
         */
        private static final Object[] EMPTY_ELEMENTDATA = {};
    
        /**
         * Shared empty array instance used for default sized empty instances. We
         * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
         * first element is added.
         * 用于默认长度的空实例的共享空数组。我们以第一次添加元素的时候即可知道我们需要
         *填充多少来区分EMPTY_ELEMENTDATA 
         */
        private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    
    
        // Android-note: Also accessed from java.util.Collections
    
    
        transient Object[] elementData; 
    
        /**
         * The size of the ArrayList (the number of elements it contains).
         * 用来返回ArrayList的长度
         * @serial
         */
        private int size;
    
    
        /**
         * Constructs an empty list with the specified initial capacity.
         *
         * @param  initialCapacity  the initial capacity of the list
         * @throws IllegalArgumentException if the specified initial capacity
         *         is negative
         */
        public ArrayList(int initialCapacity) {
            if (initialCapacity > 0) {
                this.elementData = new Object[initialCapacity];
            } else if (initialCapacity == 0) {
             
                this.elementData = EMPTY_ELEMENTDATA;
            } else {
                throw new IllegalArgumentException("Illegal Capacity: "+
                                                   initialCapacity);
            }
        }
    
        /**
         * Constructs an empty list with an initial capacity of ten.
         */
        public ArrayList() {
            this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
        }
    
        /**
         * Constructs a list containing the elements of the specified
         * collection, in the order they are returned by the collection's
         * iterator.
         *
         * @param c the collection whose elements are to be placed into this list
         * @throws NullPointerException if the specified collection is null
         */
        public ArrayList(Collection<? extends E> c) {
            elementData = c.toArray();
            if ((size = elementData.length) != 0) {
                // c.toArray might (incorrectly) not return Object[] (see 6260652)
                if (elementData.getClass() != Object[].class)
                    elementData = Arrays.copyOf(elementData, size, Object[].class);
            } else {
                // replace with empty array.
                this.elementData = EMPTY_ELEMENTDATA;
            }
        }
    
    elementData为什么被transient修饰

    关于为什么使用transient 修饰,大家可以看看这位大佬的解释
    ArrayList中elementData为什么被transient修饰?

    为什么ArrayList.size()不直接返回elementData.size,而是另外记录一个size值返回

    我们可以发现ArrayList.size()方法

    
        /**
         * Returns the number of elements in this list.
         *
         * @return the number of elements in this list
         */
        public int size() {
            return size;
        }
    

    是返回的size的长度而不是elementData 的数组长度,这是因为扩容以后数组的长度不一定就等于实际ArrayList元素的个数,譬如本来ArrayList长度为10,我们给新加一个参数此时就需要扩容了,假设扩容到了15,那么此时的ArrayList的元素实际只占了11个位置,自然就不能返回elementData.size(15)了

    EMPTY_ELEMENTDATA 与DEFAULTCAPACITY_EMPTY_ELEMENTDATA 区别?

    然后再是Object[] EMPTY_ELEMENTDATA = {}Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}这两个值,从三个构造方法中我们可以看出:

    • 当指定了默认的数组长度,但数组长度为0时,则被赋值为EMPTY_ELEMENTDATA
    • 但是有的时候我又不想指定数组长度,譬如我们上方ArrayList<String> list = new ArrayList<>();,这个时候则被赋值DEFAULTCAPACITY_EMPTY_ELEMENTDATA

    “唯一”有“大用”的地方在

        public void ensureCapacity(int minCapacity) {
            int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
                // any size if not default element table
                ? 0
                // larger than default for default empty table. It's already
                // supposed to be at default size.
                : DEFAULT_CAPACITY;
    
            if (minCapacity > minExpand) {
                ensureExplicitCapacity(minCapacity);
            }
        }
    

    扩容数组时候,elementDataEMPTY_ELEMENTDATA,只要minCapacity(扩容传参)不为0则扩容,为DEFAULTCAPACITY_EMPTY_ELEMENTDATA时,若minCapacity>10则扩容
    其实,讲道理,在笔者看来这二者没有什么区别,在jdk1.7中甚至是没有DEFAULTCAPACITY_EMPTY_ELEMENTDATA这个变量的,看代码嘛,别把自己绕进去,不然一天很快就过去了= =

    总结

    ArrayList 增删慢,查询快,存放的数据有序

    注: 本文基于jdk1.8,关于上方的c.toArray might (incorrectly) not return Object[] (see 6260652)的问题;clone()延伸的浅拷贝深拷贝问题;其余List对比问题等一系列问题会在后续的集合系列的文章一一展开讨论

    相关文章

      网友评论

          本文标题:关于Java ArrayList那些事

          本文链接:https://www.haomeiwen.com/subject/tjxogctx.html