美文网首页
ArrayList 源码笔记

ArrayList 源码笔记

作者: 杨旭_ | 来源:发表于2020-11-24 13:50 被阅读0次

惯例先来个笑话。


哈哈哈
目录
数据结构基础
扩容
增删改查
面试知识

数据结构基础

数据存储只有两种形式,第一种数组,第二种链表,其他的树和图,堆栈,队列都是从这两个基础数据上衍生出来的,只是为了解决特定的问题进行的封装。

数组的特点

1,数组根据索引取查询数据,所以时间复杂度是O(1);
2,数组一创建就指定了大小,所以问题就来了,插入和从中间删除,剩余的数据保证数据的连续性,数组需要挪动,所以插入删除的时间复杂度是O(n);

链表的特点

1,链表查询数据,需要遍历整个链表,即便是做了优化,判断当前index,确定从前边遍历或者从后边遍历,时间复杂度仍是O(n)。
2,链表插入和删除的,首先需要找到当前插入的点,也需要遍历链表,然后把节点指针相连,所以时间复杂度也是O(n);但是为什么都说链表更适合插入和删除呢,因为链表查找的时间要比移动数据快很多。
简单解释下这里,时间复杂度概念

扩容

从名字上看就知道底层的实现是一个数组,如何做到动态的扩容呢?
首先看成员变量,

 /**
     * Default initial capacity.
     */
    private static final int DEFAULT_CAPACITY = 10;

    /**
     * Shared empty array instance used for empty instances.
     */
    private static final Object[] EMPTY_ELEMENTDATA = {};

    /**
     * Shared empty array instance used for default sized empty instances. We
     * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
     * first element is added.
     */
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

    /**
     * The array buffer into which the elements of the ArrayList are stored.
     * The capacity of the ArrayList is the length of this array buffer. Any
     * empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
     * will be expanded to DEFAULT_CAPACITY when the first element is added.
     */
    // Android-note: Also accessed from java.util.Collections
    transient Object[] elementData; // non-private to simplify nested class access

    /**
     * The size of the ArrayList (the number of elements it contains).
     *
     * @serial
     */
    private int size;

属性
DEFAULT_CAPACITY 默认容量
EMPTY_ELEMENTDATA 有参构造方法赋值给elementData
DEFAULTCAPACITY_EMPTY_ELEMENTDATA 空构造函数赋值给elementData
elementData 数据保存的
size 当前arraylist的数据个数

构造方法三个。

    /**
     * 1
     */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

    /**
     * 2
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    /**
     * 3
     */
    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

构造方法 核心就是给elementData 对象初始化赋值,然后做一些校验,如果有数据copy进去。
为什么上边是两个数组呢?EMPTY_ELEMENTDATA 和DEFAULTCAPACITY_EMPTY_ELEMENTDATA,为什么不用一个数组。

核心方法

    private void ensureCapacityInternal(int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
//1
        }

        ensureExplicitCapacity(minCapacity);
    }


    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
//2
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
//3
    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
//4
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
  //5 
     elementData = Arrays.copyOf(elementData, newCapacity);
    }

private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

1,确定是无参构造函数创建的,默认扩容的值 最小是DEFAULT_CAPACITY =10;添加一个元素扩容一次,添加第二个发现还需要扩容,添加第三个还需要扩容,扩容比较消耗性能。很明显这是不合理的,一次性有个合理的默认值。
2,如果现在目标容量大于现在数组的长度,就调用grow方法扩容.
3,首先拿到数组长度 新的长度 = 原来长度的1.5倍,(为什么用左移,不写/2这种方式,因为二进制运算会比+ -*/速度快很多)
4,做两个校验,第一,如果扩容1.5倍还是不够目标容量,就直接扩容到目标容量minCapacity,如果目标容量大于最大于MAX_ARRAY_SIZE(Integer.MAX_VALUE - 8)需要做一个校验,最大值为Integer.MAX_VALUE
5,拷贝数组数据,进行扩容。

增删改查

添加

我们需要关注的点。
1,ensureCapacityInternal所有添加方法首先会调用扩容方法相关
2,System.arraycopy(); 可以看到这一句,大部分都需要copy 数据所以这也就是消耗性能的地方。

public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }
 public void add(int index, E element) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        elementData[index] = element;
        size++;
    }


public boolean addAll(Collection<? extends E> c) {
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
        System.arraycopy(a, 0, elementData, size, numNew);
        size += numNew;
        return numNew != 0;
    }
 public boolean addAll(int index, Collection<? extends E> c) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount

        int numMoved = size - index;
        if (numMoved > 0)
            System.arraycopy(elementData, index, elementData, index + numNew,
                             numMoved);

        System.arraycopy(a, 0, elementData, index, numNew);
        size += numNew;
        return numNew != 0;
    }
删除

我们需要关注的点。
1,remove 的时候可以看到传入的对象可以为null,所以说明arraylist允许添加Null
2,System.arraycopy(); 可以看到这一句,大部分都需要copy 数据所以这也就是消耗性能的地方。

public E remove(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        modCount++;
        E oldValue = (E) elementData[index];

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }
  public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }
修改

我们需要关注的点。
1,修改数据O(1)级别。

    public E set(int index, E element) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        E oldValue = (E) elementData[index];
        elementData[index] = element;
        return oldValue;
    }
查询

我们需要关注的点。
1,查询数据O(1)级别。

    public E get(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        return (E) elementData[index];
    }

面试知识

1、ArrayList的大小是如何自动增加的?你能分享一下你的代码吗?
答:1.8之后,默认构造函数,不会扩容数组,是一个空的数组,第一次添加元素时候,首先会ensureCapacityInternal 判断当前容量是否足够,不够就行扩容数组,最小一次扩容为10,正常情况下一次扩容当前数组长的1.5倍,如果一次性添加多个数组,则会直接扩容到原来length+新添加的length。最后调用naive进行数组数据copy。
2、什么情况下你会使用ArrayList?什么时候你会选择LinkedList?
答:如果需要频繁移除或者中间插入这种,arraylist都需要调用arraycopy比较消耗性能,这种时候需要考虑linkedlist,如果只是遍历就用arraylist 查询级别o(1);linkedlist查询虽然做了判断 如果当前index超过一半从后边倒序遍历,但是数据足够大还是o(n)级别。
3,如何复制某个ArrayList到另一个ArrayList中去?写出你的代码?深copy浅copy的问题
答:
1,使用clone()方法,比如ArrayList newArray = oldArray.clone();
2,使用ArrayList构造方法,比如:ArrayList myObject = new ArrayList(myTempObject);
3,使用Collection的copy方法。
注意1和2是浅拷贝(shallow copy)。

相关文章

网友评论

      本文标题:ArrayList 源码笔记

      本文链接:https://www.haomeiwen.com/subject/ecwviktx.html