美文网首页
从源码阅读认识ArrayList

从源码阅读认识ArrayList

作者: 鹰涯 | 来源:发表于2017-02-18 17:49 被阅读105次

优秀源码的阅读对于开发者来说是一个不错的提升方法。今天我们就要通过JDK源码的阅读来重新认识大家所熟悉的ArrayList

ArrayList
//源码
private static final int DEFAULT_CAPACITY = 10;
private static final Object[] EMPTY_ELEMENTDATA = {};
private transient Object[] elementData;
private int size;

ArrayList定义了这四个参数:
DEFAULT_CAPACITY是默认的容量
EMPTY_ELEMENTDATA定义了一个空的数组
elementData是列表中存放对象的数组
size该列表的所存放的对象数量

扩展阅读——transient
细心的读者会发现elementData被关键字transient修饰,这意味着elementData不参与序列化。
这么设计的原因是由于ArrayList的自动扩容机制,保证了ArrayList的容量总是大于等于其所
存放的对象,如果对elementData进行序列化就会造成浪费。因此ArrayList的序列化是对于
elementData所存放的对象进行,而不是elementData本身
部分源码:
for (int i = 0; i < size; i++){ //遍历上限为size,而非elementData.length
    s.writeObject(elementData[i]);
}
可以看到,JDK底层的源码对于内存空间的使用是非常谨慎的。优秀的源码如是,优秀的应用
也应如是。

ArrayList的底层是基于数组实现的。既然ArrayList是用数组对象来作为存储容器,那么其内存模型也和数组是一致的,是一个连续的大小相同的内存。

List<String> list = new ArrayList<String>(5);
list.add("Hello");
list.add("world");
lsit.add("!");
ArrayList内存模型

如图所示,在这段源码中数组对象的长度为5,但是调用list.size()则返回的是3。

构造方法
//源码
    //构造方法一
    public ArrayList() {
        super();
        this.elementData = EMPTY_ELEMENTDATA;
    }

    //构造方法二
    public ArrayList(int initialCapacity) {
        super();
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        this.elementData = new Object[initialCapacity];
    }

    //构造方法三
    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        size = elementData.length;
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    }

ArrayList有三种构造方法(见源码),其中构造方法一是最常用的,这里elementData引用了空的对象数组,当需要容量时,会执行扩容操作(详细见add方法);构造方法二让ArrayList在初始化的时候遍分配好了所需要的内存容量,笔者建议使用ArrayList的时候,如果能够知道即将添加入数组列表中的数据量,则选择这个构造方法预先申请好内存优于其自动扩容,毕竟扩容操作是有开销的;构造方法三可以将已有的Collection子类直接转成ArrayList类型数据。

add & 扩容
//源码
    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

add()比较简单,首先确认下容量是否足够(不够就进行扩容),然后将待添加的对象放置于数组当中。
ensureCapacityInternal()方法就是ArrayList比一般的数组灵活的核心所在。大家都清楚,ArrayList的动态扩容避免了数组越界的问题。接下来就看看ArrayList是如何实现动态扩容机制。

//源码
   private void ensureCapacityInternal(int minCapacity) {
        if (elementData == EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

grow()方法就是对ArrayList进行扩容的操作,判断是否扩容的条件就是minCapacity - elementData.length>0,当ArrayList所需的最小容量大于elementData数组的容量。
oldCapacity >> 1移位操作的细节,相比于直接除以2,得到的结果是一样的,但是由于计算机底层实现是通过移位来实现的,所以直接调用移位方法比直接调用'/'的数学运算运算速度来得快。优秀的源码真是让人受益匪浅,细心点,可以发现不少可以帮助你优化程序性能的地方。

ArrayList动态扩容

通过这段源码,可以知道,扩容机制,就是将数组中的内容复制到另一个容量更大的数组中。这也是为什么笔者建议尽可能地指定ArrayList的初始容量,特别是在容量需求较大是,不指定初始容量会让ArrayList不断扩容,不断地读写内存,导致效率更低。

扩展阅读——机制的利用与滥用
可能有很多读者觉得ArrayList提供了动态扩容的机制,就无需注意这些使用上
的细节,这个想法是错误的,Jvm给我们提供了垃圾回收机制,但很多源码还是
会及时地对数据进行回收处理,来获得更为强大的性能。详情可以去了解Java GC
相关知识。
小实验:
ArrayList<String> list = new ArrayList<String>();  //耗时0ms
for(int i = 0; i<1000000; i++){  //耗时15ms
            list.add("hello");
}
ArrayList<String> list2 = new ArrayList<String>(1000000);  //耗时1ms
for(int i = 0; i<1000000; i++){  //耗时4ms
            list2.add("hello");
}
get()
//源码 get的实现
    public E get(int index) {
        rangeCheck(index);

        return elementData(index);
    }

    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

经常看源码,可以让你的代码变得优雅,很多人觉得,这里rangeCheck()方法只有一个判断,为何还要单独一个方法,如果去细看其他方法的实现,会发现这个方法被多次的调用。本人在项目上见得最多的一个反例,就是这样的代码:

反例:
Object  object = objectDao.get(objectId);  //Object代指某个实例
if(object == null){
  throw new xxxException("object不存在")
}

推荐做法:
public Object getObjectEntity(String objectId){
    Object  object = objectDao.get(objectId);  //Object代指某个实例
    if(object == null){
        throw new xxxException("object不存在")
    }
    return object;
}

但凡需要获取这个Object对象,都是这样的一段代码。而且经常会因为忘记条件语句而出现NPE(空指针异常)。用本人的话来说,就是“不够面向对象”。虽然很简单,不就是封装吗,但是很多开发者都做不到,导致大量不易看懂的业务逻辑,大量的重复代码。

remove()
//源码 remove的实现
    public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }
    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }

简单提一下,对于不需存活的对象,比如被Listremove的对象,可以将对对象的引用指向null,这样GC就会回收这个对象,避免造成内存的浪费,对于提升程序的性能是很有帮助的。

对于ArrayList的其他方法就不多说了,有兴趣的建议去看看源码实现。
欢迎查看下一篇相关的文章《从源码阅读认识LinkedList》

相关文章

  • 从源码阅读认识ArrayList

    优秀源码的阅读对于开发者来说是一个不错的提升方法。今天我们就要通过JDK源码的阅读来重新认识大家所熟悉的Array...

  • 从源码阅读认识LinkedList

    我们从《从源码阅读认识ArrayList》中知道了ArrayList的底层实现以及它的特性(动态扩容),今天要来认...

  • ArrayList源码解析

    下面就跟我一起撸起ArrayList的源码吧。 本文将从几个常用方法下手,来阅读ArrayList的源码。按照从构...

  • 源码阅读之ArrayList

    源码阅读是基于JDK7,本篇主要涉及ArrayList常用方法源码分析。 1.概述ArrayList是List接口...

  • ArrayList学习笔记

    ArrayList--动态数组 ArrayList介绍: 从源码分析: 遍历方式:

  • 一起做做JAVA面试题--ArrayList、LinkedLis

    ArrayList、LinkedList 和 Vector源码解析 ArrayList查看源码 ArrayList...

  • ArrayList的源码分析(一)【转载】

    ArrayList简介 ArrayList核心源码 ArrayList源码分析System.arraycopy()...

  • ArrayList源码阅读

    导读 ArrayList可以看成是动态数组,初始化时,如果没有分配空间,则默认为10。每次进行添加新元素时,会对该...

  • ArrayList源码阅读

    采用数组方式存储数据,可以添加null元素,此数组元素数大于实际存储的数据以便增加插入元素,都允许直接序号索引元素...

  • 源码阅读 - ArrayList

    0. ArrayList是什么 动态数组 1. 实现的本质 动态数组的本质当然是数组 2.常用接口 2.1 构造函...

网友评论

      本文标题:从源码阅读认识ArrayList

      本文链接:https://www.haomeiwen.com/subject/xlqtwttx.html