Java ArrayList和HashMap扩容

作者: 耗子2015 | 来源:发表于2017-11-15 16:50 被阅读218次

思考
1、假如我们要创建已知长度的集合List（ArrayList）or Map（HashMap），如何创建？
通常
Map<Integer,Object> map = new HashMap<>(1);
List<String> list = new ArrayList<>(1);
固定长度，减少扩容次数
2、HashMap构造函数，除了初始化容量，还有其它参数吗？
还有个扩容因子loadFactor

印象中以为ArrayList和HashMap都有loadFactor，其实只有HashMap中有，ArrayList中没有。那么他们是如何实现扩容的呢？

ArrayList

/**
 * Appends the specified element to the end of this list.
 *
 * @param e element to be appended to this list
 * @return <tt>true</tt> (as specified by {@link Collection#add})
 */
public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}

add()方法调用ensureCapacityInternal()方法。size表示元素数量，同list.size()方法

private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    
    ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;

    // overflow-conscious code
    // 是否扩容判断
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

最小容量 (minCapacity) = size + 1；
当最小容量大于存储数组长度时，触发扩容，so...数组存储满时再添加新元素触发扩容。

/**
 * Increases the capacity to ensure that it can hold at least the
 * number of elements specified by the minimum capacity argument.
 *
 * @param minCapacity the desired minimum capacity
 */
private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);//此处
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

新容量(newCapacity) = 原容量 + 原容量位运算左移1位
最后通过Arrays.copyOf方法完成复制扩容。
注：左移1位 = n／2 取整

总结：
1、扩容触发点，数组存储已满，再add()时触发
2、扩容量，大概是原来的一半，准确是 newCapacity = oldCapacity + (oldCapacity >> 1);

HashMap
错误理解，原印象扩容因子loadFactor，默认0.75，即假如当前容量是100时，元素数量达到75，即75%时触发扩容。扩容量是当前容量值最近2n次方。

正解：
hashMap.put(key,value)会调用resize()方法

/**
 * Implements Map.put and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @param value the value to put
 * @param onlyIfAbsent if true, don't change existing value
 * @param evict if false, the table is in creation mode.
 * @return previous value, or null if none
 */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;//此处1
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        //此处省略...
    }
    ++modCount;
    if (++size > threshold)
        resize();//此处2
    afterNodeInsertion(evict);
    return null;
}

此处1：第一次put时初始化table，调用resize()方法
此处2：新增后元素数量大于threshold，调用resize()方法
threshold阈值,注释【The next size value at which to resize (capacity * load factor)】

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        //此处1
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        //此处2
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    //此处3
    else if (oldThr > 0) //initial capacity was placed in threshold
        newCap = oldThr;
    //此处4
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    //此处5
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    //中间省略...
}

新阈值和新容量计算稍复杂，仔细梳理每行代码，抛开容量最大值、超出int范围问题，代码解读
新阀值：
1、当原容量大于0 && 原容量右移1位后小于最大容量 && 原容量大于初始容量，新阈值等于原阈值右移1位，即新阈值 = 原阈值2
2、当原容量等于0 && 原阈值等于0，新阀值等于默认扩容因子（0.75）默认初始化容量（16）
3、前两种都不满足时，新容量 * 扩容因子
新容量：
4、当原容量大于0，新容量等于原右移1位
5、当原容量等于0 && 原阈值大于0，新容量等于原阈值
6、当原容量等于0 && 原阈值等于0，新容量等于默认初始容量

场景：
1、new HashMap()，第一次put，原容量等于0，原阈值等于0，执行代码"此处4"
2、new HashMap()，第n（1< n <int最大值）次put时，原容量大于0，原阈值大于默认初始容量，执行代码"此处2"
3、new HashMap(initialCapacity)，第一次put时，因设置初始容量，阀值会在构造函数初始化，阀值等于比initialCapacity大于等于的最近2的n次方(假如设置初始容量3，比3大的最近的2的n次方是4)，所以原容量等于0，原阈值大于0，执行代码"此处3"，新阈值等于0 , 代码"此处5"也会执行。
4、new HashMap(initialCapacity)，如果table已有元素，那么原容量大于0，当原容量小于默认容量时，只会执行代码"此处5"
5、new HashMap(initialCapacity)，如果table已有元素，同上，原容量大于0，当原容量大于等于默认容量时，只会执行代码"此处2"

总结
1、只原容量等于0或原容量小于默认初始容量时，新阀值 = 新容量 * 扩容因子
2、非1情况，新阀值 = 新容量 = 原容量*2

Redis列表和数组扩容机制类似，后续补充。。。

如有错误欢迎指正，谢谢～

下篇准备写ThreadPool。

网友评论

面经

本文标题：Java ArrayList和HashMap扩容

本文链接：https://www.haomeiwen.com/subject/hzufvxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Java ArrayList和HashMap扩容

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

面经