Java学习之路——Java集合源码分析（一）

作者: 问荆_ | 来源:发表于2019-07-17 19:09 被阅读0次

收藏夹
JAVA集合框架源码分析2-Stack
JAVA集合框架源码分析1-ArrayList
JAVA集合框架源码分析3-LinkedList
Java学习之路——Java集合源码分析（一）
Java集合系列01之概览
Java集合系列02之ArrayList源码分析
Java集合系列07之HashMap源码分析
Java集合系列04之fail-fast机制分析
Java集合系列06之Map接口概览

一、集合的继承关系

Collection是继承自Iterable

二、什么是Iterable

1 . Iterable是可迭代的意思
2 . Iterable是一个接口
3 . 我们看一下官方解释：Implementing this interface allows an object to be the target of the "for-each loop" statement.
简单意思就是：实现此接口，让对象允许成为"for-each loop"的目标。
相信什么是"for-each"大家都知道

4 . 里面有三个方法：

1 Iterator<T> iterator()；生成一个迭代器

Iterator<T> iterator();

2 default void forEach(Consumer<? super T> action)；根据action对内部元素进行遍历

 default void forEach(Consumer<? super T> action) {
        //判断动作是否为空
        Objects.requireNonNull(action);
        for (T t : this) {
            action.accept(t);
        }
    }

3 创建一个分割器（Spliterator），这里先不了解。

default Spliterator<T> spliterator() {
    return Spliterators.spliteratorUnknownSize(iterator(), 0);
}

那么我们简单定义一下，实现此接口的类会成为一个可迭代的容器。

三、什么是Collection

1 . 通过注释我们可以知道Collection是所有集合的根接口
2 . Collection中包含了很多处理容器中各种元素的方法，比如：增加，移除，比较（两个集合），转换（数组或者其他）

那么我们可以简单定义一下，这个Collection接口就是给实现它的容器提供基本规范的方法；

四、什么是List

1 .List是List家族的顶级接口
2 .List是一个有序集合序列（在我看来线性表）
3 .从List中的各种方法看来，List就是用来规范List家族的接口
4 .List家族的成员都必须实现这个接口，实现其中的方法，成为List的一员
5 .List家族有四个成员ArrayList、LinkList、Victor、Stack

这里简单总结一下，这些接口都是用于规范的，并没有实现具体逻辑。

五、ArryList是如何实现的

接下来我们要看ArryList的源码了，但是在看源码之前我们要理清思路，我们重点看什么？

1 ArryList的重要方法，添加，移除，扩张，比较等等还有与其相关的属性
2 ArryList的迭代器

1 . ArryList的迭代器，ArryList中有一个内部类专门实现了迭代器接口

 private class Itr implements Iterator<E> {}

2 . 虽然List已经有了一个基本的迭代器，但是List对这个基本的迭代器的功能并不满足，所以下面有产生了一个List专门用的迭代器：

private class ListItr extends Itr implements ListIterator<E> {}

3、初此之外，ArrayList覆写了父类和List接口的方法，添加，移除，扩张，比较等等。

1 ArrayList是通过数组实现
2 ArrayList扩张是数组的copyOf()方法，第一次扩张数组大小变为10，后面如果要扩张的话，大小变为以前的1.5倍
3 对ArrayList的中操作迭代器会改变ArrayList的成员变量，但是如果只对ArrayList操作，则没有影响迭代器
4 ArrayList里面的元素是无序的（没有按大小顺序排列），他是根据插入元素的先后顺序排列的

源码分析

ArrayList的源码比较清晰，这里只讨论是如何自动扩张的。
我们知道ArrayList是基于数组的，数组有什么不好的地方呢？对了，就是一旦生成了就大小固定无法扩展了，那么ArrayList是如何自动扩张的呢？
首先看向add()方法：

 public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

这里有一个调用了ensureCapacityInternal()方法，翻译一下：确保容量内部，那这个方法是干什么的呢？我们跟踪查看一下。

private void ensureCapacityInternal(int minCapacity) {
        //判断当前使用的数组是否为空数组
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        //最小的容量为DEFAULT_CAPACITY和size+1的更大者
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

从第二行看起，elementData是一个全局变量，用来表示ArrayList当前正在使用的数组，当前正在使用的数组是否是空数组，如果是空数组的话，最小容量就是DEFAULT_CAPACITY（10）和size+1的更大者。
好了看看第六行，又调用了一个ensureExplicitCapacity（）方法，解释一下：确保明确的容量，我们再跟踪查看，等会儿再回来。

 private void ensureExplicitCapacity(int minCapacity) {
 //ArrayList的结构变化增加了一次
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
        //一定会执行
            grow(minCapacity);
    }

modCount是什么？ ArrayList 发生结构变化的次数。
接下来看看第6行：如果最小容量大于当前正在使用的数组的容量，就执行 grow（）方法，我们继续追踪grow()方法

private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        //新的容量是旧的容量的1.5倍
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
        // 新容量小于最小容量的话，就把最小容量赋值给新容量
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
        //新容量大于数组最大容量，就把整数的最大值赋值给新容量
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

重点来了，看向第13行，数组实际扩张的办法，通过Arrays的静态方法copyOf（）。我们追踪一下这个方法：

 public static <T> T[] copyOf(T[] original, int newLength) {
        return (T[]) copyOf(original, newLength, original.getClass());
    }

啊哈，又调用了它的三个参数的重载方法，我们继续追踪：

  public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
        @SuppressWarnings("unchecked")
        T[] copy = ((Object)newType == (Object)Object[].class)
            ? (T[]) new Object[newLength]
            : (T[]) Array.newInstance(newType.getComponentType(), newLength);
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));
        return copy;
    }

完成了，就是直接new一个新的数组，然后再把旧的数组的数据复制回去。

接下来我们要返回到add（）方法中完成最后的步骤了：

 public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

给当前正在使用的数elementData添加元素，这里有个问题，size中的是什么呢？大家可以猜猜哦。。

六、LinkList是如何实现的

我们先看一下LinkList的继承关系

public class LinkedList<E>
    extends AbstractSequentialList<E>
    implements List<E>, Deque<E>, Cloneable, java.io.Serializable{}

我们可以看见LinkList比ArrayList多实现了一个接口Deque<E>，那么这个接口是什么呢？我们来看看

public interface Deque<E> extends Queue<E> {}

通过注释我们可以发现这个接口是一个线性双端队列，它支持容量限制的双端队列。
在这里我们对LinkList有了一点了解。接下来我们看看LinkList的注释。

 * Doubly-linked list implementation of the {@code List} and {@code Deque}
 * interfaces.  Implements all optional list operations, and permits all
 * elements (including {@code null}).

大致意思是：LinkList是一个双链表，可以操作所有元素

1、LinkList与ArrayList不同，他是双链表
2、LinkList的扩张与删除就是结点的增加和删除
3、集合中的元素是也是无序的，他是根据插入结点的位置来排列的
4、判断是从头结点插入还是从尾结点开始插入做了优化

源码分析

为什么说LinkList是双链表呢？

 /**
     * Pointer to first node.
     * Invariant: (first == null && last == null) ||
     *            (first.prev == null && first.item != null)
     */
    transient Node<E> first;

    /**
     * Pointer to last node.
     * Invariant: (first == null && last == null) ||
     *            (last.next == null && last.item != null)
     */
    transient Node<E> last;

LinkList定义了一个头结点和一个尾结点。Node是LinkList的内部类，我们看看他这个结点是怎么实现的：

private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

首先Node是一个私有的静态泛型类，它有三个全局变量，第一个变量是结点储存的元素，后面两个变量分别是当前结点的前驱结点和后继结点，很简单。

接下来我们看看LinkList的插入结点的方法add（）

public boolean add(E e) {
//直接插入默认插入到尾部
        linkLast(e);
        return true;
    }
    
      public void add(int index, E element) {
      //检查这个索引是否超出链表的边界
        checkPositionIndex(index);

        if (index == size)
        //链表为空的时候或者想要插入到尾部的时候直接插入到尾部
            linkLast(element);
        else
            linkBefore(element, node(index));
    }

我们可以看见 LinkList的add（）有两个重载方法。

直接插入话，默认是插入到尾部的。

如果过通过索引插入的话，我们看向第15行：
这里执行了linkBefore（）方法，插入之前的查找工作，传入了需要插入的元素和node（）这个方法的返回值
我们先看看node（）这个方法是干什么的：

 Node<E> node(int index) {
        // assert isElementIndex(index);

        if (index < (size >> 1)) {
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {
            Node<E> x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

这里代码很简单，如果请求插入的索引小于size的一半则从头开始遍历，反之则从尾部开始遍历。返回的也是一个节点

然后我们看看linkBefore（）方法：

 /**
     * Inserts element e before non-null Node succ.//把我们要插入的元素插入到suuc这个节点之前
     */
    void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        final Node<E> pred = succ.prev;
        final Node<E> newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        size++;
        modCount++;
    }

这部分代码的意思就是把我们需要插入的节点插入到我们用node（）方法找到的节点的前一个节点那里。

好了LinkList的源码主要也是分析add（）方法。

收藏夹
博文 Java 集合：Java 集合学习指南 Java 集合：Java 集合源码剖析 HashMap：HashMa...
JAVA集合框架源码分析2-Stack
java中的数据结构之集合框架源码分析的系列文章如下：JAVA集合框架源码分析1-ArrayListJAVA集合框...
JAVA集合框架源码分析1-ArrayList
java中的数据结构之集合框架源码分析的系列文章如下：JAVA集合框架源码分析1-ArrayListJAVA集合框...
JAVA集合框架源码分析3-LinkedList
java中的数据结构之集合框架源码分析的系列文章如下：JAVA集合框架源码分析1-ArrayListJAVA集合框...
Java学习之路——Java集合源码分析（一）
一、集合的继承关系 Collection是继承自Iterable 二、什么是Iterable 1 . Iterab...
Java集合系列01之概览
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列02之ArrayList源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列07之HashMap源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列04之fail-fast机制分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列06之Map接口概览
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...

Java学习之路——Java集合源码分析（一）

一、集合的继承关系

二、什么是Iterable

三、什么是Collection

四、什么是List

五、ArryList是如何实现的

源码分析

六、LinkList是如何实现的

源码分析

相关文章

收藏夹

JAVA集合框架源码分析2-Stack

JAVA集合框架源码分析1-ArrayList

JAVA集合框架源码分析3-LinkedList

Java学习之路——Java集合源码分析（一）

Java集合系列01之概览

Java集合系列02之ArrayList源码分析

Java集合系列07之HashMap源码分析

Java集合系列04之fail-fast机制分析

Java集合系列06之Map接口概览

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读