java基础之集合概览

作者: 墨线宝 | 来源:发表于2023-11-27 10:01 被阅读0次

Java集合系列01之概览
Java集合系列02之ArrayList源码分析
Java集合系列07之HashMap源码分析
Java集合系列04之fail-fast机制分析
Java集合系列06之Map接口概览
Java集合系列03之LinkedList源码分析
Java集合系列05之Vector&Stack源码分析及List
Java集合系列08之WeakHashMap源码分析
Java集合系列09之TreeMap源码分析
Java集合系列10之Hashtable源码分析

有时候需要存储一组数据，之前使用数组，但是数组具有固定的容量，但是在写程序时并不知道需要多少对象，在java.util包下提供了一套完整的集合类，包含List、Set、Queue、Map。java集合类都可以自动地调整自己的大小。

在创建集合时，经常使用泛型，可以在编译期防止将错误的类型放入到集合中。

集合概念

集合分为两个基本接口

集合(Collection)：一个独立元素的序列，List必须已插入顺序保存元素，Set不能包含重复元素，Queue按照排队规则来确定对象产生的顺序（一般是插入顺序）
映射(Map)：一组成对的"键值对"对象，允许使用键来查找值。map允许我们使用一个对象来查找另一个对象

Arrays.asList()的输出是一个List，但是底层实现是数组，没法调整大小。
```
List<String> list = Arrays.asList("123","234");
list.add("345");//java.lang.UnsupportedOperationException
```

List

存储有序，可以重复的元素，相当于动态数组
集合中元素所在类要重写equals方法

ArrayList
LinkedList
Vector

两种类型的list

ArrayList：擅长随机访问元素，但在List中间插入和删除元素时速度较慢
LinkedList：擅长在List中间进行插入和删除操作，提供了优化的顺序访问，对于随机访问相对较慢

List特性

允许插入重复元素
允许插入多个null元素
List提供了ListIterator迭代器，可以提供双向访问

ArrayList和Vector的异同点

相同点

两者都是基于索引的，内部使用数组
两者维护插入顺序，可以根据插入顺序来获取元素
ArrayList和Vector的迭代器实现都是fail-fast的
ArrayList和Vector两者都允许null值，也可以使用索引值对元素进行随机访问

不同点

Vector是同步的，ArrayList不是，但是已过时，使用CopyOnWriteArrayList
ArrayList比Vector快

LinkedList链表

LinkedList添加了一些方法，使其可以被用作栈，队列和双向队列，方法差异

getFirst()和element()是相同的，都是返回列表的头部，而并不删除它，如果list为空，则抛出NoSuchElementException异常。peek()方法在列表为空时返回null
removeFirst()和remove()方法相同，删除并返回列表头部元素，在列表为空时返回NoSuchElementException异常，poll()在列表为空时返回null
addFirst()在列表头部插入一个元素
offer()和add()和addLast()相同，在列表尾部添加一个元素
removeLast()删除并返回列表的最后一个元素

ArrayList和LinkedList的区别

ArrayList是由数组支持的基于索引的数据结构，支持对元素的随机访问，复杂度为O(1)，但是LinkedList是基于链表的，存储一系列的节点数据，每个节点都与前一个节点和下一个节点相连。虽然存在使用索引获取元素的方法，但是内部实现是从起始点开始遍历的，时间复杂度是O(n)
与ArrayList相比，在LinkedList中插入、添加和删除一个元素会更快
LinkedList比ArrayList消耗更多内存，因为需要存储前后节点的引用

迭代器Iterators

Iterator

Iterator接口提供了遍历任何Collection的接口，取代了java集合框架中的Enumeration，迭代器允许调用者在迭代过程中移除数据

iterator只能单向移动

使用iterator()方法使集合返回一个Iterator。Iterator将准备好返回序列中的第一个元素。
使用next()方法获得序列中的下一个元素。
使用hasNext()方法检查序列中是否含有元素。
使用remove()方法将迭代器最近返回的那个元素删除。

Enumeration和iterator的区别

Enumeration的速度是Iterator的两倍，使用内存也少，但是iterator更加安全，使得一个集合在遍历时，会阻止其他线程去修改集合，Iterator允许移除元素
Iterator支持fail-fast机制，而Enumeration不支持，Iterator遍历时，当其他线程修改集合内容时，迭代器会立马感知到，引起快速失败，抛出ConcurrentModificationException异常
Enumeration本身不支持同步，只是在Vector和hashtable实现Enumeration时，添加了同步

ListIterator

ListIterator是Iterator的子类型，只能由各种List类生成，
Iterator只能向前移动，ListIterator可以双向移动，可以生成迭代器在列表中指向位置的后一个和前一个元素的索引。

堆栈stack

堆栈是后进先出(LIFO)，最后压入(push)栈的元素，第一个被弹出(pop)栈。

java1.0中有一个stack类，但是设计的不好，Java6添加了ArrayDeque，其中包含了直接实现堆栈功能的方法

push()添加元素到栈底
peek()和pop()返回对象，peek()返回栈顶元素，但不从栈顶删除，而pop()删除并返回栈顶元素

Set

Set不保存重复的元素。查找是Set最重要的操作，选择HashSet实现，针对快速查找进行了优化。

存储无序，不可重复
添加Set集合中的元素所在类要重写equals和hashCode方法

无序性：指的是元素在底层存储的位置是无序的

HashSet没有顺序，使用散列函数，HashSet维护顺序与TreeSet或LinkedHashSet不同，因为它们实现具有不同的元素存储方式
LinkedHashSet 也使用了散列，使用了链表来维护元素的插入顺序，结果将按元素的插入顺序显示。元素必须定义hashCode()和equals()方法，遍历元素时，会按照添加的进去的顺序
TreeSet将元素存储在红黑树数据结构，可以从Set中获取有序序列，其中元素必须实现Comparable接口

要求添加进TreeSet的必须是同一个类的
两种排序方式
1）自然排序：添加的类要实现Comparable接口，重写compareTo方法
2）定制排序: 使用TreeSet(Comparator<? super E> comparator) 构造器重写compare(T o1, T o2);方法

Map

键值
key不可重复，一个key-value组成一个entry

map的分类

HashMap专为快速访问而设计，TreeMap保持键始终处于排序状态，没有HashMap快。LinkedHashMap按插入顺序保存其元素，但使用散列提供快速访问的能力。

HashMap 基于哈希表的实现。为插入和定位键值对提供了常数时间性能。可以通过构造方法调整性能，这些构造方法允许设置哈希表的容量和装填因子。可以添加key为null，value为null
LinkedHashMap 与HashMap类似，但是当遍历时，可以按照插入顺序或最近最少使用(LRU)顺序获取键值对。只比HashMap略慢，一个例外是在迭代时，由于其使用链表维护内部顺序，所以会更快些，按照添加进Map的顺序遍历
TreeMap 基于红黑树实现，当查看键或键值对时，按排序顺序(由Comparable或Comparator确定)。TreeMap的侧重点在于按排序顺序获得结果。TreeMap是唯一使用subMap()方法的Map，返回红黑树的一部分，按照key所在类的指定属性进行排序，要求key是同一个类的对象（同TreeSet）
WeakHashMap 一个具有弱键的Map，为了解决某些类型的问题，它允许释放Map所引用的对象。如果Map外没有对特定键的引用，则可以对该键进行垃圾回收
ConcurrentHashMap 不使用同步锁定的线程安全Map
IdentityHashMap 使用==来比较键，仅用于解决特殊问题
HashTable 不可添加key为null，value为null的子类Properties 处理属性文件

HashMap工作情况

HashMap在Map.Entry静态内部类实现存储键值对，HashMap使用哈希算法，在put和get方法中，使用hashCode和equals方法，使用put方法时，使用key的hashcode和哈希算法来找出存储键值对的索引，Entry存储在LinkedList中，如果存在entry，使用equals检查传递的key是否存在，如果存在，会覆盖掉value，如果不存在，会创建一个新的entry然后保存。get的时候也是先通过hashcode找到数组中的索引，然后使用equals找到正确的Entry，在进行取值

HashMap默认初始容量是32，负载因子是0.75，阈值是容量乘以负载因子，当map的大小比阈值大时，HashMap会对map的内容进行重新哈希。

HashMap和HashTable的区别

HashMap允许key和value为null，HashTable不允许
HashTable是同步的，HashMap不是
HashMap可以转为LinkedHashMap，使得遍历有序，HashTable的顺序无法预知
HashMap提供对key的set进行遍历，所以是fail-fast的，HashTable提供对key的Enumeration进行遍历，不支持fail-fast
HashTable应该被CocurrentHashMap替代

队列

队列操作

队列是一个先进先出(FIFO)集合，LinkedList实现了Queue接口，并且提供了一些方法支持队列行为

offer()在队列尾部插入一个元素
peek()和element()返回队列头而不删除它，如果队列为空，element()抛出NoSuchElementException，而peek()返回null
poll()和remove()都删除并返回队头元素，如果队列为空，poll()返回null，remove()抛出NoSuchElementException

PriorityQueue优先级队列

优先级队列声明下一个弹出的元素是最需要的元素。

BlockingQueue队列

是concurrent包下的类，在进行检索或移除一个元素的时候，会等待队列变成非空；当添加一个元素的时候，会等待队列中的可用空间。主要用于实现生产者-消费者模式

Collections工具类

unmodifiableCollection方法

Collections.unmodifiableCollection(list)；Collections.unmodifiableList(list)；使用该方法会创建一个只读集合，所有改变集合的操作都会抛出UnsupportedOperationException

public static <T> Collection<T> unmodifiableCollection(Collection<? extends T> c) {
        return new UnmodifiableCollection<>(c);
}

synchronizedCollection方法

Collections.synchronizedCollection(list)方法可以创建一个线程安全的集合

public static <T> Collection<T> synchronizedCollection(Collection<T> c) {
    return new SynchronizedCollection<>(c);
}

问题

1、遍历时移除List中的元素

使用forEach和Iterator

在使用forEach遍历时，实际上是使用的Iterator，使用的核心方法是hasNext()和next()，但是使用的是list.remove，来看个例子

//源码
public class TestList {
    public static void main(String[] args) {
        List<String> list = new ArrayList<>();
        list.add("J");
        list.add("A");
        list.add("V");
        list.add("A");
        for (String s: list) {
            list.remove(s);
        }
    }
}

//编译之后
public class TestList {
    public TestList() {
    }

    public static void main(String[] args) {
        List<String> list = new ArrayList();
        list.add("J");
        list.add("A");
        list.add("V");
        list.add("A");
        Iterator var2 = list.iterator();
        while(var2.hasNext()) {
            String s = (String)var2.next();
            list.remove(s);
        }
    }
}

之前说过，Iterator在遍历时，不允许其他线程对该集合进行操作，看一下ArrayList的iterator是怎么实现的

public E next() {
    checkForComodification();
    int i = cursor;
    if (i >= size)
        throw new NoSuchElementException();
    Object[] elementData = ArrayList.this.elementData;
    if (i >= elementData.length)
        throw new ConcurrentModificationException();
    cursor = i + 1;
    return (E) elementData[lastRet = i];
}

final void checkForComodification() {
    if (modCount != expectedModCount)
        throw new ConcurrentModificationException();
}

在每次获取下一个元素时，都会比较modCount 和 expectedModCount

然后在调用的list的remove方法会导致modCount增加（modCount表示被修改次数）

public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

此时iterator的next方法中两个变量就不一致了，就会抛出ConcurrentModificationException异常

再看一下如果使用iterator的remove方法

public void remove() {
    if (lastRet < 0)
        throw new IllegalStateException();
    checkForComodification();

    try {
        ArrayList.this.remove(lastRet);
        cursor = lastRet;
        lastRet = -1;
        expectedModCount = modCount;
    } catch (IndexOutOfBoundsException ex) {
        throw new ConcurrentModificationException();
    }
}

iterator在remove之后会将modCount的值赋给expectedModCount，就不会出现两个变量不等的情况了

不使用forEach遍历

使用普通for循环，有两种方式，第一种是使用正序遍历，但是进行remove操作之后要把遍历的索引进行修正减一，否则在移除下一个的时候就会出错，第二种就是使用倒序遍历

// 正序遍历
for (int i = 0; i < list.size(); i++) {
    String s = list.remove(i);
    i = i - 1;
    System.out.println(s);
}

//倒序遍历
for (int i = list.size() - 1; i >= 0; i--) {
    String s = list.remove(i);
    System.out.println(s);
}

2、fail-fast和fail-safe

java.util包中集合类被设计为fail-fast的，而java.util.concurrent中集合为fail-safe的。fail-fast迭代器抛出ConcurrentModificationException，而fail-safe迭代器从不抛出ConcurrentModificationException，Iterator的安全失败是基于对底层集合做拷贝，不受源集合上修改的影响

fail-fast

fail-fast迭代器抛出ConcurrentModificationException，通过modCount来进行实现，在进行迭代时，每次对于元素的修改都会修改该值，一旦该值被修改了，就会抛出异常

// 当Itr被实例化的时候，记录一下迭代器被实例化时ArrayList的修改次数(在用ArrayList进行add/remove操作时modCount每次都加一)
int expectedModCount = modCount;

// 检查是否被修改了
    final void checkForComodification() {
          // 当修改次数与Itr被实例化时的修改次数不一致时，说明在进行迭代操作的时候其他线程进行了ArrrayList的add/remove操作，此时抛出ConcurrentModificationException，即为fast-fail快速失败机制
        if (modCount != expectedModCount)
            throw new ConcurrentModificationException();
    }

3、Arrays.asList

这个方法返回的是一个ArrayList，不过这个ArrayList是Arrays类的内部类，在调用add方法的时候会直接报错

UnsupportedOperationException这是运行时异常

public void add(int index, E element) {
    throw new UnsupportedOperationException();
}

https://zhhll.icu/2020/java基础/集合/1.java基础之集合/

本文由mdnice多平台发布

Java集合系列01之概览
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列02之ArrayList源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列07之HashMap源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列04之fail-fast机制分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列06之Map接口概览
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列03之LinkedList源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列05之Vector&Stack源码分析及List
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列08之WeakHashMap源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列09之TreeMap源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列10之Hashtable源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...