集合

作者: 墨线宝 | 来源:发表于2021-01-24 22:06 被阅读0次

我的Swift的学习总结 -->第二周
markdown 测试
kotlin学习第五天:集合,高阶函数,Lambda表达式
kotlin练习 ---- 集合练习
集合总结
映射、元组、集合
16.Collection集合
集合与有序集合
python入坑第八天|集合
集合框架

原文链接http://zhhll.icu/2020/java%E5%9F%BA%E7%A1%80/%E9%9B%86%E5%90%88/java%E5%9F%BA%E7%A1%80%E4%B9%8B%E9%9B%86%E5%90%88/

有时候需要存储一组数据，之前使用数组，但是数组具有固定的容量，但是在写程序时并不知道需要多少对象，在java.util包下提供了一套完整的集合类，包含List、Set、Queue、Map。java集合类都可以自动的调整自己的大小。

再创建集合时，经常使用泛型，可以在编译期防止将错误的类型放入到集合中。

集合概念

集合分为两个基本接口

集合(Collection)：一个独立元素的序列，List必须已插入顺序保存元素，Set不能包含重复元素，Queue按照排队规则来确定对象产生的顺序（一般是插入顺序）
映射(Map)：一组成对的"键值对"对象，允许使用键来查找值。map允许我们使用一个对象来查找另一个对象

Arrays.asList()的输出是一个List，但是底层实现是数组，没法调整大小。
```
List<String> list = Arrays.asList("123","234");
list.add("345");//java.lang.UnsupportedOperationException
```

List

存储有序，可以重复的元素，相当于动态数组
集合中元素所在类要重写equals方法

ArrayList
LinkedList
Vector

两种类型的list

ArrayList：擅长随机访问元素，但在List中间插入和删除元素时速度较慢
LinkedList：擅长在List中间进行插入和删除操作，提供了优化的顺序访问，对于随机访问相对较慢

List特性

允许插入重复元素
允许插入多个null元素
List提供了ListIterator迭代器，可以提供双向访问

ArrayList和Vector的异同点

相同点

两者都是基于索引的，内部使用数组
两者维护插入顺序，可以根据插入顺序来获取元素
ArrayList和Vector的迭代器实现都是fail-fast的
ArrayList和Vector两者都允许null值，也可以使用索引值对元素进行随机访问

不同点

Vector是同步的，ArrayList不是，但是已过时，使用CopyOnWriteArrayList
ArrayList比Vector快

LinkedList链表

LinkedList添加了一些方法，使其可以被用作栈，队列和双向队列，方法差异

getFirst()和element()是相同的，都是返回列表的头部，而并不删除它，如果list为空，则抛出NoSuchElementException异常。peek()方法在列表为空是返回null
removeFirst()和remove()方法相同，删除并返回列表头部元素，在列表为空时返回NoSuchElementException异常，poll()在列表为空时返回null
addFirst()在列表头部插入一个元素
offer()和add()和addLast()相同，在列表尾部添加一个元素
removeLast()删除并返回列表的最后一个元素

ArrayList和LinkedList的区别

ArrayList是由数组支持的基于索引的数据结构，支持对元素的随机访问，复杂度为O(1)，但是LinkedList是基于链表的，存储一系列的节点数据，每个节点都与前一个节点和下一个节点相连。虽然存在使用索引获取元素的方法，但是内部实现是从起始点开始遍历的，时间复杂度是O(n)
与ArrayList相比，在LinkedList中插入、添加和删除一个元素会更快
LinkedList比ArrayList消耗更多内存，因为需要存储前后节点的引用

迭代器Iterators

Iterator

Iterator接口提供了遍历任何Collection的接口，取代了java集合框架中的Enumeration，迭代器允许调用者在迭代过程中移除数据

iterator只能单向移动

使用iterator()方法使集合返回一个Iterator。Iterator将准备好返回序列中的第一个元素。
使用next()方法获得序列中的下一个元素。
使用hasNext()方法检查序列中是否还有元素。
使用remove()方法将迭代器最近返回的那个元素删除。

Enumeration和iterator的区别

Enumeration的速度是Iterator的两倍，使用内存也少，但是iterator更加安全，使得一个集合在遍历时，会阻止其他线程去修改集合，Iterator允许移除元素
Iterator支持fail-fast机制，而Enumeration不支持，Iterator遍历时，当其他线程修改集合内容时，迭代器会立马感知到，引起快速失败，抛出ConcurrentModificationException异常
Enumeration本身不支持同步，只是在Vector和hashtable实现Enumeration时，添加了同步

ListIterator

ListIterator是Iterator的子类型，只能由各种List类生成，
Iterator只能向前移动，ListIterator可以双向移动，可以生成迭代器在列表中指向位置的后一个和前一个元素的索引。

堆栈stack

堆栈是后进先出(LIFO)，最后压入(push)栈的元素，第一个被弹出(pop)栈。

java1.0中有一个stack类，但是设计的不好，Java6添加了ArrayDeque，其中包含了直接实现堆栈功能的方法

push()添加元素到栈底
peek()和pop()返回对象，peek()返回栈顶元素，但不从栈顶删除，而pop()删除并返回栈顶元素

Set

Set不保存重复的元素。查找是Set最重要的操作，选择HashSet实现，针对快速查找进行了优化。

存储无序，不可重复
添加Set集合中的元素所在类要重写equals和hashCode方法

无序性：指的是元素在底层存储的位置是无序的

HashSet没有顺序，使用散列函数，HashSet维护顺序与TreeSet或LinkedHashSet不同，因为它们实现具有不同的元素存储方式
LinkedHashSet 也使用了散列，使用了链表来维护元素的插入顺序，结果将按元素的插入顺序显示。元素必须定义hashCode()和equals()方法，遍历元素时，会按照添加的进去的顺序
TreeSet将元素存储在红黑树数据结构，可以从Set中获取有序序列，其中元素必须实现Comparable接口

要求添加进TreeSet的必须是同一个类的
两种排序方式
1）自然排序：添加的类要实现Comparable接口，重写compareTo方法
2）定制排序: 使用TreeSet(Comparator<? super E> comparator) 构造器重写compare(T o1, T o2);方法

Map

键值
key不可重复，一个key-value组成一个entry

map的分类

HashMap专为快速访问而设计，TreeMap保持键始终处于排序状态，没有HashMap快。LinkedHashMap按插入顺序保存其元素，但使用散列提供快速访问的能力。

HashMap 基于哈希表的实现。为插入和定位键值对提供了常数时间性能。可以通过构造方法调整性能，这些构造方法允许设置哈希表的容量和装填因子。可以添加key为null，value为null
LinkedHashMap 与HashMap类似，但是当遍历时，可以按照插入顺序或最近最少使用(LRU)顺序获取键值对。只比HashMap略慢，一个例外是在迭代时，由于其使用链表维护内部顺序，所以会更快些，按照添加进Map的顺序遍历
TreeMap 基于红黑树实现，当查看键或键值对时，按排序顺序(由Comparable或Comparator确定)。TreeMap的侧重点在于按排序顺序获得结果。TreeMap是唯一使用subMap()方法的Map，返回红黑树的一部分，按照key所在类的指定属性进行排序，要求key是同一个类的对象（同TreeSet）
WeakHashMap 一个具有弱键的Map，为了解决某些类型的问题，它允许释放Map所引用的对象。如果Map外没有对特定键的引用，则可以对该键进行垃圾回收
ConcurrentHashMap 不使用同步锁定的线程安全Map
IdentityHashMap 使用==来比较键，仅用于解决特殊问题
HashTable 不可添加key为null，value为null的子类Properties 处理属性文件

HashMap工作情况

HashMap在Map.Entry静态内部类实现存储键值对，HashMap使用哈希算法，在put和get方法中，使用hashCode和equals方法，使用put方法时，使用key的hashcode和哈希算法来找出存储键值对的索引，Entry存储在LinkedList中，如果存在entry，使用equals检查传递的key是否存在，如果存在，会覆盖掉value，如果不存在，会创建一个新的entry然后保存。get的时候也是先通过hashcode找到数组中的索引，然后使用equals找到正确的Entry，在进行取值

HashMap默认初始容量是32，负载因子是0.75，阈值是容量乘以负载因子，当map的大小比阈值大时，HashMap会对map的内容进行重新哈希。

HashMap和HashTable的区别

HashMap允许key和value为null，HashTable不允许
HashTable是同步的，HashMap不是
HashMap可以转为LinkedHashMap，使得遍历有序，HashTable的顺序无法预知
HashMap提供对key的set进行遍历，所以是fail-fast的，HashTable提供对key的Enumeration进行遍历，不支持fail-fast
HashTable应该被CocurrentHashMap替代

队列

队列操作

队列是一个先进先出(FIFO)集合，LinkedList实现了Queue接口，并且提供了一些方法支持队列行为

offer()在队列尾部插入一个元素
peek()和element()返回队列头而不删除它，如果队列为空，element()抛出NoSuchElementException，而peek()返回null
poll()和remove()都删除并返回队头元素，如果队列为空，poll()返回null，remove()抛出NoSuchElementException

PriorityQueue优先级队列

优先级队列声明下一个弹出的元素是最需要的元素。

BlockingQueue队列

是concurrent包下的类，在进行检索或移除一个元素的时候，会等待队列变成非空；当添加一个元素的时候，会等待队列中的可用空间。主要用于实现生产者-消费者模式

Collections工具类

unmodifiableCollection方法

Collections.unmodifiableCollection(list)；Collections.unmodifiableList(list)；使用该方法会创建一个只读集合，所有改变集合的操作都会抛出UnsupportedOperationException

public static <T> Collection<T> unmodifiableCollection(Collection<? extends T> c) {
        return new UnmodifiableCollection<>(c);
}

synchronizedCollection方法

Collections.synchronizedCollection(list)方法可以创建一个线程安全的集合

public static <T> Collection<T> synchronizedCollection(Collection<T> c) {
    return new SynchronizedCollection<>(c);
}

问题

1、遍历时移除List中的元素

使用forEach和Iterator

在使用forEach遍历时，实际上是使用的Iterator，使用的核心方法是hasNext()和next()，但是使用的是list.remove，来看个例子

//源码
public class TestList {
    public static void main(String[] args) {
        List<String> list = new ArrayList<>();
        list.add("J");
        list.add("A");
        list.add("V");
        list.add("A");
        for (String s: list) {
            list.remove(s);
        }
    }
}

//编译之后
public class TestList {
    public TestList() {
    }

    public static void main(String[] args) {
        List<String> list = new ArrayList();
        list.add("J");
        list.add("A");
        list.add("V");
        list.add("A");
        Iterator var2 = list.iterator();
        while(var2.hasNext()) {
            String s = (String)var2.next();
            list.remove(s);
        }
    }
}

之前说过，Iterator在遍历时，不允许其他线程对该集合进行操作，看一下ArrayList的iterator是怎么实现的

public E next() {
    checkForComodification();
    int i = cursor;
    if (i >= size)
        throw new NoSuchElementException();
    Object[] elementData = ArrayList.this.elementData;
    if (i >= elementData.length)
        throw new ConcurrentModificationException();
    cursor = i + 1;
    return (E) elementData[lastRet = i];
}

final void checkForComodification() {
    if (modCount != expectedModCount)
        throw new ConcurrentModificationException();
}

在每次获取下一个元素时，都会比较modCount 和 expectedModCount

然后在调用的list的remove方法会导致modCount增加（modCount表示被修改次数）

public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

此时iterator的next方法中两个变量就不一致了，就会抛出ConcurrentModificationException异常

再看一下如果使用iterator的remove方法

public void remove() {
    if (lastRet < 0)
        throw new IllegalStateException();
    checkForComodification();

    try {
        ArrayList.this.remove(lastRet);
        cursor = lastRet;
        lastRet = -1;
        expectedModCount = modCount;
    } catch (IndexOutOfBoundsException ex) {
        throw new ConcurrentModificationException();
    }
}

iterator在remove之后会将modCount的值赋给expectedModCount，就不会出现两个变量不等的情况了

不使用forEach遍历

使用普通for循环，有两种方式，第一种是使用正序遍历，但是进行remove操作之后要把遍历的索引进行修正减一，否则在移除下一个的时候就会出错，第二种就是使用倒序遍历

// 正序遍历
for (int i = 0; i < list.size(); i++) {
    String s = list.remove(i);
    i = i - 1;
    System.out.println(s);
}

//倒序遍历
for (int i = list.size() - 1; i >= 0; i--) {
    String s = list.remove(i);
    System.out.println(s);
}

2、fail-fast和fail-safe

java.util包中集合类被设计为fail-fast的，而java.util.concurrent中集合为fail-safe的。fail-fast迭代器抛出ConcurrentModificationException，而fail-safe迭代器从不抛出ConcurrentModificationException

3、Arrays.asList

这个方法返回的是一个ArrayList，不过这个ArrayList是Arrays类的内部类，在调用add方法的时候会直接报错

UnsupportedOperationException这是运行时异常

public void add(int index, E element) {
    throw new UnsupportedOperationException();
}

由于本身的博客百度没有收录，博客地址http://zhhll.icu

我的Swift的学习总结 -->第二周
集合集合：Set，定义一个集合可以写成：var 集合名 : Set<集合类型> = [集合元素]，具体的集合应用...
markdown 测试
集合集合集合引用
kotlin学习第五天:集合,高阶函数,Lambda表达式
集合 list集合 list集合分为可变集合与不可变集合。由list of创建的集合为不可变集合，不能扩容，不能修...
kotlin练习 ---- 集合练习
kotlin练习 - 集合练习 Set集合 Set集合创建 Set集合的使用 List集合 List集合创建 Li...
集合总结
集合集合分为单列集合和双列集合两种：一.单列集合： Collection是单列集合的顶级接口：其中有三类集合...
映射、元组、集合
映射元组集合集合之seq 集合之set 集合之map
16.Collection集合
主要内容： Collection 集合迭代器增强for List 集合 Set 集合 1，集合集合是java...
集合与有序集合
集合分为有序集合 (zset) 和无序集合 (set), 一般无序集合也直接说成集合无序集合 (set) 无序集...
python入坑第八天|集合
好的，各位蛇友，我们今天来学习集合。内容：集合的创建集合操作符号集合的内置函数集合的创建集合用set(...
集合框架
集合框架的概念集合：存放数据的容器集合框架：java中，用于表示集合，以及操作集合的类和接口的统称数组与集合...

集合