Java集合类工作原理及实现

作者: jtsky | 来源:发表于2017-12-12 11:02 被阅读31次

Android 技能图谱学习路线
Android 技能图谱学习路线
Java 基础知识技能清单
Android 技能图谱学习路线
2020年迷茫不知学什么？Android 技能图谱走起！
Android 技能图谱学习路线
Java集合类工作原理及实现
2017年初BAT的JAVA面试题汇集
2017年末，腾讯，百度，华为，搜狗和滴滴面试题汇总
BAT面试题汇总--摘录

LRUCache原理

核心算法
map：存放数据的集合    new LinkedHashMap<K, V>(0, 0.75f, true);
size：当前LruCahce的内存占用大小
maxSize：Lrucache的最大容量
putCount：put的次数
createCount：create的次数
evictionCount：回收的次数
hitCount：命中的次数
missCount：丢失的次数

Lru是最近最少使用算法的简称，意思呢就是查询出最近的时间使用次数最少的那个对象。设置为true的时候，如果对一个元素进行了操作(put、get)，就会把那个元素放到集合的最后，设置为false的时候，无论怎么操作，集合元素的顺序都是按照插入的顺序来进行存储的。
算法核心：当内容容量达到最大值的时候，只需要移除这个集合的前面的元素直到集合的容量足够存储数据的时候就可以了。

HashMap

图解HashMap(一)

图解HashMap(二)

HashMap实际上是一个“链表散列”的数据结构，即数组和链表的结合体

image.png
简单地说，HashMap 在底层将 key-value 当成一个整体进行处理，这个整体就是一个 Entry 对象。HashMap 底层采用一个 Entry[] 数组来保存所有的 key-value 对，当需要存储一个 Entry 对象时，会根据 hash 算法来决定其在数组中的存储位置，在根据 equals 方法决定其在该数组位置上的链表中的存储位置；当需要取出一个Entry 时，也会根据 hash 算法找到其在数组中的存储位置，再根据 equals 方法从该位置上的链表中取出该Entry。

扩容:当 HashMap 中的元素个数超过数组大小 loadFactor时，就会进行数组扩容，loadFactor的默认值为 0.75，这是一个折中的取值。也就是说，默认情况下，数组大小为 16，那么当 HashMap 中元素个数超过 160.75=12 的时候，就把数组的大小扩展为 2*16=32，即扩大一倍，然后重新计算每个元素在数组中的位置，而这是一个非常消耗性能的操作，所以如果我们已经预知 HashMap 中元素的个数，那么预设元素的个数能够有效的提高 HashMap 的性能。

Fail-Fast 机制：HashMap 不是线程安全的，因此如果在使用迭代器的过程中有其他线程修改了 map，那么将抛出 ConcurrentModificationException，这就是所谓 fail-fast 策略。
例如：当某一个线程 A 通过 iterator去遍历某集合的过程中，若该集合的内容被其他线程所改变了；那么线程 A 访问集合时，就会抛出ConcurrentModificationException 异常，产生 fail-fast 事件。
实现原理：判断 modCount 跟 expectedModCount 是否相等，如果不相等就表示已经有其他线程修改了 Map。
解决方案：建议使用“java.util.concurrent 包下的类”去取代“java.util 包下的类”

遍历方式：
第一种：

　  Map map = new HashMap();
　　Iterator iter = map.entrySet().iterator();
　　while (iter.hasNext()) {
　　Map.Entry entry = (Map.Entry) iter.next();
　　Object key = entry.getKey();
　　Object val = entry.getValue();
    }

效率高,以后一定要使用此种方式
第二种：

Map map = new HashMap();
　　Iterator iter = map.keySet().iterator();
　　while (iter.hasNext()) {
　　Object key = iter.next();
　　Object val = map.get(key);
　　}

效率低,以后尽量少使用！

SparseArray

SparseArray 的使用及实现原理
优势：

避免了基本数据类型的装箱操作
不需要额外的结构体，单个元素的存储成本更低
数据量小的情况下，随机访问的效率更高

有优点就一定有缺点

插入操作需要复制数组，增删效率降低
数据量巨大时，复制数组成本巨大，gc()成本也巨大
数据量巨大时，查询效率也会明显下降

HashSet

对于 HashSet 中保存的对象，请注意正确重写其 equals 和 hashCode 方法，以保证放入的对象的唯一性。这两个方法是比较重要的，希望大家在以后的开发过程中需要注意一下。

image.png

Hashtable

HashMap和HashTab的异同

1.HashTable 基于 Dictionary 类，而 HashMap 是基于 AbstractMap。Dictionary 是任何可将键映射到相应值的类的抽象父类，而 AbstractMap 是基于 Map 接口的实现，它以最大限度地减少实现此接口所需的工作。

2.HashMap 的 key 和 value 都允许为 null，而 Hashtable 的 key 和 value 都不允许为 null。HashMap 遇到 key 为 null 的时候，调用 putForNullKey 方法进行处理，而对 value 没有处理；Hashtable遇到 null，直接返回 NullPointerException。

3.Hashtable 方法是同步，而HashMap则不是。我们可以看一下源码，Hashtable 中的几乎所有的 public 的方法都是 synchronized 的，而有些方法也是在内部通过 synchronized 代码块来实现。所以有人一般都建议如果是涉及到多线程同步时采用 HashTable，没有涉及就采用 HashMap，但是在 Collections 类中存在一个静态方法：synchronizedMap()，该方法创建了一个线程安全的 Map 对象，并把它作为一个封装的对象来返回。

LinkedHashMap

LinkedHashMap是Hash表和链表的实现，并且依靠着双向链表保证了迭代顺序是插入的顺序
其实 LinkedHashMap 几乎和 HashMap 一样：从技术上来说，不同的是它定义了一个 Entry<K,V> header，这个 header 不是放在 Table 里，它是额外独立出来的。LinkedHashMap 通过继承 hashMap 中的 Entry<K,V>,并添加两个属性 Entry<K,V> before,after,和 header 结合起来组成一个双向链表，来实现按插入顺序或访问顺序排序。
HashMap,LinkedHashMap,TreeMap的区别

LinkedHashSet

LinkedHashSet 是 Set 的一个具体实现，其维护着一个运行于所有条目的双重链接列表。此链接列表定义了迭代顺序，该迭代顺序可为插入顺序或是访问顺序。

LinkedHashSet 继承与 HashSet，并且其内部是通过 LinkedHashMap 来实现的。有点类似于我们之前说的LinkedHashMap 其内部是基于 Hashmap 实现一样，不过还是有一点点区别的（具体的区别大家可以自己去思考一下）。

如果我们需要迭代的顺序为插入顺序或者访问顺序，那么 LinkedHashSet 是需要你首先考虑的。

ArrayList

底层采用Object[]数组来实现
ArrayList 可以理解为动态数组，用 MSDN 中的说法，就是 Array 的复杂版本。与 Java 中的数组相比，它的容量能动态增长。ArrayList 是 List 接口的可变数组的实现。实现了所有可选列表操作，并允许包括 null 在内的所有元素。除了实现 List 接口外，此类还提供一些方法来操作内部用来存储列表的数组的大小。（此类大致上等同于 Vector 类，除了此类是不同步的。）

LinkedList

LinkedList 是基于链表结构实现，所以在类中包含了 first 和 last 两个指针(Node)。Node 中包含了上一个节点和下一个节点的引用，这样就构成了双向的链表。每个 Node 只能知道自己的前一个节点和后一个节点，但对于链表来说，这已经足够了。

ConcurrentHashMap

ConcurrentHashMap 的成员变量中，包含了一个 Segment 的数组（final Segment<K,V>[] segments;），而 Segment 是 ConcurrentHashMap 的内部类，然后在 Segment 这个类中，包含了一个 HashEntry 的数组（transient volatile HashEntry<K,V>[] table;）。而 HashEntry 也是 ConcurrentHashMap 的内部类。HashEntry 中，包含了 key 和 value 以及 next 指针（类似于 HashMap 中 Entry），所以 HashEntry 可以构成一个链表。

所以通俗的讲，ConcurrentHashMap 数据结构为一个 Segment 数组，Segment 的数据结构为 HashEntry 的数组，而 HashEntry 存的是我们的键值对，可以构成链表。

ConcurrentHashMap 的高并发性主要来自于三个方面：

用分离锁实现多个线程间的更深层次的共享访问。

用 HashEntery 对象的不变性来降低执行读操作的线程在遍历链表期间对加锁的需求。

通过对同一个 Volatile 变量的写 / 读访问，协调不同线程间读 / 写操作的内存可见性。

使用分离锁，减小了请求同一个锁的频率。

通过 HashEntery 对象的不变性及对同一个 Volatile 变量的读 / 写来协调内存可见性，使得读操作大多数时候不需要加锁就能成功获取到需要的值。由于散列映射表在实际应用中大多数操作都是成功的读操作，所以 2 和 3 既可以减少请求同一个锁的频率，也可以有效减少持有锁的时间。通过减小请求同一个锁的频率和尽量减少持有锁的时间，使得 ConcurrentHashMap 的并发性相对于 HashTable 和用同步包装器包装的 HashMap有了质的提高。

Android 技能图谱学习路线
Java基础 Java Object类方法 HashMap原理，Hash冲突，并发集合，线程安全集合及实现原理 H...
Android 技能图谱学习路线
Java基础 Java Object类方法 HashMap原理，Hash冲突，并发集合，线程安全集合及实现原理 H...
Java 基础知识技能清单
Java基础 Java Object类方法 HashMap原理 Hash冲突，并发集合线程安全集合及实现原理 H...
Android 技能图谱学习路线
Java基础 Java Object类方法HashMap原理，Hash冲突，并发集合，线程安全集合及实现原理Has...
2020年迷茫不知学什么？Android 技能图谱走起！
Java基础 Java Object类方法 HashMap原理，Hash冲突，并发集合，线程安全集合及实现原理 H...
Android 技能图谱学习路线
Java基础 Java Object类方法 HashMap原理，Hash冲突，并发集合，线程安全集合及实现原理 H...
Java集合类工作原理及实现
集合类的实现原理 LRUCache原理 Lru是最近最少使用算法的简称，意思呢就是查询出最近的时间使用次数最少的那...
2017年初BAT的JAVA面试题汇集
Java基础● 集合类以及集合框架；HashMap与HashTable实现原理，线程安全性，hash冲突及处理算法...
2017年末，腾讯，百度，华为，搜狗和滴滴面试题汇总
Java基础集合类以及集合框架；HashMap与HashTable实现原理，线程安全性，hash冲突及处理算法；...
BAT面试题汇总--摘录
JAVA基础 1.集合类以及集合框架；HashMap与HashTable实现原理，线程安全性，hash冲突及处理方...