Android 2020年面试系列（01 — Java 集合）

作者: Super含 | 来源:发表于2020-03-02 11:19 被阅读0次

Java集合系列01之概览
Java集合系列02之ArrayList源码分析
Java集合系列07之HashMap源码分析
Java集合系列04之fail-fast机制分析
Java集合系列06之Map接口概览
Java集合系列03之LinkedList源码分析
Java集合系列05之Vector&Stack源码分析及List
Java集合系列08之WeakHashMap源码分析
Java集合系列09之TreeMap源码分析
Java集合系列10之Hashtable源码分析

序

三月你好。但愿三月可以花开疫散。

俗话说 “面试造航母，工作拧螺丝”。虽然这有点夸大的意思，但是如果不能向面试官证明你可以造航母，那你可能连拧螺丝的机会都没有。（还有就是面试官问的问题，不一定在每个版本迭代的时候都能使用上，但是在你在职期间一定会用到的。）

2020 年面试系列文章，属于总结性文章，会把一些公认的面试技术点整理出来，并且附上每个技术点的原理和博客。目的是对面试前的技术储备。

业内公认的面试金三银四，今年的面试黄金时期可能会推迟到金五银六等等。所以尽量在五月份之前完成这个系列。这个系列文章不会超过十篇，我不太喜欢那种大而全的东西，目前我希望这个系列属于某些技术点的认识（面试必问的技术点）。我希望看完这个系列的文章可以对找工作的小伙伴有所帮助。

面试交流群：（欢迎老哥们加入）

本篇文章主要是介绍 Java 集合的知识，着重分析的是 HashMap 跟 ConcurrentHashMap 。

Java 技术点集合

如果有人说在面试的时候没有遇到过问 Java 集合技术点的面试官。我会说我不信，你遇到的面试官是假的吧。

。。。

OK 言归正传。附上一个集合关系图

所有集合类都位于java.util包下。Java的集合类主要由两个接口派生而出：Collection和Map，Collection和Map是Java集合框架的根接口。

附图说明

1. Collection 是一个高度抽象出来的集合接口 ，包含了集合的顶层函数。Collection 集合分为 List 和 Set 两大分支。

1.1 List 是一个有序的队列，每一个元素都有它的索引 。第一个元素的索引值是0 。List的实现类有LinkedList , ArrayList , Vector , Stack 。

1.2 Set 是一个不允许有重复元素的集合 。Set 的实现类有 HastSet 和 TreeSet 。HashSet依赖于HashMap，它实际上是通过HashMap实现的；TreeSet依赖于TreeMap ，它实际上是通过TreeMap实现的。

2. Map 是一个映射接口 ，即key-value键值对。Map 中的每一个元素包含 “一个 key ” 和 “ key 对应的 value ” 。AbstractMap 是个抽象类，它实现了 Map 接口中的大部分 API 。而 HashMap ，TreeMap ，WeakHashMap 都是继承于AbstractMap 。Hashtable 虽然继承于 Dictionary ，但它实现了Map接口。

3. Iterator 是遍历集合的工具 ，即我们通常通过 Iterator 迭代器来遍历集合。我们说 Collection 依赖于 Iterator ，是因为Collection的实现类都要实现 iterator() 函数，返回一个 Iterator 对象。ListIterator 是专门为遍历 List 而存在的。

4. Enumeration 是JDK 1.0 引入的抽象类 。作用和 Iterator 一样也是遍历集合；但是 Enumeration 的功能要比 Iterator 少。在上面的框图中，Enumeration 只能在 Hashtable , Vector , Stack 中使用。

5. 最后看 Arrays 和 Collections 。它们是操作数组、集合的两个工具类。

集合特性

List 接口（对象按照索引位置排序，可以有重复对象，允许按照对象在集合中的索引位置检索对象）

ArrayList 线程不同步，数据结构为数组，特点：查询快、增删慢

LinkedList 线程不同步，数据结构为链表，特点：查询慢、增删快

Vector 线程同步，数据结构为数组，特点：查询慢、增删慢（过时）

Set 接口（不允许有重复元素，对象不按特定方式排序。实现类中的对象可以按特定方式排序，也可以实现 Comparator 接口来自定义排序方式）

HashSet 线程不同步，数据结构为哈希表，无序

LinkedHashSet 线程不同步，数据结构为链表，有序

TreeSet 线程不同步，数据结构为二叉树，有序

Map 接口（每一个元素包含一个键值对象）

HashMap 线程不同步，数据结构哈希表等等（此集合需要深入分析，划重点，面试必问题，要不赌一个面包机）

LinkedHashMap 线程不同步，数据结构为链表，保留插入顺序

HashTab 线程同步，数据结构为哈希表，键值对都不允许为 null （过时）

TreeMap 线程不同步，数据结构为红黑树，保留插入顺序

ConcurrentHashMap 线程安全（面试单独问过）

Android 集合

SparseIntArray ，SparseLongArray ，SparseBooleanArray 只存储对应类型值

（参考文章 https://www.cnblogs.com/xiaoxi/p/6089984.html）

PS：线程不同步意味着不安全，不安全意味着操作快；线程同步意味着安全，操作起来就会相对来说慢。

上述是集合的整体分析，如果要问那一个集合是面试中必问的，我想应该是 HashMap 。HashMap 可以说是集合界的实力选手，除了一些特定的场景，你可以在项目中搜一下，HashMap使用的一定是最多的。接下来余篇就单独对 HashMap进行分析。要想对 HashMap 有一定的深入，除了知道表面的东西之外，分析源码是必须的。如果没有读过 HaspMap 的源码，那一定是死记硬背。

HashMap

它的底层基于哈希表，采用数组存储数据，使用链表来解决哈希碰撞。在JDK1.8中还引入了红黑树来解决链表长度过长导致的查询速度下降问题。

HashMap 面试能问的真的是太多太多了。譬如

1. HashMap 的工作原理是什么？

使用 put(key, value) 存储对象到 HashMap 中，使用 get(key) 从 HashMap 中获取对象。当我们给 put() 方法传递键和值时，我们先对键调用 hashCode() 方法 ，计算并返回的 hashCode 是用于找到 Map 数组的 bucket 位置来储存 Node 对象。

以下是具体的 put 过程（JDK1.8）：

对 Key 求 Hash 值，然后再计算下标。

如果没有碰撞，直接放入桶中（碰撞的意思是计算得到的 Hash 值相同，需要放到同一个 bucket 中）。

如果碰撞了，以链表的方式链接到后面。

如果链表长度超过阀值（TREEIFY THRESHOLD==8），就把链表转成红黑树，链表长度低于6，就把红黑树转回链表。

如果节点已经存在就替换旧值。

如果桶满了（容量16*加载因子0.75），就需要 resize（扩容2倍后重排）。

以下是具体 get 过程：

调用 get() 方法，HashMap 会使用键对象的 hashcode 找到 bucket 位置，找到 bucket 位置之后，会调用 keys.equals() 方法去找到链表中正确的节点，最终找到要找的值对象。

2. 有什么方法可以减少碰撞？

扰动函数可以减少碰撞。

原理是如果两个不相等的对象返回不同的 hashcode 的话，那么碰撞的几率就会小些。这就意味着存链表结构减小，这样取值的话就不会频繁调用 equal 方法，从而提高 HashMap 的性能（扰动即 Hash 方法内部的算法实现，目的是让不同对象返回不同hashcode）。

使用不可变的、声明作 final 对象，并且采用合适的 equals() 和 hashCode() 方法，将会减少碰撞的发生。不可变性使得能够缓存不同键的 hashcode，这将提高整个获取对象的速度，使用 String、Integer 这样的 wrapper 类作为键是非常好的选择。

3. HashMap 中 hash 函数怎么是实现的?

我们在 hashmap 中要找到某个元素，需要根据 key 的 hash 值来求得对应数组中的位置，如何计算这个位置就是 hash 算法。前面说过，hashmap 的数据结构是数组和链表的结合，所以我们当然希望这个 hashmap 里面的元素位置尽量的分布均匀些，尽量使得每个位置上的元素数量只有一个。那么当我们用 hash 算法求得这个位置的时候，马上就可以知道对应位置的元素就是我们要的，而不用再去遍历链表。所以，我们首先想到的就是把 hashcode 对数组长度取模运算。这样一来，元素的分布相对来说是比较均匀的。但是“模”运算的消耗还是比较大的，能不能找一种更快速、消耗更小的方式？

简单来说就是：

1. 高16 bit 不变，低16 bit 和高16 bit 做了一个异或（得到的 hashcode 转化为32位二进制，前16位和后16位低16 bit和高16 bit做了一个异或）。

2. (n·1) & hash = -> 得到下标。

4. 拉链法导致的链表过深，为什么不用二叉查找树代替而选择红黑树？为什么不一直使用红黑树？

之所以选择红黑树是为了解决二叉查找树的缺陷：二叉查找树在特殊情况下会变成一条线性结构（这就跟原来使用链表结构一样了，造成层次很深的问题），遍历查找会非常慢。而红黑树在插入新数据后可能需要通过左旋、右旋、变色这些操作来保持平衡。引入红黑树就是为了查找数据快，解决链表查询深度的问题。我们知道红黑树属于平衡二叉树，为了保持“平衡”是需要付出代价的，但是该代价所损耗的资源要比遍历线性链表要少。所以当长度大于8的时候，会使用红黑树；如果链表长度很短的话，根本不需要引入红黑树，引入反而会慢。

PS：关于二叉树的缺陷 ，这个之前面试的时候也也被问过，当时也算是说了一下大概。还有就是红黑树通过哪些方式来保持平衡的？可以参考文章 https://mp.weixin.qq.com/s/jz1ajDUygZ7sXLQFHyfjWA

5. 如果 HashMap 的大小超过了负载因子（load factor）定义的容量怎么办？

HashMap 默认的负载因子大小为0.75。也就是说，当一个 Map 填满了75%的 bucket 时候，和其它集合类一样（如 ArrayList 等），将会创建原来 HashMap 大小的两倍的 bucket 数组来重新调整 Map 大小，并将原来的对象放入新的 bucket 数组中。这个过程叫作 rehashing。当调用 hash 方法找到新的 bucket 位置，这个值只可能在两个地方，一个是原下标的位置，另一种是在下标为 <原下标+原容量> 的位置。

PS:关于 HashMap面试问题，更多的可以参考 https://mp.weixin.qq.com/s/Ogu4WnxNP38PP3MB0aJjyg

源码分析

推荐文章：https://www.jianshu.com/p/f16bfeeeea88

搞明白 HaspMap 的原理就可以了。

ConcurrentHashMap

ConcurrentHashMap 是 Java 并发包中提供的一个线程安全且高效的 HashMap 实现，以弥补 HashMap 不适合在并发环境中操作使用的不足。

PS ：这个在集合中也算是比较突出的一个集合。

在 Java 中，HashMap 是非线程安全的，如果想在多线程下安全的操作 map，主要有以下解决方法：

第一种方法，使用Hashtable线程安全类；

第二种方法，使用Collections.synchronizedMap方法，对方法进行加同步锁；

第三种方法，使用并发包中的ConcurrentHashMap类；

ConcurrentHashMap 类所采用的正是分段锁的思想，将 HashMap 进行切割，把 HashMap 中的哈希数组切分成小数组，每个小数组有 n 个 HashEntry 组成，其中小数组继承自ReentrantLock（可重入锁），这个小数组名叫Segment

可参考文章：https://mp.weixin.qq.com/s/CH3gTbf55Cuabstfn2lpFg

PS：附上 Android 面试题 300 道面试题

PS：如有遗漏和其他理解欢迎补充。

如果感觉文章对您有帮助，可以关注我的公众号 SuperMaxs （如果有技术问题可以通过公众号加私人微信）。

个人Github 账号：https://github.com/spuermax

唯有学习才是大势所趋。

Java集合系列01之概览
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列02之ArrayList源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列07之HashMap源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列04之fail-fast机制分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列06之Map接口概览
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列03之LinkedList源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列05之Vector&Stack源码分析及List
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列08之WeakHashMap源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列09之TreeMap源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...
Java集合系列10之Hashtable源码分析
系列文章：Java集合系列01之概览Java集合系列02之ArrayList源码分析Java集合系列03之Link...