算法与数据结构知识汇总（四、哈希表）

作者: NoBugException | 来源:发表于2021-08-28 21:41 被阅读0次

算法与数据结构知识汇总（四、哈希表）
「Redis源码解读」—数据结构（二）哈希表
hash-table基础以及一些运用例子
刷穿剑指offer-Day14-哈希表I 基础知识整理
MySQL索引简述--哈希索引
九、哈希表
数据结构和算法
14 基本查找算法概述
数据结构与算法-哈希表
我的Android知识体系

1、对比

数组(顺序表)：寻址容易
链表：插入与删除容易
哈希表：寻址容易，插入删除也容易的数据结构

2、哈希表的概念

哈希表（Hash table，也叫散列表）
是根据关键码值(Key value)而直接进行访问的数据结构，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。
关键码值(Key value)也可以当成是key的hash值， 这个映射函数叫做散列函数
存放记录的数组叫做散列表

3、哈希表的举例

定义一个数组：{14, 19, 5, 7, 21, 1, 13, 0, 18}
定义一个散列表：假设数组初始大小为13，所以定义一个大小为13 的数组 a[13];
定义一个散列函数: f(x) = x mod 13;  ==> x为数组中的值，f(x) 求出数组的角标。

那么开始计算：

  f(14) = 14 % 13 = 1，14存储在a[1]中；
  f(19) = 19 % 13 = 6，19存储在a[6]中；
  f(5) = 5 % 13 = 5，5存储在a[5]中；
  f(7) = 7 % 13 = 7，7存储到a[7]中；
  f(21) = 21 % 13 = 8，21存储到a[8]中；
  f(1) = 1 % 13 = 1，1存储在a[1]中，此时发生了冲突（碰撞），因为a[1]中已经存储了数据，我们采用n+1的方式来解决碰撞问题，n + 1 = 2，所以将1存储在a[2]中；
  f(13) = 13 % 13 = 0，13存储在a[0]中；
  f(0) = 0 % 13 = 0，此时发生了冲突（碰撞），因为a[0]中已经存储了数据，我们采用n+1的方式来解决碰撞问题，由于a[1]、a[2]都存储了数据，直到找到a[3]，a[3]中没有数据，所以将0存储到a[3]中；
  f(18) = 18 % 13 = 5，此时a[5]、a[6]、a[7]、a[8]都存储了值，角标5、6、7、8都会发生冲突（碰撞），所以将5存储到a[9]中；

最终的数组为：

角标   0    1    2    3    4    5    6    7    8    9   10   11   12
    ——————————————————————————————————————————————————————————————————
    | 13 | 14 |  1 |  0 |    |  5 | 19 |  7 | 21 | 18 |    |    |    |
    ——————————————————————————————————————————————————————————————————

4、哈希表在Java中的体现

（1）HashTable

底层数组+链表实现，无论key还是value都不能为null，线程安全，实现线程安全的方式是在修改数据时锁住整个HashTable，效率低，ConcurrentHashMap做了相关优化
初始size为11，扩容：newsize = olesize*2+1
计算index的方法：index = (hash & 0x7FFFFFFF) % tab.length

（2）HashMap

底层数组+链表实现，可以存储null键和null值，线程不安全
初始size为16，扩容：newsize = oldsize*2，size一定为2的n次幂
扩容针对整个Map，每次扩容时，原来数组中的元素依次重新计算存放位置，并重新插入
插入元素后才判断该不该扩容，有可能无效扩容（插入后如果扩容，如果没有再次插入，就会产生无效扩容）
当Map中元素总数超过Entry数组的75%，触发扩容操作，为了减少链表长度，元素分配更均匀
计算index方法：index = hash & (tab.length – 1)

（3）ConcurrentHashMap

底层采用分段的数组+链表实现，线程安全
通过把整个Map分为N个Segment，可以提供相同的线程安全，但是效率提升N倍，默认提升16倍。(读操作不加锁，由于HashEntry的value变量是 volatile的，也能保证读取到最新的值。)
Hashtable的synchronized是针对整张Hash表的，即每次锁住整张表让线程独占，ConcurrentHashMap允许多个修改操作并发进行，其关键在于使用了锁分离技术
有些方法需要跨段，比如size()和containsValue()，它们可能需要锁定整个表而而不仅仅是某个段，这需要按顺序锁定所有段，操作完毕后，又按顺序释放所有段的锁
扩容：段内扩容（段内元素超过该段对应Entry数组长度的75%触发扩容，不会对整个Map进行扩容），插入前检测需不需要扩容，有效避免无效扩容

ConcurrentHashMap是使用了锁分段技术来保证线程安全的。

锁分段技术：首先将数据分成一段一段的存储，然后给每一段数据配一把锁，
当一个线程占用锁访问其中一个段数据的时候，其他段的数据也能被其他线程访问。 

ConcurrentHashMap提供了与Hashtable和SynchronizedMap不同的锁机制。Hashtable中采用的锁机制是一次锁住整个hash表，
从而在同一时刻只能由一个线程对其进行操作；而ConcurrentHashMap中则是一次锁住一个桶。

ConcurrentHashMap默认将hash表分为16个桶，诸如get、put、remove等常用操作只锁住当前需要用到的桶。
这样，原来只能一个线程进入，现在却能同时有16个写线程执行，并发性能的提升是显而易见的。


HashTable已被弃用；
如果要保证线程安全，则使用ConcurrentHashMap；
如果不需要保证线程安全，则使用HashMap；

HashMap的效率比ConcurrentHashMap高的多，实际上，需要考虑安全性的场景并不是很多，所以HashMap常被使用。

5、jdk 1.8前后区别

哈希表整体的设计采用拉链法。
jdk 1.8之前：哈希表 = 数组 + 链表
jdk 1.8开始：哈希表 = 数组 + 链表，当链表超过阈值，就会转换成红黑树，这时：哈希表 = 数组 + 链表 + 红黑树

[本章完...]

网友评论

本文标题：算法与数据结构知识汇总（四、哈希表）

本文链接：https://www.haomeiwen.com/subject/juybiltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

算法与数据结构知识汇总（四、哈希表）

1、对比

2、哈希表的概念

3、哈希表的举例

4、哈希表在Java中的体现

5、jdk 1.8前后区别

相关文章

算法与数据结构知识汇总（四、哈希表）

「Redis源码解读」—数据结构（二）哈希表

hash-table基础以及一些运用例子

刷穿剑指offer-Day14-哈希表I 基础知识整理

MySQL索引简述--哈希索引

九、哈希表

数据结构和算法

14 基本查找算法概述

数据结构与算法-哈希表

我的Android知识体系

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读