哈希表的基本概念与实现

作者: 曲谐_ | 来源:发表于2017-08-21 16:30 被阅读0次

Java数据结构_哈希表_基本概念
哈希表的基本概念与实现
Redis数据结构与对象——哈希
4.字典
通用数据结构
15_哈希表(Hash Table)
Java容器笔记（六）：HashMap源码简单分析
Redis中的字典
Hash Table基础
哈希表，字典，数组，链表

前面我们讲过，当我们查找的时候，最终的目的还是为了使得a[i] = key。那么当我们使用二分查找，插值查找或者二叉排序树查找的时候，我们只是利用表内有序，然后在表内利用规律不断地接近key值，那么这无形当中就增加了我们查找的开销。

本文代码已上传至本人Github : https://github.com/swordrada/HashTable，后文也会附上代码。

一、哈希表概述

哈希表，又称散列表。是利用关键字与地址的直接映射关系产生的列表。他的最大优势在于，一个关键字对应一个存储位置（理想情况下），而我们直接就可以由key值找到其在散列表中的位置，大大缩减了我们查找的时间。

思考：

这里的地址不是程序设计中的地址，而是我们把关键字存放的位置。比如我们可以将其存放在STL容器中，方便我们查找。
由于我们的关键字要尽量与通过函数关系计算出来的地址一一对应，那么要想快速查找到此地址，我们用的存储容器一定要支持随机访问，这样才能达到最快速度。在C++的程序设计中，建议使用支持随机访问的vector顺序容器。

哈希表查找步骤：

通过散列函数计算记录的散列地址。
按此散列地址存储该记录。

哈希表与树，图，线性表结构的区别：

后几种结构数据元素之间都有某种逻辑关系，而散列技术的记录之间不存在逻辑关系，它只与关键字有关。

由此我们可以得出结论：散列技术主要是面向查找的存储结构。

哈希表的构造方法

哈希表构造原则：1.计算简单，复杂算法将会影响查找上的优势 2.散列地址分布均匀，这样我们不需要过多的解决散列表冲突问题，提高效率。

构造具体方法：

由于是比较简单的哈希表，因此哈希函数我选择了简单的除留余数法f(key)=key mod p(p<=m)。
处理冲突的时候，我采用了开放定址法f(key) = (f(key)+di) mod m(di=1,2,3,4...m-1)。

具体代码：

//HashTable.h
#ifndef HASHTABLE_H_
#define HASHTABLE_H_
#include<vector>
#include<vector>
#include<string.h>
#include<string>
const int HASHSIZE = 20;
using std::vector;
class HashTable
{
private:
    vector<int>VecNode;
    int m;//哈希表表长
public:
    HashTable();
    ~HashTable();
    int Hash(int key);
    void Insert(int key);
    void Search(int key);
    void SearchFor(int key);
    //void Delete(int key);
};
#endif

//HashTable.cpp
#include<iostream>
#include"HashTable.h"
using std::cout;
using std::endl;
typedef vector<int>::iterator Iter;
HashTable::HashTable()
{
    m = HASHSIZE;
    for(int i=0;i<HASHSIZE;i++)
        VecNode.push_back(-1);
}
HashTable::~HashTable()
{
    for (int i=0;i<HASHSIZE;i++)
        VecNode.clear();
}
int HashTable::Hash(int key)
{
    return key % 19;
}
void HashTable::Insert(int key)//开放寻址法
{
    int addr = Hash(key);//散列表计算出地址
    while(VecNode[addr] != -1)//判断如果此时值不为-1，说明冲突
        addr = (addr + 1) % HASHSIZE;
    VecNode[addr] = key;
}
void HashTable::Search(int key)
{
    int addr = Hash(key);
    while(VecNode[addr] != key && VecNode[addr] != -1)
        addr = (addr + 1) % HASHSIZE;
    if(VecNode[addr] == -1)//有可能查的值还没有计入哈希表.结果是-1表示查找失败，表中无此值。
        return;
}
void HashTable::SearchFor(int key)
{
    int i;
    for (i=0;i<HASHSIZE;i++)
    {
        if(VecNode[i] == key)
            break;
    }
}

#include<Windows.h>
#include<iostream>
#include"HashTable.h"
using std::cout;
using std::endl;
int main()
{
    HashTable h1;
    int a,b;
    for(int i=0;i<HASHSIZE;i++)
        h1.Insert(i);
    for(int i=0;i<HASHSIZE;i++)
        h1.Search(i);
    for(int i=0;i<HASHSIZE;i++)
        h1.SearchFor(i);
    return 0;
}

注：引入Windows.h头文件本来是想做一个性能测试比较的，无奈没接触过Windows API。。模仿着写了下没写出来，可忽略。