美文网首页
【恋上数据结构与算法二】(十)跳表(Skip List)

【恋上数据结构与算法二】(十)跳表(Skip List)

作者: AlanGe | 来源:发表于2021-05-01 01:00 被阅读0次

思考

◼ 一个有序链表搜索、添加、删除的平均时间复杂度是多少?
O(n)

◼能否利用二分搜索优化有序链表,将搜索、添加、删除的平均时间复杂度降低至 O(logn)?
链表没有像数组那样的高效随机访问(O(1) 时间复杂度),所以不能像有序数组那样直接进行二分搜索优化

◼那有没有其他办法让有序链表搜索、添加、删除的平均时间复杂度降低至 O(logn)?
使用跳表(SkipList)

跳表(SkipList)

◼ 跳表,又叫做跳跃表、跳跃列表,在有序链表的基础上增加了“跳跃”的功能
由William Pugh于1990年发布,设计的初衷是为了取代平衡树(比如红黑树)

◼Redis中 的 SortedSet、LevelDB 中的 MemTable 都用到了跳表
Redis、LevelDB 都是著名的 Key-Value 数据库

◼ 对比平衡树
跳表的实现和维护会更加简单
跳表的搜索、删除、添加的平均时间复杂度是 O(logn)

使用跳表优化链表(图片来源于网络)

跳表的搜索

1.从顶层链表的首元素开始,从左往右搜索,直至找到一个大于或等于目标的元素,或者到达当前层链表的尾部

2.如果该元素等于目标元素,则表明该元素已被找到

3.如果该元素大于目标元素或已到达链表的尾部,则退回到当前层的前一个元素,然后转入下一层进行搜索

跳表的添加、删除

◼ 添加的细节
随机决定新添加元素的层数

◼ 删除的细节
删除一个元素后,整个跳表的层数可能会降低

跳表的层数

◼ 跳表是按层构造的,底层是一个普通的有序链表,高层相当于是低层的“快速通道”
在第 i 层中的元素按某个固定的概率 p(通常为 1⁄2 或 1⁄4 )出现在第 i + 1层中,产生越高的层数,概率越低
✓元素层数恰好等于 1 的概率为 1 – p
✓元素层数大于等于 2 的概率为 p,而元素层数恰好等于 2 的概率为 p * (1 – p)
✓元素层数大于等于 3 的概率为 p^2,而元素层数恰好等于 3 的概率为 p^2 * (1 – p)
✓元素层数大于等于 4 的概率为 p^3,而元素层数恰好等于 4 的概率为 p^3 * (1 – p)
✓ ......
✓一个元素的平均层数是 1 / (1 – p)

◼当 p = 1⁄2 时,每个元素所包含的平均指针数量是 2 ◼当 p = 1⁄4 时,每个元素所包含的平均指针数量是 1.33

跳表的复杂度分析

◼ 每一层的元素数量
第 1 层链表固定有 n 个元素
第 2 层链表平均有 n * p 个元素
第 3 层链表平均有 n * p2 个元素
第 k 层链表平均有 n * pk 个元素
...

◼另外
最高层的层数是 log1/pn,平均有个 1/p 元素
在搜索时,每一层链表的预期查找步数最多是 1/p,所以总的查找步数是 –(logpn/p),时间复杂度是 O(logn)

package alangeit;

// 跳表(Skip List)

import java.util.Comparator;

@SuppressWarnings("unchecked")
public class SkipList<K, V> {
    
    private static final int MAX_LEVEL = 32;// 最高层数
    private static final double P = 0.25;
    private int size;
    private Comparator<K> comparator;       // 比较器
    private int level;                      // 有效层数
    private Node<K, V> first;               // 首节点,不存放任何K-V

    public SkipList(Comparator<K> comparator) {
        this.comparator = comparator;
        first = new Node<>(null, null, MAX_LEVEL);
    }
    
    public SkipList() {
        this(null);
    }
    
    public int size() {
        return size;
    }
    
    public boolean isEmpty() {
        return size == 0;
    }
    
    // 搜索
    public V get(K key) {
        keyCheck(key);

        Node<K, V> node = first;
        for (int i = level - 1; i >= 0; i--) {
            int cmp = -1;
            while (node.nexts[i] != null 
                    && (cmp = compare(key, node.nexts[i].key)) > 0) {
                node = node.nexts[i];
            }

            // node.nexts[i].key >= key
            if (cmp == 0) return node.nexts[i].value;
        }
        return null;
    }
    
    // 添加
    public V put(K key, V value) {
        keyCheck(key);
        
        Node<K, V> node = first;
        Node<K, V>[] prevs = new Node[level];// 保存前驱
        for (int i = level - 1; i >= 0; i--) {
            int cmp = -1;
            while (node.nexts[i] != null 
                    && (cmp = compare(key, node.nexts[i].key)) > 0) {
                node = node.nexts[i];
            }
            if (cmp == 0) { // 节点是存在的
                V oldV = node.nexts[i].value;
                node.nexts[i].value = value;
                return oldV;
            }
            prevs[i] = node;// 保存前驱
        }
        
        // 新节点的层数
        int newLevel = randomLevel();
        // 添加新节点
        Node<K, V> newNode = new Node<>(key, value, newLevel);
        
        // 设置前驱和后继
        for (int i = 0; i < newLevel; i++) {// i:第几层
            if (i >= level) {
                first.nexts[i] = newNode;// 头节点的后继指向新节点
            } else {
                newNode.nexts[i] = prevs[i].nexts[i];// 设置后继
                prevs[i].nexts[i] = newNode;// 设置前驱的后继为新加的节点
            }
        }
        
        // 节点数量增加
        size++;
        
        // 计算跳表的最终层数
        level = Math.max(level, newLevel);
        
        return null;
    }
    
    // 删除
    public V remove(K key) {
        keyCheck(key);
        
        Node<K, V> node = first;
        Node<K, V>[] prevs = new Node[level];// 保存前驱
        boolean exist = false;
        for (int i = level - 1; i >= 0; i--) {
            int cmp = -1;
            while (node.nexts[i] != null 
                    && (cmp = compare(key, node.nexts[i].key)) > 0) {
                node = node.nexts[i];
            }
            prevs[i] = node;
            if (cmp == 0) exist = true;// 要删除的节点是否存在
        }
        
        if (!exist) return null;
        
        // 需要被删除的节点
        Node<K, V> removedNode = node.nexts[0];
        
        // 数量减少
        size--;
        
        // 设置后继
        for (int i = 0; i < removedNode.nexts.length; i++) {
            prevs[i].nexts[i] = removedNode.nexts[i];
        }
        
        // 更新跳表的层数
        int newLevel = level;
        while (--newLevel >= 0 && first.nexts[newLevel] == null) {
            level = newLevel;
        }
        
        return removedNode.value;
    }
    
    private int randomLevel() {
        int level = 1;
        while (Math.random() < P && level < MAX_LEVEL) {
            level++;
        }
        return level;
    }
    
    private void keyCheck(K key) {
        if (key == null) {
            throw new IllegalArgumentException("key must not be null.");
        }
    }
    
    private int compare(K k1, K k2) {
        return comparator != null 
                ? comparator.compare(k1, k2)
                : ((Comparable<K>)k1).compareTo(k2);
    }
    
    private static class Node<K, V> {
        K key;
        V value;
        Node<K, V>[] nexts;

        public Node(K key, V value, int level) {
            this.key = key;
            this.value = value;
            nexts = new Node[level];
        }
        @Override
        public String toString() {
            return key + ":" + value + "_" + nexts.length;
        }
    }
    
    @Override
    public String toString() {
        StringBuilder sb = new StringBuilder();
        sb.append("一共" + level + "层").append("\n");
        for (int i = level - 1; i >= 0; i--) {
            Node<K, V> node = first;
            while (node.nexts[i] != null) {
                sb.append(node.nexts[i]);
                sb.append(" ");
                node = node.nexts[i];
            }
            sb.append("\n");
        }
        return sb.toString();
    }
}

相关文章

  • 【恋上数据结构与算法二】(十)跳表(Skip List)

    思考 ◼ 一个有序链表搜索、添加、删除的平均时间复杂度是多少?O(n) ◼能否利用二分搜索优化有序链表,将搜索、添...

  • 数据结构中的跳表

    跳表的定义: 跳表(Skip List)是由 William Pugh 发明的一种查找数据结构,支持对数据的快速查...

  • skip list(跳表)

    第一次看到这种数据结构还是刚接触ocean base架构的时候。粗略扫了几眼,以为是一个简单的二级索引,没有仔细考...

  • 跳表(skip list)

    跳表是通过链表来存储有序数组,查找、插入、删除数据非常高效。代码如下(kotlin编写): 查找时间复杂度:O(l...

  • 跳表(skip list)

    我们知道二叉搜索算法能够高效的查询数据,但是需要一块连续的内存,而且增删改效率很低。跳表,是基于链表实现的一种类似...

  • 9 跳表

    实际上,我们只需要对链表稍加改造,就可以支持类似“二分”的查找算法。我们把改造之后的数据结构叫作跳表(Skip l...

  • 每个程序员都应该掌握的数据结构 – Skip List

    Skip List 这种数据结构翻译成中文,大家一般叫它跳表,非常直译,其实我接触这种数据结构比较早,但是看很多技...

  • 跳表(skip list)java实现

    跳表(skip list)java实现 WiKi 【转载】http://blog.csdn.net/brillia...

  • 跳跃表

    Skip List定义 Skip List 完整实现 下面是跳表的基本操作 节点的创建 列表的初始化列表的初始化需...

  • skipList

    Skip List--跳表(全网最详细的跳表文章没有之一)https://www.jianshu.com/p/9d...

网友评论

      本文标题:【恋上数据结构与算法二】(十)跳表(Skip List)

      本文链接:https://www.haomeiwen.com/subject/taxnrltx.html