美文网首页
Python高级数据结构——堆

Python高级数据结构——堆

作者: Jonah_Peng | 来源:发表于2022-05-30 20:10 被阅读0次

    概念

    在一个 最小堆 (min heap) 中,如果 P 是 C 的一个父级节点,那么 P 的 key(或 value) 应小于或等于 C 的对应值。 正因为此,堆顶元素一定是最小的,我们会利用这个特点求最小值或者第 k 小的值。

    在一个 最大堆 (max heap) 中,P 的 key(或 value) 大于或等于 C 的对应值。

    接口函数

    以python为例,说明堆的几个常见操作,这里需要用到一个内置的包:heapq

    初始化 Heapify

    python中使用堆是通过传入一个数组,然后调用一个函数,在原地让传入的数据具备堆的特性

    import heapq
    raw = [3, 1, 5]
    heapq.heapify(raw)
    
    print(heapq.heappop(raw))
    # output: 1
    

    需要注意的是,heapify默认构造的是小顶堆(min heap),如果要构造大顶堆,思路是把所有的数值倒转,既* -1,例如:

    import heapq
    raw = [3, 1, 5]
    reverse_raw = [-val for val in raw]
    heapq.heapify(reverse_raw)
    
    min_val = print(-heapq.heappop(reverse_raw))
    # output: -5
    

    弹出最大/最小值

    使用heapq提供的函数:heappop来实现

    具体使用方式参考 初始化Heapify

    push数据

    使用heapq提供的函数:heappush来实现

    import heapq
    raw = [3, 1, 5]
    heapq.heapify(raw)
    
    # 这个时候raw还维持着最小栈的特性
    heapq.heappush(raw, 11)
    
    print(heapq.heappop(raw))
    # output: 1
    
    heapq.heappush(raw, -1)
    print(heapq.heappop(raw))
    # output: -1
    

    同时heapq还提供另外一个函数:heappushpop,能够在一个函数实现push&pop两个操作;顺序是:先push再pop

    根据官方文档的描述,这个函数会比先在外围先调用heappush,再调用heappop,效率更高

    import heapq
    raw = [3, 1, 5]
    heapq.heapify(raw)
    
    print(heapq.heappushpop(raw, -1))
    # output: -1
    

    heapreplace

    先pop数据再push数据,和heappushpop的顺序是反着的;同样的,这样调用的性能也会比先调用heappop再调用heappush更好

    import heapq
    raw = [3, 1, 5]
    heapq.heapify(raw)
    
    print(heapq.heapreplace(raw, -1))
    # output: 1
    

    如果pop的时候队列是空的,会抛出一个异常

    import heapq
    raw = []
    heapq.heapify(raw)
    
    print(heapq.heapreplace(raw, -1))
    # exception: IndexError: index out of range
    

    Merge两个数组

    可以通过heapq.merge将多个已排序的输入合并为一个已排序的输出,这个本质上不是堆;其实就是用两个指针迭代

    import heapq
    raw = [1, 3, 5]
    raw1 = [2, 9, 10]
    
    print([i for i in heapq.merge(raw, raw1)])
    

    对于这个问题,有一个算法题可以实现相同的功能

    from typing import List
    
    def merge(nums1: List[int], nums2: List[int]) -> List[int]:
        result = []
        i, j = 0, 0
        while i < len(nums1) and j < len(nums2):
            if nums1[i] < nums2[j]:
                result.append(nums1[i])
                i += 1
            else:
                result.append(nums2[j])
                j += 1
    
        for i1 in range(i, len(nums1)):
            result.append(nums1[i1])
    
        for j1 in range(j, len(nums2)):
            result.append(nums2[j1])
    
        return result
    
    print(merge([1, 4, 9], [2, 11, 14, 199]))
    print(merge([], [2, 11, 14, 199]))
    print(merge([1, 4, 9], []))
    print(merge([1, 4, 9], [133]))
    print(merge([1, 4, 9], [2]))
    print(merge([1, 4, 9], [-1]))
    

    前n个最大/小的数

    iterable 所定义的数据集中返回前 n个最大/小元素组成的列表。

    函数为:heapq.nlargest() | heapq.nsmallest()

    import heapq
    print(heapq.nlargest(2, [3, 1, 5]))
    # output: [5,3]
    
    print(heapq.nsmallest(2, [3,1,5]))
    # output: [1,3]
    

    应用

    堆排序

    from heapq import heappush, heappop
    
    def heapsort(iterable):
        h = []
        for value in iterable:
            heappush(h, value)
        return [heappop(h) for i in range(len(h))]
    
    print(heapsort([3, 1, 5]))
    

    参考

    heapq - Heap queue algorithm - Python 3.10.4 documentation

    相关文章

      网友评论

          本文标题:Python高级数据结构——堆

          本文链接:https://www.haomeiwen.com/subject/uqfaprtx.html