python中的堆

在Python中,堆(Heap)是一种特殊的完全二叉树结构,满足以下特性:

  • 最大堆(Max Heap):父节点的值大于或等于子节点的值。
  • 最小堆(Min Heap):父节点的值小于或等于子节点的值。

Python标准库 heapq 提供了一个 最小堆 的实现,虽然没有直接提供最大堆的实现,但是可以通过一些技巧实现最大堆。

1. heapq 模块

heapq 是 Python 提供的堆相关操作的模块,它实现了一个最小堆。主要提供以下几个操作:

  • heapq.heappush(heap, item):将元素 item 添加到堆 heap 中。
  • heapq.heappop(heap):弹出堆中最小的元素并返回。
  • heapq.heapify(iterable):将可迭代对象 iterable 转换为堆。
  • heapq.heappushpop(heap, item):将元素 item 添加到堆中,并弹出最小元素。
  • heapq.heapreplace(heap, item):弹出堆中最小的元素并将元素 item 加入堆中。

2. 例子:最小堆操作

import heapq

# 初始化堆
heap = []

# 插入元素
heapq.heappush(heap, 10)
heapq.heappush(heap, 20)
heapq.heappush(heap, 15)

# 弹出最小元素
print(heapq.heappop(heap))  # 10

# 查看堆的最小元素但不弹出
print(heap[0])  # 15

3. 例子:最大堆的实现(通过取负值)

Python的 heapq 默认是最小堆,但可以通过取负数来模拟最大堆:

import heapq

# 初始化最大堆
max_heap = []

# 插入元素,取负值
heapq.heappush(max_heap, -10)
heapq.heappush(max_heap, -20)
heapq.heappush(max_heap, -15)

# 弹出最大元素(实际上弹出的是最小负数,恢复负值后就是最大数)
print(-heapq.heappop(max_heap))  # 20

4. 堆排序

堆排序是通过堆来进行排序的,主要过程是先将数组转换为堆,再将堆顶元素弹出并将堆重新调整,直到所有元素都排好。

import heapq

arr = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]

# 堆排序,首先将数组转为堆
heapq.heapify(arr)

# 然后弹出堆顶元素,逐一得到排序后的结果
sorted_arr = [heapq.heappop(arr) for _ in range(len(arr))]

print(sorted_arr)  # [1, 1, 2, 3, 3, 4, 5, 5, 5, 6, 9]

5. 常见算法题中的堆应用

5.1 寻找第K大的元素

给定一个无序的数组,找到第 K 大的元素。我们可以使用最小堆来解决这个问题。

import heapq

def findKthLargest(nums, k):
    # 构建一个包含前k个元素的最小堆
    heap = nums[:k]
    heapq.heapify(heap)
    
    # 遍历剩余元素
    for num in nums[k:]:
        # 如果当前元素大于堆顶元素(最小的元素)
        if num > heap[0]:
            heapq.heappushpop(heap, num)
    
    # 堆顶元素就是第K大的元素
    return heap[0]

5.2 合并K个排序链表

假设有多个已经排序的链表,合并它们。我们可以使用最小堆来解决这个问题。

import heapq

class ListNode:
    def __init__(self, val=0, next=None):
        self.val = val
        self.next = next
        
    def __lt__(self, other):
        return self.val < other.val

def mergeKLists(lists):
    heap = []
    # 初始化堆,将所有链表的头节点加入堆
    for l in lists:
        if l:
            heapq.heappush(heap, l)
    
    # 创建一个新的虚拟头节点
    dummy = ListNode()
    cur = dummy

    # 合并链表
    while heap:
        node = heapq.heappop(heap)
        cur.next = node
        cur = cur.next
        if node.next:
            heapq.heappush(heap, node.next)

    return dummy.next

5.3 查找前K个频繁元素

给定一个字符串,要求返回出现频率前K高的字符。

import heapq
from collections import Counter

def topKFrequent(nums, k):
    # 统计频率
    count = Counter(nums)
    
    # 使用最小堆存储频率和对应的元素
    heap = []
    
    for key, value in count.items():
        heapq.heappush(heap, (value, key))
        if len(heap) > k:
            heapq.heappop(heap)
    
    # 返回结果
    return [item[1] for item in heap]

6. 总结

  • Python 的 heapq 默认实现最小堆。
  • 可以通过插入负数来模拟最大堆。
  • 堆广泛应用于以下类型的问题:
    • 找到第 K 大/小的元素。
    • 合并多个排序序列。
    • 频率统计问题。

使用堆时可以通过适当的操作(如 heapq.heappushheapq.heappop)来高效地管理和访问数据结构中的最小或最大元素。

posted @ 2025-01-08 20:35  清澈的澈  阅读(218)  评论(0)    收藏  举报