【学习笔记】BFPRT 算法

c++ nth_element 函数负责求出(不需要有序的)数组中第 n 大的元素。下面是一个实现这个任务的确定性算法。介绍是 deepseek 写的。

BFPRT (Median of Medians) Algorithm

  1. 分组: 将数组划分为若干组,每组包含5个元素(最终一组可能不满5个)。
  2. 中位排序: 对每组进行排序,并选出组内的中位数。
  3. 找到中位数: 将所有组的中位数组合成新数组,通过应用BFPRT算法找到该数组的中位数,作为基准值 (pivot)。
  4. 划分数组: 用基准值将数组划分为两部分,等于、大于基准值的部分。
  5. 递归选择: 根据中位数的位置,决定在左半部分或右半部分递归查找。

时间复杂度分析

  • 分组和中位排序: 每组5个元素排序时的时间复杂度为O(1),总时间为O(n)。

  • 找到中位数: 新数组规模为n/5,适用时间为T(n/5)。

  • 划分后选择: 通过Median of Medians保证每次划分的规模至少多于7n/10,适用时间为T(7n/10)。

    注:最少有 \(\frac 12 \times \frac 35 n\) 个数字大于 median of medians。因为有 \(\frac 12 \times \frac n5\) 组的 median 大于 median of medians,这些组里面第 1 2 大的数字大于组里面的 median。

  • 总时间复杂度: T(n) = T(n/5) + T(7n/10) + O(n),最终时间复杂度为O(n)

    注:这里应该对 n 归纳即可证明 \(\exists \text{常数} k,s.t.T(n) \le k n\)


关键特点

  • 确定性: 不依赖随机选择,每一步操作固定。
  • 线性时间: 最坏情况下仍然是O(n),通过保证每次划分问题规模最小化,从而缩小了递归深度。
posted @ 2025-02-06 17:12  没学完四大礼包不改名  阅读(74)  评论(2)    收藏  举报