【学习笔记】BFPRT 算法
c++ nth_element 函数负责求出(不需要有序的)数组中第 n 大的元素。下面是一个实现这个任务的确定性算法。介绍是 deepseek 写的。
BFPRT (Median of Medians) Algorithm
- 分组: 将数组划分为若干组,每组包含5个元素(最终一组可能不满5个)。
- 中位排序: 对每组进行排序,并选出组内的中位数。
- 找到中位数: 将所有组的中位数组合成新数组,通过应用BFPRT算法找到该数组的中位数,作为基准值 (pivot)。
- 划分数组: 用基准值将数组划分为两部分,等于、大于基准值的部分。
- 递归选择: 根据中位数的位置,决定在左半部分或右半部分递归查找。
时间复杂度分析
-
分组和中位排序: 每组5个元素排序时的时间复杂度为O(1),总时间为O(n)。
-
找到中位数: 新数组规模为n/5,适用时间为T(n/5)。
-
划分后选择: 通过Median of Medians保证每次划分的规模至少多于7n/10,适用时间为T(7n/10)。
注:最少有 \(\frac 12 \times \frac 35 n\) 个数字大于 median of medians。因为有 \(\frac 12 \times \frac n5\) 组的 median 大于 median of medians,这些组里面第 1 2 大的数字大于组里面的 median。
-
总时间复杂度: T(n) = T(n/5) + T(7n/10) + O(n),最终时间复杂度为O(n)
注:这里应该对 n 归纳即可证明 \(\exists \text{常数} k,s.t.T(n) \le k n\)
关键特点
- 确定性: 不依赖随机选择,每一步操作固定。
- 线性时间: 最坏情况下仍然是O(n),通过保证每次划分问题规模最小化,从而缩小了递归深度。