剑指Offer--数据流中的中位数

题目描述:

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。

题目分析: 

对于数据流,对应的就是在线算法了,一道很经典的题目就是在1亿个数中找到最大的前100个数,这是一道堆应用题,找最大的前100个数,那么我们就创建一个大小为100的最小化堆,每来一个元素就与堆顶元素比较,因为堆顶元素是目前前100大数中的最小数,前来的元素如果比该元素大,那么就把原来的堆顶替换掉。
那么对于这一道题呢?如果单纯的把所有元素放到一个数组里,每次查找中位数最快也要O(n),综合下来是O(n^2)的复杂度。可以利用上面例子中的想法,用一个最大堆来维护当前前n/2小的元素,那么每次找中位数只到取出堆顶就可以了。但是,有一个问题,数据要动态增长,有可能之前被替换掉的元素随着元素的增加又跑回来了,所以不能单纯得向上题一样把元素丢掉,这里可以再用一个最小化堆来存前n/2大的元素。
 

C++实现:

 1 class Solution {
 2 private:
 3     vector<int> min; //数组中的后一半元素组成一个最小化堆
 4     vector<int> max; //数组中的前一半元素组成一个最大化堆
 5 
 6     public:
 7     void Insert(int num)
 8     {
 9         if(((min.size()+max.size()) & 1) == 0) {  //偶数数据的情况下,则在最小堆中插入元素
10                  if(max.size() > 0 && num < max[0]) {
11                      max.push_back(num);
12                      push_heap(max.begin(), max.end(), less<int>());
13                      num=max[0];
14                      pop_heap(max.begin(), max.end(), less<int>());
15                      max.pop_back();
16                  }
17                  min.push_back(num); //把前一半找到的最大值放到后一半中
18                  push_heap(min.begin(), min.end(), greater<int>());
19              } else {
20                 if(min.size() > 0 && num > min[0]) {   //奇数数据的情况下,则在最大堆中插入元素
21                      min.push_back(num);
22                      push_heap(min.begin(), min.end(), greater<int>());
23                      num=min[0];
24                      pop_heap(min.begin(), min.end(), greater<int>());
25                      min.pop_back(); 
26                  }
27                  max.push_back(num); //把后一半找到的最大值放到前一半中
28                  push_heap(max.begin(), max.end(), less<int>());
29              }
30         
31     }
32 
33     double GetMedian()
34     {
35         int size=min.size() + max.size();
36              if(size==0) return -1;
37              double median = 0;
38              if((size&1) != 0) {
39                  median = (double) min[0];
40              } else {
41                  median = (double) (max[0] + min[0]) / 2;
42              }
43         return median;
44     }
45 
46 };

 

posted @ 2019-02-14 10:55  kandid  阅读(346)  评论(0)    收藏  举报