大数据流的在线Heavy Hitters算法:基于counter、基于sketch

参考:

  1. 大数据流的在线Heavy Hitters算法(上篇):基于计数器的方法
  2. 大数据流的在线Heavy Hitters算法(下篇):基于略图的方法
  3. 海量数据处理 - 10亿个数中找出最大的10000个数(top K问题)
  • Misra-Gries算法

  • Lossy Counting算法

  • Space Saving算法

  • Count-Min Sketch
    哈希表:数组;d个
    哈希桶:计数器(数组中的一个元素);w个

posted @ 2021-09-25 16:42  没有任何出路  阅读(362)  评论(0)    收藏  举报