会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
songguojun
博客园
首页
新随笔
联系
订阅
管理
2018年7月20日
海量数据TOPK算法和TOPN算法
摘要: TOPK算法 TOPK问题是非常经典的处理海量数据的问题。TOPK问题就是给出一堆数,在里面找出最大、最常出现的等一系列问题。 通常情况下,数量级都是千万级别的,数据量特别大,而且内存使用是有限制的,所以肯定不能先排序,然后再遍历取出K个数。 堆排序做TopK算法有如下几个特点: 1、不会改变数据的
阅读全文
posted @ 2018-07-20 14:03 songguojun
阅读(3543)
评论(0)
推荐(0)
公告