会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
挪威森林猫
花有重开日 人无再少年
博客园
首页
新随笔
联系
订阅
管理
2020年5月24日
MapReduce 实现分片取TopN 再Reduce取TopN
摘要: ZX: 在Hadoop的map阶段 , 每个map任务都可以执行特殊的任务 , 当然 , 也包括取每个分片中最大的几个值. 然后汇总 , 再取TopN 这样的好处是 , 如果有2万个分片 , 2亿条数据 ,在Map完之后 假如是取Top10 , 那么经过Map阶段的Top10,最后只用处理2万X10
阅读全文
posted @ 2020-05-24 11:27 挪威森林猫Zzz
阅读(698)
评论(0)
推荐(0)
公告