会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
黎明踏浪
博客园
首页
新随笔
联系
订阅
管理
2018年2月5日
基于HBase的MapReduce实现大量邮件信息统计分析
摘要: 一:概述 在大多数情况下,如果使用MapReduce进行batch处理,文件一般是存储在HDFS上的,但这里有个很重要的场景不能忽视,那就是对于大量的小文件的处理(此处小文件没有确切的定义,一般指文件大小比较小,比如5M以内的文件),而HDFS的文件块一般是64M,这将会影响到HDFS的性能,因为小
阅读全文
posted @ 2018-02-05 17:05 黎明踏浪号
阅读(1013)
评论(0)
推荐(0)
公告