会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
随笔分类 -
【1001】Hive
Hive优化
摘要:Hive优化 目标:①横向增加并发,②纵向较少依赖 Map的优化 作业会通过input的目录产生一个或者多个map任务。set dfs.block.size(=128) 是不是每个map处理接近文件块的大小? 如何合并小文件,减少map数 set mapred.max.split.size=1000
阅读全文
posted @
2019-03-03 15:48
0x153_小波
阅读(165)
评论(0)
推荐(0)
初始Hive
摘要:Hive 背景 引入原因 对存在HDFS上的文件或HBase中的表进行查询时,是要手工写一推MapReduce代码 对于统计任务,只能由懂MapReduce的程序员才能搞定 耗时耗力,更多精力没有有效的释放出来 Hive基于一个统一的查询分析层,通过SQL语句的方式对HDFS上的数据进行查询、统计和
阅读全文
posted @
2019-03-03 15:44
0x153_小波
阅读(122)
评论(0)
推荐(0)
0x153_小波
公告
导航
博客园
首页
新随笔
联系
订阅
管理