随笔分类 - 【1001】Hive

Hive优化

摘要：Hive优化目标：①横向增加并发，②纵向较少依赖 Map的优化作业会通过input的目录产生一个或者多个map任务。set dfs.block.size(=128) 是不是每个map处理接近文件块的大小？如何合并小文件，减少map数 set mapred.max.split.size=1000 阅读全文

posted @ 2019-03-03 15:48 0x153_小波阅读(165) 评论(0) 推荐(0)

初始Hive

摘要：Hive 背景引入原因对存在HDFS上的文件或HBase中的表进行查询时，是要手工写一推MapReduce代码对于统计任务，只能由懂MapReduce的程序员才能搞定耗时耗力，更多精力没有有效的释放出来 Hive基于一个统一的查询分析层，通过SQL语句的方式对HDFS上的数据进行查询、统计和阅读全文

posted @ 2019-03-03 15:44 0x153_小波阅读(122) 评论(0) 推荐(0)

随笔分类 - 【1001】Hive

Hive优化

初始Hive

0x153_小波

公告

导航