摘要: Hive优化:MR阶段优化– 调整task数目 Hive优化:MR阶段优化– Reduce阶段 mapreduce.job.reduces直接设置num_reduce_tasks⼤⼩影响参数• hive.exec.reducers.max 默认:1099• hive.exec.reducers.by 阅读全文
posted @ 2017-06-15 16:28 Super_Orco 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 一、基础DDL练习 二、基础DML语句 三、复杂数据类型 四、数据模型-分区 为减少不必要的暴力数据扫描,可以对表进行分区,为避免产生过多小文件,建议只对离散字段进行分区 六、外部表 external关键字,删除表时,外部表只删除元数据,不删除数据,更加安全 七、列式存储 在Create/Alter 阅读全文
posted @ 2017-06-15 15:07 Super_Orco 阅读(1373) 评论(0) 推荐(0) 编辑