2023年8月10日

hive 的order by ,sort by,distribute by,cluster by

摘要: order by order by会对输入做全局排序,因此只有一个Reducer(多个Reducer无法保证全局有序),然而只有一个Reducer,会导致当输入规模较大时,消耗较长的计算时间,在生产环境中遇到数据量较大的情况,一般无法成功。 sort by sort by不是全局排序,其在数据进入r 阅读全文

posted @ 2023-08-10 21:48 ExplorerMan 阅读(64) 评论(0) 推荐(0)

大数据-hive 添加分区

摘要: 1、静态分区1> 添加一个alter table t2 add partition (city=‘shanghai’);2> 添加多个alter table t2 add partition (city=‘chengdu’) partition(city=‘tianjin’);3> 添加分区指定位置 阅读全文

posted @ 2023-08-10 21:11 ExplorerMan 阅读(2587) 评论(0) 推荐(0)

导航