摘要: 其实就是from表时,可以插入到多个表。 sql语句的模板如下:from historyinsert overwrite sales select * where actino='purchased'inesrt overwrite credits select * where action = '... 阅读全文
posted @ 2015-12-17 17:14 HarkLee 阅读(498) 评论(0) 推荐(0)
摘要: 将set hive.limit.optimize.enable=true 时,limit限制数据时就不会全盘扫,而是根据限制的数量进行抽样。同时还有两个配置项需要注意:1、hive.limit.row.max.size 我理解这个是控制最大的抽样数量2、 hive.limit.optimize.l... 阅读全文
posted @ 2015-12-17 17:12 HarkLee 阅读(2348) 评论(0) 推荐(0)
摘要: 可以通过修改set hive.exec.parallel=true来修改并行度。如果job中并行执行的阶段增多,那么集群利用率会增加。 阅读全文
posted @ 2015-12-17 17:04 HarkLee 阅读(2000) 评论(0) 推荐(1)