摘要:
HIVE分区,实际上是通过一个路径来标识的,而不是在物理数据中。比如每天的数据,可能分区是pt=20121023这样,那么路径中它就会变成:/hdfs/path/pt=20121023/data_files。通过... 阅读全文
posted @ 2016-11-17 14:37
cn_wk
阅读(161)
评论(0)
推荐(0)
摘要:
Hive的TRANSFORM关键字提供了在SQL中调用自写脚本的功能,适合实现Hive中没有的功能又不想写UDF的情况。例如,按日期统计每天出现的uid数,通常用如下的SQLSELECT date, count(... 阅读全文
posted @ 2016-11-17 10:01
cn_wk
阅读(78)
评论(0)
推荐(0)

浙公网安备 33010602011771号