文章分类 -  HIve

摘要:1.order by,sort by,distribute by,cluster by的区别? 答: (1)order by: order by会对所给的全部数据进行全局排序,并且,不管有多少数据,都只启动一个reducer来处理。 注意:如果指定了hive.mapred.mode=strict(默 阅读全文
posted @ 2019-08-22 12:06 小码农成长记 阅读(756) 评论(0) 推荐(0)
摘要:1.Hive导出数据有几种方式?如何导出数据 答:主要有4种方式。 (1)insert方式: ​ 1)将查询的结果(格式化)导出到本地: ​ 2)将查询的结果导出到HDFS上: (2)Hadoop命令导出到本地 (3)Hive Shell 命令导出 (4)export导出到HDFS上 2.将一个表的 阅读全文
posted @ 2019-08-14 12:06 小码农成长记 阅读(196) 评论(0) 推荐(0)
摘要:1.简述Hive工作原理 答: 流程步骤为: 用户提交查询等任务给Driver。 编译器获得该用户的任务Plan。 编译器Compiler根据用户任务去MetaStore中获取需要的Hive的元数据信息。 编译器Compiler得到元数据信息,对任务进行编译,先将HiveQL转换为抽象语法树,然后将 阅读全文
posted @ 2019-08-14 11:58 小码农成长记 阅读(267) 评论(0) 推荐(0)