随笔分类 -  【大数据 | Hive】

摘要:问题 hive执行sql提交到yarn上的任务名字是被处理过的,通常只能显示sql的前边一段和最后几个字符,这样就会带来一些问题: 1)相近时间提交了几个相近的sql,相互之间无法区分; 2)一个任务有问题,想看下这个任务具体执行的是什么?是谁的任务? 解决办法 通过以下方法可以查看: 1)如果任务 阅读全文
posted @ 2021-02-08 09:30 Simon92 阅读(1311) 评论(0) 推荐(0)
摘要:1、-- 导入数据 create table orders ( order_id string, user_id string, eval_set string, order_number string, order_dow string, order_hour_of_day string, day 阅读全文
posted @ 2020-03-20 13:30 Simon92 阅读(515) 评论(0) 推荐(0)
摘要:阅读目录 一、Hive内部表和外部表 0、Hive是什么? Hive是一个SQL解析引擎,将SQL语句转译成MR Job,然后再Hadoop平台上运行,达到快速开发的目的。 Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据。本质就是Hadoop的目录/文件,达到了元数据与数据存储分离的目的 阅读全文
posted @ 2019-04-28 00:43 Simon92 阅读(1508) 评论(0) 推荐(2)