随笔分类 -  Hive

摘要:此处txt文本中以空格分开,所以此处以 '/t' 进行分割,否则会将整个数据全放在第一列中 4.在hive环境中执行指令 5.在上一步显示ok后,可通过select * from tmp.cityprovince;进行验证。 注意:需要转换为utf-8,否则tmp.citryprovince会显示乱 阅读全文
posted @ 2018-08-21 15:09 Mayny# 阅读(849) 评论(0) 推荐(0)
摘要:Hive本质上是一个数据仓库,但不存储数据(只存储元数据(metadata),Hive中的元数据包括表的名字,表的列和分区及分区及其属性,表的属性(是否为外部表等),表的数据所在目录等),用户可以借助Hive使用sql对存储在分布式文件系统中的大数据集进行读写Hive... 阅读全文
posted @ 2018-07-13 16:30 Mayny# 阅读(215) 评论(0) 推荐(0)
摘要:根据用户的需求创建视图。可以将任何结果集数据保存为一个视图。视图在Hive的用法和SQL视图用法相同。它是一个标准的RDBMS概念。我们可以在视图上执行所有DML操作。创建一个试图可以创建一个试图,在执行SELECT语句的时候,语法如下:CREATE VIEW [IF... 阅读全文
posted @ 2018-07-11 16:54 Mayny# 阅读(135) 评论(0) 推荐(0)
摘要:Hive分区Hive组织表到分区。它是将一个表到基于分区列,如日期,城市和部门的值相关方式。使用分区,很容易对数据进行部分查询。表或分区是细分成桶,以提供额外的结构,可以使用更高效的查询的数据。桶的工作是基于表的一些列的散列函数值。例如,一个名为Tab1表包含雇员数据... 阅读全文
posted @ 2018-07-11 16:36 Mayny# 阅读(118) 评论(0) 推荐(0)
摘要:LOAD DATA语句一般来说,在SQL创建表后,我们就可以使用INSERT语句插入数据。但在Hive中,可以使用LOAD DATA语句来插入数据。LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE t... 阅读全文
posted @ 2018-07-11 15:51 Mayny# 阅读(106) 评论(0) 推荐(0)