摘要: 1)加载到普通表 --加载本地文本文件内容(要与hive表字段分隔符顺序都要一致) load data local inpath '/home/hadoop/orders.csv' overwrite into table orders; 1> 如果数据源在HDFS上,则 load data inpath 'hdfs://master:9000/user/orders' ... 阅读全文
posted @ 2018-01-02 00:49 缪阿布 阅读(924) 评论(0) 推荐(0) 编辑
摘要: 对表的修改操作有:修改表名、添加字段、修改字段。 1)修改表名 --将表名从 orders 改为 order alter table orders rename to order; 2) 添加字段 --在orders表添加一个字段provinceid int类型 alter table orders add columns (provinceid in... 阅读全文
posted @ 2018-01-02 00:48 缪阿布 阅读(744) 评论(0) 推荐(0) 编辑
摘要: 【 精解: 创建桶表时,指定桶的个数,分桶的依据字段,hive就可以自动将数据分桶存储。查询时只需要遍历一个桶里的数据,或者遍历部分桶,这样就提高了查询效率。 】 对于每一个表(table)或者分区,hive 可以进一步组织成桶,也就是说桶是更为细粒度的数据范围划分。hive也是针对某一列进行桶的组织。 hive采用对列hash,然后除以桶的个数求余的方式决定该条记录存... 阅读全文
posted @ 2018-01-02 00:46 缪阿布 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 1.2 语法 创建数据库 create database if not exists orders; 查询建表的方式 create table as select 方式:根据查询的结果自动创建表,并将查询结果数据插入新建的表中。 克隆表 create table like tablename 方式:是克隆表,只复制tablename的表结构。 1、创建一个分区... 阅读全文
posted @ 2018-01-02 00:45 缪阿布 阅读(169) 评论(0) 推荐(0) 编辑