2018 年 1月 2 日随笔档案 - 缪阿布

2018年1月2日

摘要： 1）加载到普通表 --加载本地文本文件内容（要与hive表字段分隔符顺序都要一致） load data local inpath '/home/hadoop/orders.csv' overwrite into table orders; 1> 如果数据源在HDFS上，则 load data inpath 'hdfs://master:9000/user/orders' ... 阅读全文

posted @ 2018-01-02 00:49 缪阿布阅读(949) 评论(0) 推荐(0)

hive 修改表

摘要：对表的修改操作有：修改表名、添加字段、修改字段。 1）修改表名 --将表名从 orders 改为 order alter table orders rename to order; 2) 添加字段 --在orders表添加一个字段provinceid int类型 alter table orders add columns (provinceid in... 阅读全文

posted @ 2018-01-02 00:48 缪阿布阅读(782) 评论(0) 推荐(0)

hive --桶

摘要：【精解：创建桶表时，指定桶的个数，分桶的依据字段，hive就可以自动将数据分桶存储。查询时只需要遍历一个桶里的数据，或者遍历部分桶，这样就提高了查询效率。】对于每一个表(table)或者分区，hive 可以进一步组织成桶，也就是说桶是更为细粒度的数据范围划分。hive也是针对某一列进行桶的组织。 hive采用对列hash，然后除以桶的个数求余的方式决定该条记录存... 阅读全文

posted @ 2018-01-02 00:46 缪阿布阅读(185) 评论(0) 推荐(0)

hive的初识（基本操作）

摘要： 1.2 语法创建数据库 create database if not exists orders; 查询建表的方式 create table as select 方式：根据查询的结果自动创建表，并将查询结果数据插入新建的表中。克隆表 create table like tablename 方式：是克隆表，只复制tablename的表结构。 1、创建一个分区... 阅读全文

posted @ 2018-01-02 00:45 缪阿布阅读(178) 评论(0) 推荐(0)