set hive.cli.print.header=true;
-- 显示字段名称
set hive.cli.print.current.db=true;
-- 显示当前数据库名
drop database dbname CASCADE;
-- 删除数据库及库中表
alter database dbname set dbproperties(key=value);
-- 设置数据库元数据
alter table table_name set tblproperties('creator'='wangbin');
alter table table_name set tblproperties('EXTERNAL'='FALSE');
-- 注意大写的单词外部表转内部表
alter table table_name set serdeproperties('field.delim'='\t');
-- 修改序列化信息
alter table table_name partition(dt='') set fileformat sequencefile;
-- 修改表的存储属性
alter table table_name partition(dt='') set location 'hdfs://...';
-- 修改表存储位置
insert overwrite directory 'hdfs://...' select * from table_name;
-- 将查询数据导入到一个hdfs目录
order by
--全局排序
sort by
--局部(每个reducer)排序
distribute by + 字段
--控制相同字段的map输出会发到一个reduce
cluster by
--等价于distribute by +sort by
left semi join
-- 左半连接,只返回左表中符合on条件的数据