摘要:
Hive 常用函数 关系运算 (1)等值比较 = == <=> (2)不等值比较 != <> (3)区间比较: 左闭右闭 select * from default.students where id between 1500100001 and 1500100010; (4)空值/非空值判断:is 阅读全文
posted @ 2022-02-20 21:47
阿伟宝座
阅读(195)
评论(0)
推荐(0)
摘要:
Hive HQL语法:DDL、DQL 1、DDL 创建数据库 create database 库名; 查看数据库 show databases; 删除数据库 drop database 库名; 强制删除数据库:drop database tmp cascade; 查看表:SHOW TABLES; 查 阅读全文
posted @ 2022-02-20 20:48
阿伟宝座
阅读(119)
评论(0)
推荐(0)
摘要:
Hive数据类型 整型:TINYINT、SMALLINT、INT、BIGINT(Hive常用) 浮点:FLOAT、DOUBLE(Hive常用) 布尔类型:BOOL (False/True) 字符串:STRING(Hive常用) 时间类型: 时间戳 timestamp Timestamp 格式:(年- 阅读全文
posted @ 2022-02-20 19:36
阿伟宝座
阅读(547)
评论(0)
推荐(0)
摘要:
Hive笔记3:Hive分桶、Hive JDBC 一、Hive分桶 分桶实际上是对文件(数据)的进一步切分 Hive默认关闭分桶 作用:在往分桶表中插入数据的时候,会根据 clustered by 指定的字段 进行hash分区 对指定的buckets个数 进行取余,进而可以将数据分割成buckets 阅读全文
posted @ 2022-02-20 15:44
阿伟宝座
阅读(127)
评论(0)
推荐(0)
摘要:
Hive笔记2:Hive分区、Hive动态分区 一、Hive 分区 分区表实际上是在表的目录下再建一个子目录 作用:进行分区裁剪,避免全表扫描,减少MapReduce处理的数据量,提高效率 一般在公司的hive中,所有的表基本上都是分区表,通常按日期分区、地域分区 分区表在使用的时候记得加上分区字段 阅读全文
posted @ 2022-02-20 10:57
阿伟宝座
阅读(1363)
评论(0)
推荐(0)

浙公网安备 33010602011771号