摘要:
3 自定义函数 1)Hive 自带了一些函数,比如:max/min 等,但是数量有限,自己可以通过自定义 UDF 来 方便的扩展。 2)当 Hive 提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义 函数(UDF:user-defined function)。 3)根据用户自定 阅读全文
posted @ 2021-08-14 17:04
秋华
阅读(334)
评论(0)
推荐(0)
摘要:
1 分区表 分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive 中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。 1.1 分区表基本操 阅读全文
posted @ 2021-08-14 16:15
秋华
阅读(550)
评论(0)
推荐(0)
摘要:
4 Join 语句 4.1 等值 Join Hive 支持通常的 SQL JOIN 语句。 1)案例实操 (1)根据员工表和部门表中的部门编号相等,查询员工编号、员工名称和部门名称; hive (default)> select e.empno, e.ename, d.deptno, d.dname 阅读全文
posted @ 2021-08-14 12:51
秋华
阅读(226)
评论(0)
推荐(0)