随笔分类 - HIVE
摘要:1 Hive 的核心组成介绍 1)用户接口:Client CLI(command-line interface)、JDBC/ODBC(jdbc 访问 hive)、WEBUI(浏览器访问 hive) 2)元数据:Metastore 元数据包括:表名、表所属的数据库(默认是 default)、表的拥有者
阅读全文
posted @ 2021-08-22 18:46
秋华
摘要:来源:https://blog.csdn.net/qq_41973536/article/details/81627918 hive的集合数据类型包括三种,分别是 Array、Map和Struct 下面分别介绍一下关于集合类型的创建表、插入数据以及查询的方法 1 创建包含有集合数据类型的hive表
阅读全文
posted @ 2021-08-19 22:21
秋华
摘要:hive窗口函数语法 在前言中我们已经说了avg()、sum()、max()、min()是分析函数,而over()才是窗口函数,下面我们来看看over()窗口函数的语法结构、及常与over()一起使用的分析函数 over()窗口函数的语法结构 常与over()一起使用的分析函数 窗口函数总结 1、o
阅读全文
posted @ 2021-08-19 22:13
秋华
摘要:3 自定义函数 1)Hive 自带了一些函数,比如:max/min 等,但是数量有限,自己可以通过自定义 UDF 来 方便的扩展。 2)当 Hive 提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义 函数(UDF:user-defined function)。 3)根据用户自定
阅读全文
posted @ 2021-08-14 17:04
秋华
摘要:1 分区表 分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive 中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。 1.1 分区表基本操
阅读全文
posted @ 2021-08-14 16:15
秋华
摘要:4 Join 语句 4.1 等值 Join Hive 支持通常的 SQL JOIN 语句。 1)案例实操 (1)根据员工表和部门表中的部门编号相等,查询员工编号、员工名称和部门名称; hive (default)> select e.empno, e.ename, d.deptno, d.dname
阅读全文
posted @ 2021-08-14 12:51
秋华