Hive系列 - 随笔分类 - 牧梦者

Hive架构与源码分析（整理版）

摘要：1. Hive的架构 Hive的体系结构可以分为以下几部分：用户接口主要有三个：CLI，JDBC/ODBC和 Web UI。 ①其中，最常用的是CLI，即Shell命令行； ②JDBC/ODBC Client是Hive的Java客户端，与使用传统数据库JDBC的方式类似，用户需要连接至Hive S 阅读全文

posted @ 2021-02-01 17:50 牧梦者阅读(7239) 评论(0) 推荐(4)

Hive UDF函数构建

摘要：1. 概述 UDF函数其实就是一个简单的函数，执行过程就是在Hive转换成MapReduce程序后，执行java方法，类似于像MapReduce执行过程中加入一个插件，方便扩展。UDF只能实现一进一出的操作，如果需要实现多进一出，则需要实现UDAF。 Hive可以允许用户编写自己定义的函数UDF，来阅读全文

posted @ 2019-07-16 11:46 牧梦者阅读(14031) 评论(0) 推荐(0)

Hive优化（整理版）

摘要：1. 概述 1.1 hive的特征：可以通过SQL轻松访问数据的工具，从而实现数据仓库任务，如提取/转换/加载（ETL），报告和数据分析；它可以使已经存储的数据结构化；可以直接访问存储在Apache HDFS或其他数据存储系统（如Apache HBase）中的文件； Hive除了支持MapRe 阅读全文

posted @ 2019-07-04 01:31 牧梦者阅读(49935) 评论(12) 推荐(6)

Hive基本命令解析

摘要：1. Hive的分区作用命令：创建分区往分区中插入数据：load data local inpath '/home/hadoop/sz.dat' into table t_sz_part partition(country = 'China')；说明：首先，创建分区表的时候，需要通过关键字pa 阅读全文

posted @ 2018-05-01 14:57 牧梦者阅读(1219) 评论(0) 推荐(0)

Hive基础概念、安装部署与基本使用

摘要：1. Hive简介 1.1 什么是Hive Hives是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。 1.2 为什么使用Hive ① 直接使用Hadoop面临人员学习成功太高、项目周期要求太短、MapReduce实现复杂查询逻辑开发难度太大等阅读全文

posted @ 2018-04-12 11:26 牧梦者阅读(2067) 评论(0) 推荐(0)

牧梦者

随笔分类 - Hive系列

公告