随笔分类 -  Hive

摘要:一、Hive的分区(十分重要) 1、分区是什么 答:我们可以把一个大的文件分隔成一个个小的文件,这样每次操作一个小文件就很方便了 2、为什么要进行分区 答:通过分区,当我们查询的时候,可以只扫描与条件相关的分区,这样做,避免了全局扫描,加快查询速度 1、静态分区(SP) 静态分区指的是,在我们将数据 阅读全文
posted @ 2024-11-13 21:48 你的镁偷走了我的锌 阅读(277) 评论(0) 推荐(0)
摘要:一、Hive库操作 1.创建数据库 create database bigdata32; 标准写法:create database if not exists databases;(判断是否存在,无论存不存在都不会报错) 2.创建数据库和位置 create database bigdata32_te 阅读全文
posted @ 2024-11-10 22:41 你的镁偷走了我的锌 阅读(400) 评论(0) 推荐(0)
摘要:一、 Hive的基本概念 1、什么是hive(面试题) 答: 1.hive是一个可以将sql语句转换成mapreduce任务的工具 2.hive能够将结构化的数据组织在表中,支持分区和分桶,便于数据的管理和查询 3.hive是数据仓库建模的工具之一,他本身并不是数据库 2、为什么使用hive 答: 阅读全文
posted @ 2024-11-10 20:16 你的镁偷走了我的锌 阅读(82) 评论(0) 推荐(0)
摘要:一、上传解压配置环境变量 1.解压 tar -zxvf apache-hive-3.1.2-bin.tar.gz -C ../ 2.配置环境变量 vim /etc/profile 3、重命名 mv apache-hive-3.1.2-bin hive-3.1.2 4.使环境变量生效 source / 阅读全文
posted @ 2024-11-08 21:37 你的镁偷走了我的锌 阅读(35) 评论(0) 推荐(0)