随笔分类 - Hive
摘要:一、Hive的分区(十分重要) 1、分区是什么 答:我们可以把一个大的文件分隔成一个个小的文件,这样每次操作一个小文件就很方便了 2、为什么要进行分区 答:通过分区,当我们查询的时候,可以只扫描与条件相关的分区,这样做,避免了全局扫描,加快查询速度 1、静态分区(SP) 静态分区指的是,在我们将数据
阅读全文
摘要:一、Hive库操作 1.创建数据库 create database bigdata32; 标准写法:create database if not exists databases;(判断是否存在,无论存不存在都不会报错) 2.创建数据库和位置 create database bigdata32_te
阅读全文
摘要:一、 Hive的基本概念 1、什么是hive(面试题) 答: 1.hive是一个可以将sql语句转换成mapreduce任务的工具 2.hive能够将结构化的数据组织在表中,支持分区和分桶,便于数据的管理和查询 3.hive是数据仓库建模的工具之一,他本身并不是数据库 2、为什么使用hive 答:
阅读全文
摘要:一、上传解压配置环境变量 1.解压 tar -zxvf apache-hive-3.1.2-bin.tar.gz -C ../ 2.配置环境变量 vim /etc/profile 3、重命名 mv apache-hive-3.1.2-bin hive-3.1.2 4.使环境变量生效 source /
阅读全文

浙公网安备 33010602011771号