摘要:
Hive 表设计与数据建模 Hive 数据仓库中的表类型与建模思想 一、为什么 Hive 表设计很重要 在 Hive 中,SQL 本身并不复杂,真正决定查询效率和系统稳定性的,往往是 表设计与数据建模方式。 不合理的表结构,会直接导致: 查询扫描数据量过大 MapReduce 任务执行时间过长 小文 阅读全文
posted @ 2025-10-22 08:10
元始天尊123
阅读(6)
评论(0)
推荐(0)
摘要:
Hive 入门理解 Hive 是什么?为什么大数据离不开 Hive 一、Hive 出现的背景 在大数据早期,Hadoop 提供了 HDFS 用于分布式存储,MapReduce 用于分布式计算。但随着数据规模的不断扩大,直接使用 MapReduce 编写程序逐渐暴露出两个问题: 开发成本高 MapRe 阅读全文
posted @ 2025-10-22 08:09
元始天尊123
阅读(4)
评论(0)
推荐(0)
摘要:
Hive 环境搭建全流程实战 基于 Hadoop 集群的 Hive 安装与配置 一、环境准备说明 本文基于如下环境进行搭建: 操作系统:CentOS 7 Hadoop 版本:3.1 Hive 版本:3.x1 元数据库:MySQL 8.1 JDK:1.8 在安装 Hive 之前,必须确保 Hadoop 阅读全文
posted @ 2025-10-22 08:09
元始天尊123
阅读(4)
评论(0)
推荐(0)

浙公网安备 33010602011771号