假期周总结06
在假期的第六周,我本周学习了 MapReduce、YARN 和 Hive 框架这部分内容,理解了分布式计算 “分而治之” 的核心思想和MapReduce 程序的提交方法与完整执行流程,还学习了 YARN 的功能、架构组件,了解了程序提交至 YARN 的交互流程及常见调度策略;同时,明确了数据仓库的定义、解决的业务问题与核心特点,理解了 SQL 编程语言的概念及简洁易用、通用性强等优点,进一步掌握了 Apache Hive 的架构原理、核心组件与客户端使用方法,以及 Hive 建库、建表的 SQL 语法。
- 学习内容概述
MapReduce 相关:理解分布式计算 “分而治之” 的核心思想,掌握 MapReduce 执行流程,学会提交 MapReduce 程序,明确其在分布式数据处理中的作用。
YARN 相关:掌握 YARN 的功能与架构组件,理解程序提交至 YARN 的交互流程,同时了解 YARN 调度策略,明晰其对分布式任务的资源管理与调度逻辑。
Hive 与数据仓库相关:理解数据仓库的定义、解决的问题及核心特点;明确 SQL 编程语言的概念与优点;掌握 Apache Hive 的架构原理及组件,学会使用 Hive 客户端,熟练运用建库、建表的 SQL 语法,为数据仓库场景下的数据分析奠定基础。

- 遇到的问题与解决
客户端连接失败:启动 Hive CLI 或 Beeline 时提示 “无法连接 Metastore”,经过检查后是 Metastore 服务未启动。
hadoop框架在使用时,需要启动许多服务,在进行操作时一定确保开启,可通过jps查看进程。
- 下周计划
继续学习大数据,开始学习hive框架sql语法

浙公网安备 33010602011771号