摘要:
### 什么是Hive Hive是建立在Hadoop上的数据仓库基础架构。它提供了一系列的工具,可以用来进行数据提取转化加载,可以简称为ETL。 Hive 定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户直接查询Hadoop中的数据,同时,这个语言也允许熟悉MapReduce的开发者 阅读全文
posted @ 2023-05-30 22:29
strongmore
阅读(258)
评论(0)
推荐(0)
摘要:
### YARN的由来 从Hadoop2开始,官方把资源管理单独剥离出来,主要是为了考虑后期作为一个公共的资源管理平台,任何满足规则的计算引擎都可以在它上面执行。所以YARN可以实现HADOOP集群的资源共享,不仅仅可以跑MapReduce,还可以跑Spark、Flink。 ### YARN架构分析 阅读全文
posted @ 2023-05-30 21:38
strongmore
阅读(572)
评论(0)
推荐(0)

浙公网安备 33010602011771号