摘要: 一、概述 Hive是基于Hadoop的一个数据仓库(Data Aarehouse,简称数仓、DW),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。是用于存储、分析、报告的数据系统。 在Hadoop生态系统中,HDFS用于存储数据,Yarn用于资源管理,MapReduce用于数据处 阅读全文
posted @ 2022-04-05 23:17 大数据老司机 阅读(4174) 评论(0) 推荐(0)
摘要: 一、Hadoop概述 Hadoop是Apache软件基金会下一个开源分布式计算平台,以HDFS(Hadoop Distributed File System)、MapReduce(Hadoop2.0加入了YARN,Yarn是资源调度框架,能够细粒度的管理和调度任务,还能够支持其他的计算框架,比如sp 阅读全文
posted @ 2022-04-05 00:59 大数据老司机 阅读(3776) 评论(0) 推荐(0)