摘要:
一、概述 Hive是基于Hadoop的一个数据仓库(Data Aarehouse,简称数仓、DW),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。是用于存储、分析、报告的数据系统。 在Hadoop生态系统中,HDFS用于存储数据,Yarn用于资源管理,MapReduce用于数据处 阅读全文
posted @ 2022-04-05 23:17
大数据老司机
阅读(4174)
评论(0)
推荐(0)
摘要:
一、Hadoop概述 Hadoop是Apache软件基金会下一个开源分布式计算平台,以HDFS(Hadoop Distributed File System)、MapReduce(Hadoop2.0加入了YARN,Yarn是资源调度框架,能够细粒度的管理和调度任务,还能够支持其他的计算框架,比如sp 阅读全文
posted @ 2022-04-05 00:59
大数据老司机
阅读(3776)
评论(0)
推荐(0)

浙公网安备 33010602011771号