摘要: Hive 概述 什么是Hive hive是基于Hadoop的数据仓库建模工具之一,使用类sql语言,对存储在hdfs上的数据进行分析和管理。传入一条交互式sql在海量数据中查询分析结果的工具。 hive的优缺点 优点 1、操作接口采用类sql语法,提供快速开发的能力(简单、容易上手) 2、避免了去写 阅读全文
posted @ 2022-06-30 19:10 wdnmd、 阅读(138) 评论(0) 推荐(0)
摘要: Hadoop 概述 什么是Hadoop Hadoop是一个适用于海量数据的分布式存储和分布式计算的平台。 Hadoop三大基本组件 YARN、MapReduce、HDFS 分布式文件系统 FS、GFS(谷歌的分布式文件系统)、HDFS(Hadoop专有的分布式文件系统) 为什么需要使用分布式文件系统 阅读全文
posted @ 2022-06-24 15:46 wdnmd、 阅读(112) 评论(0) 推荐(0)