Hadoop知识简要
1、HDFS
HDFS是分布式文件系统
- 支持海量数据存储
- 由大量的计算机集群组成
- 可以运行再低成本的硬件之上
- 高容错性
- 高可靠性
- 高扩展性
- 高吞吐率
适合大规模数据集的应用上








2、 YARN
这个框架已经过时了





3、MapReduce




Hbase




4、Hive



5、pig


6、Flume




7、Sqoop



HDFS是分布式文件系统
- 支持海量数据存储
- 由大量的计算机集群组成
- 可以运行再低成本的硬件之上
- 高容错性
- 高可靠性
- 高扩展性
- 高吞吐率
适合大规模数据集的应用上








这个框架已经过时了























