摘要: 1、 HDFS 中的 block 默认保存几份? 默认保存3份 2、HDFS 默认 BlockSize 是多大? 默认64MB 3、负责HDFS数据存储的是哪一部分? DataNode负责数据存储 4、SecondaryNameNode的目的是什么? 他的目的使帮助NameNode合并编辑日志,减少 阅读全文
posted @ 2021-10-13 12:53 大数据技术派 阅读(585) 评论(0) 推荐(1) 编辑
摘要: 1、集群的最主要瓶颈 磁盘IO 2、Hadoop运行模式 单机版、伪分布式模式、完全分布式模式 3、Hadoop生态圈的组件并做简要描述 1)Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务。 2)Flume:一个高可用的,高可靠的, 阅读全文
posted @ 2021-10-13 12:44 大数据技术派 阅读(244) 评论(0) 推荐(0) 编辑