随笔分类 -  Hadoop

Hadoop作为大数据基础框架中分布式系统,目前的大部分的大数据都运行在Hadoop之上,本专栏主要介绍Hadoop,Yarn,HDFS的一些使用以及小的坑
摘要:+ Hadoop常见的端口 + Hadoop生态圈 + Hadoop配置文件以及简单的Hadoop集群搭建 + Hadoop参数调优 + 项目经验之基准测试 + Hadoop宕机 + Hadoop 高可用配置 Hadoop 常见的端口  dfs.namenode.http address:5007 阅读全文
posted @ 2020-01-08 17:59 IT猿看视界 阅读(567) 评论(0) 推荐(0)
摘要:+ HDFS 写文件 + 网络拓扑 节点距离计算 + HDFS读流程 + NN和2NN工作机制 + Fsimage和Edits解析 + CheckPoint时间设置 + NameNode故障后的数据恢复 HDFS 数据流 HDFS 写文件 1)客户端通过Distributed FileSystem模 阅读全文
posted @ 2020-01-08 17:57 IT猿看视界 阅读(595) 评论(0) 推荐(0)