随笔分类 -  大数据

摘要:hadoop在启动namenode和datanode之后,两者之间是如何联动了?datanode如何向namenode注册?如何汇报数据?namenode又如何向datanode发送命令? 心跳机制基础概念 ​ 心跳就是HDFS中从节点DataNode周期性的向名字节点DataNode做汇报,汇报自 阅读全文
posted @ 2021-07-21 13:59 坐井 阅读(458) 评论(0) 推荐(0)
摘要:执行start-dfs.sh脚本后,集群是如何启动的? 本文阅读并注释了start-dfs脚本,以及datanode的启动主要流程流程源码。 DataNode 启动流程 脚本代码分析 start-dfs.sh中启动datanode的代码: # # datanodes (using default w 阅读全文
posted @ 2021-07-15 17:37 坐井 阅读(825) 评论(0) 推荐(1)
摘要:执行start-dfs.sh脚本后,集群是如何启动的? 本文阅读并注释了start-dfs脚本,以及namenode和datanode的启动主要流程流程源码。 阅读源码前准备 源码获取 拉取Apache Hadoop官方源码 https://github.com/apache/hadoop 用ide 阅读全文
posted @ 2021-07-09 14:49 坐井 阅读(1087) 评论(0) 推荐(1)
摘要:第一部分 大数据简介 第一节 大数据的定义 ​ 大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 第二节 大数据的特点 大数据的特点可以用IBM曾经提出的“5V”来描述,如下 阅读全文
posted @ 2021-06-18 00:20 坐井 阅读(253) 评论(0) 推荐(0)
摘要:第一节 安装CentOS 7 安装环境: VMware虚拟机中( 建议入手正版软件哦 ) 软件安装版本以及下载地址: CentOS-7-x86_64-DVD-2009.iso 安装步骤 1.1 创建一台虚拟机 1.2 给虚拟机挂载操作系统 1.3 开启虚拟机并安装操作系统 install cento 阅读全文
posted @ 2021-06-09 00:51 坐井 阅读(158) 评论(0) 推荐(0)