会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
atrue
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
···
26
下一页
2025年1月31日
25.1.31(YARN3)
摘要: 3. 与传统资源管理方式对比与传统的 Hadoop 1.0 中的资源管理方式相比,YARN 具有明显的优势。在 Hadoop 1.0 中,MapReduce 既是计算框架又是资源管理框架,这使得它在扩展性和灵活性方面存在一定的局限性。而 YARN 将资源管理和计算框架分离,使得不同的计算框架可以共享
阅读全文
posted @ 2025-01-31 18:08 a_true
阅读(17)
评论(0)
推荐(0)
2025年1月30日
25.1.30(大年初二)
摘要: 大年初二去姥娘家
阅读全文
posted @ 2025-01-30 23:09 a_true
阅读(7)
评论(0)
推荐(0)
2025年1月29日
25.1.29(新年快乐!)
摘要: 祝大家新年快乐!!
阅读全文
posted @ 2025-01-29 23:32 a_true
阅读(7)
评论(0)
推荐(0)
2025年1月28日
25.1.28(YARN2)
摘要: 2. 架构解析 YARN 采用了主从架构,由 ResourceManager(RM)、NodeManager(NM)和 ApplicationMaster(AM)三个组件组成。 ResourceManager 是整个集群资源的管理者,它负责接收客户端的应用程序提交请求,为应用程序分配资源(如 CPU
阅读全文
posted @ 2025-01-28 20:15 a_true
阅读(10)
评论(0)
推荐(0)
2025年1月27日
25.1.27(YARN1)
摘要: 1. 功能概述 YARN(Yet Another Resource Negotiator)是 Hadoop 2.0 引入的一种新的资源管理系统,它负责管理集群中的计算资源,并为各种应用程序分配资源。 YARN 的主要功能包括:资源管理、任务调度和应用程序管理。它将资源管理和任务调度从 MapRedu
阅读全文
posted @ 2025-01-27 20:09 a_true
阅读(16)
评论(0)
推荐(0)
2025年1月26日
25.1.26(Map Reduce3)
摘要: 3. 案例分析:单词计数 下面我们通过一个简单的单词计数案例来深入理解 MapReduce 的工作流程。 假设我们有一个包含多篇文章的文本文件,我们想要统计每个单词在这些文章中出现的次数。 Map 阶段的代码如下: import java.io.IOException; import java.ut
阅读全文
posted @ 2025-01-26 23:09 a_true
阅读(25)
评论(0)
推荐(0)
2025年1月25日
25.1.25(Map Reduce2)
摘要: 2. 优势体现MapReduce 编程模型具有许多优势,使其非常适合处理大规模数据集。 首先,它具有良好的扩展性。随着数据集规模的不断增大,我们可以通过增加集群中的节点数量来提高计算能力,而无需对代码进行大量修改。其次,MapReduce 隐藏了分布式计算的复杂性,开发者只需要关注数据处理的逻辑,而
阅读全文
posted @ 2025-01-25 22:09 a_true
阅读(15)
评论(0)
推荐(0)
2025年1月24日
25.1.24(Map Reduce1)
摘要: 1. 原理剖析MapReduce 是 Hadoop 的核心组件之一,它将大规模数据集的处理过程分为两个阶段:Map 阶段和 Reduce 阶段。 在 Map 阶段,数据被分割成多个小的数据集,每个数据集由一个 Map 任务进行处理。Map 任务会对输入的数据进行解析和转换,将其转换为键值对(<key
阅读全文
posted @ 2025-01-24 19:10 a_true
阅读(14)
评论(0)
推荐(0)
2025年1月23日
25.1.23(HDFS3)
摘要: 3. 代码示例:使用 Java API 操作 HDFS 以下是一个简单的 Java 代码示例,用于在 HDFS 中创建一个目录并上传一个本地文件到该目录中: import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.f
阅读全文
posted @ 2025-01-23 21:20 a_true
阅读(32)
评论(0)
推荐(0)
2025年1月10日
25.1.10(HDFS2)
摘要: 2. 数据存储与读取流程 在 HDFS 中,数据存储和读取的过程十分有趣。当客户端向 HDFS 写入数据时,首先会将数据分成若干个固定大小的数据块(默认大小为 128MB),然后将这些数据块依次写入到不同的 DataNode 中。每个数据块会在多个 DataNode 上进行冗余存储,默认的冗余因子为
阅读全文
posted @ 2025-01-10 22:22 a_true
阅读(14)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
26
下一页
公告