a_true - 博客园

2025年1月31日

25.1.31（YARN3）

摘要： 3. 与传统资源管理方式对比与传统的 Hadoop 1.0 中的资源管理方式相比，YARN 具有明显的优势。在 Hadoop 1.0 中，MapReduce 既是计算框架又是资源管理框架，这使得它在扩展性和灵活性方面存在一定的局限性。而 YARN 将资源管理和计算框架分离，使得不同的计算框架可以共享阅读全文

posted @ 2025-01-31 18:08 a_true 阅读(27) 评论(0) 推荐(0)

2025年1月30日

25.1.30（大年初二）

摘要：大年初二去姥娘家阅读全文

posted @ 2025-01-30 23:09 a_true 阅读(11) 评论(0) 推荐(0)

2025年1月29日

25.1.29（新年快乐！）

摘要：祝大家新年快乐！！阅读全文

posted @ 2025-01-29 23:32 a_true 阅读(11) 评论(0) 推荐(0)

2025年1月28日

25.1.28（YARN2）

摘要： 2. 架构解析 YARN 采用了主从架构，由 ResourceManager（RM）、NodeManager（NM）和 ApplicationMaster（AM）三个组件组成。 ResourceManager 是整个集群资源的管理者，它负责接收客户端的应用程序提交请求，为应用程序分配资源（如 CPU 阅读全文

posted @ 2025-01-28 20:15 a_true 阅读(19) 评论(0) 推荐(0)

2025年1月27日

25.1.27（YARN1）

摘要： 1. 功能概述 YARN（Yet Another Resource Negotiator）是 Hadoop 2.0 引入的一种新的资源管理系统，它负责管理集群中的计算资源，并为各种应用程序分配资源。 YARN 的主要功能包括：资源管理、任务调度和应用程序管理。它将资源管理和任务调度从 MapRedu 阅读全文

posted @ 2025-01-27 20:09 a_true 阅读(32) 评论(0) 推荐(0)

2025年1月26日

25.1.26（Map Reduce3）

摘要： 3. 案例分析：单词计数下面我们通过一个简单的单词计数案例来深入理解 MapReduce 的工作流程。假设我们有一个包含多篇文章的文本文件，我们想要统计每个单词在这些文章中出现的次数。 Map 阶段的代码如下： import java.io.IOException; import java.ut 阅读全文

posted @ 2025-01-26 23:09 a_true 阅读(40) 评论(0) 推荐(0)

2025年1月25日

25.1.25（Map Reduce2）

摘要： 2. 优势体现MapReduce 编程模型具有许多优势，使其非常适合处理大规模数据集。首先，它具有良好的扩展性。随着数据集规模的不断增大，我们可以通过增加集群中的节点数量来提高计算能力，而无需对代码进行大量修改。其次，MapReduce 隐藏了分布式计算的复杂性，开发者只需要关注数据处理的逻辑，而阅读全文

posted @ 2025-01-25 22:09 a_true 阅读(33) 评论(0) 推荐(0)

2025年1月24日

25.1.24（Map Reduce1）

摘要： 1. 原理剖析MapReduce 是 Hadoop 的核心组件之一，它将大规模数据集的处理过程分为两个阶段：Map 阶段和 Reduce 阶段。在 Map 阶段，数据被分割成多个小的数据集，每个数据集由一个 Map 任务进行处理。Map 任务会对输入的数据进行解析和转换，将其转换为键值对（<key 阅读全文

posted @ 2025-01-24 19:10 a_true 阅读(31) 评论(0) 推荐(0)

2025年1月23日

25.1.23（HDFS3）

摘要： 3. 代码示例：使用 Java API 操作 HDFS 以下是一个简单的 Java 代码示例，用于在 HDFS 中创建一个目录并上传一个本地文件到该目录中： import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.f 阅读全文

posted @ 2025-01-23 21:20 a_true 阅读(58) 评论(0) 推荐(0)

2025年1月10日

25.1.10（HDFS2）

摘要： 2. 数据存储与读取流程在 HDFS 中，数据存储和读取的过程十分有趣。当客户端向 HDFS 写入数据时，首先会将数据分成若干个固定大小的数据块（默认大小为 128MB），然后将这些数据块依次写入到不同的 DataNode 中。每个数据块会在多个 DataNode 上进行冗余存储，默认的冗余因子为阅读全文

posted @ 2025-01-10 22:22 a_true 阅读(34) 评论(0) 推荐(0)

atrue

公告