随笔档案「2021年9月6日」：第十五章 Hadoop序列化 ... - 年少纵马且长歌

2021年9月6日

摘要：一、序列化含义序列化就是把内存中的对象，转换成字节序列（或其他数据传输协议）以便于存储到磁盘（持久化）和网络传输。反序列化就是将收到字节序列（或其他数据传输协议）或者是磁盘的持久化数据，转换成内存中的对象。二、序列化的背景一般来说，“活的”对象只生存在内存里，关机断电就没有了。而且“活的”对阅读全文

posted @ 2021-09-06 17:37 年少纵马且长歌阅读(71) 评论(0) 推荐(0)

第十四章 MapReduce概述

摘要：一、MapReduce基本含义 MapReduce是一个分布式运算程序的编程框架，是用户开发“基于Hadoop的数据分析应用”的核心框架。 MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个Hadoop集群上。二、MapReduce优缺阅读全文

posted @ 2021-09-06 16:51 年少纵马且长歌阅读(203) 评论(0) 推荐(0)

第十三章 HDFS各组件机制

摘要：一、 NN和2NN工作机制思考：NameNode中的元数据是存储在哪里的？首先，我们做个假设，如果存储在NameNode节点的磁盘中，因为经常需要进行随机访问，还有响应客户请求，必然是效率过低。因此，元数据需要存放在内存中。但如果只存在内存中，一旦断电，元数据丢失，整个集群就无法工作了。因此产生阅读全文

posted @ 2021-09-06 14:30 年少纵马且长歌阅读(178) 评论(0) 推荐(0)

第十二章 HDFS的读写流程

摘要：一、HDFS写数据流程 #1.客户端通过Distributed File System模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。 #2.NameNode返回是否可以上传。 #3.客户端请求第一个 Block上传到哪几个DataNode服务器上。 #4 阅读全文

posted @ 2021-09-06 14:13 年少纵马且长歌阅读(130) 评论(0) 推荐(0)

青青子衿悠悠我心

当你的才华还撑不起你的野心的时候，你就应该静下心来学习

公告