摘要: 一、什么是: MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统 阅读全文
posted @ 2017-06-25 22:40 mzzcy 阅读(427) 评论(0) 推荐(0)
摘要: 学习笔记,整理自《Hadoop权威指南 第3版》 一、序列化 序列化:序列化是将 内存 中的结构化数据 转化为 能在网络上传输 或 磁盘中进行永久保存的二进制流的过程;反序列化:序列化的逆过程; 应用:进程间通信、网络传输、持久化; Hadoop中是使用的自己的序列化格式Writable,以及结合用 阅读全文
posted @ 2017-06-25 18:20 mzzcy 阅读(1292) 评论(0) 推荐(0)