摘要:
一、什么是: MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统 阅读全文
posted @ 2017-06-25 22:40
mzzcy
阅读(427)
评论(0)
推荐(0)
摘要:
学习笔记,整理自《Hadoop权威指南 第3版》 一、序列化 序列化:序列化是将 内存 中的结构化数据 转化为 能在网络上传输 或 磁盘中进行永久保存的二进制流的过程;反序列化:序列化的逆过程; 应用:进程间通信、网络传输、持久化; Hadoop中是使用的自己的序列化格式Writable,以及结合用 阅读全文
posted @ 2017-06-25 18:20
mzzcy
阅读(1292)
评论(0)
推荐(0)

浙公网安备 33010602011771号