随笔分类 -  Hadoop

摘要:【一】HDFS简介HDFS的基本概念1.1、数据块(block)HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。和普通文件系统相同的是,HDFS中的文件是被分成64M一块的数据块存储的。不同于普通文件系统的是,HDFS中,如果一个文件小于一个数据块的大小,并不占用整个数据块存储空间。--------------------------... 阅读全文
posted @ 2010-12-03 12:59 chinacloud 阅读(87214) 评论(30) 推荐(16) 编辑
摘要:这篇文章是由databasecolumn的几个数据库大牛写的,简要的介绍了MapReduce以及将其与现代数据库管理系统进行了对比,并指出了一些不足之处。本文纯属学习性翻译,从多方面来了解MapReduce,不代表完全赞同原文的观点。请读者也辩证的看。 一月八号,一个数据库专栏的读者询问我们关于对新的分布式数据库研究成果的意见。我们在这结合MapReduce谈谈我们的看法。现在是讨论这个问题的不错... 阅读全文
posted @ 2010-12-03 12:58 chinacloud 阅读(3913) 评论(1) 推荐(0) 编辑
摘要:【一】MapReduce基础 MapReduce 程序是设计用来并行计算大规模海量数据的,这需要把工作流分划到大量的机器上去,如果组件(component)之间可以任意的共享数据,那这个模型就没 法扩展到大规模集群上去了(数百或数千个节点),用来保持节点间数据的同步而产生的通信开销会使得系统在大规模集群上变得不可靠和效率低下。------------------------------------... 阅读全文
posted @ 2010-12-03 12:57 chinacloud 阅读(17845) 评论(4) 推荐(4) 编辑