摘要: 现实:数据量不断快速增加问题:硬盘容量增加的同时,数据从硬盘的读取速度为增加解决方案:将文件分散的保存在多个磁盘上,同时从多个磁盘上并行读取数据挑战1:解决硬件故障:为了避免数据丢失,通过系统保存数据的冗余副本,发生故障时,使用数据的另一份副本。挑战2:从多个磁盘中取出分散的数据后,需要将数据合并,并保证正确性。引出:hadoop提供稳定的共享存储和分析系统,存储有HDFS实现,分析由MapReduce实现优势:1、磁盘驱动器的发展趋势:寻址时间的提速远远慢于传输速率的提速2、更新大部分数据库数据时,B树(关系型数据库使用的数据结构)效率没有MapReduce高擅长领域:RDBMS适用于点查询 阅读全文
posted @ 2012-03-08 23:23 KAYAK 阅读(294) 评论(0) 推荐(0) 编辑