摘要: From: http://yanbohappy.sinaapp.com/?p=106 Thx a lot:) 目前的HDFS中数据是靠三备份triplication来保证冗余的。显然这只是一个简单有效的方法而不是一个非常elegant的方法。三备份浪费了大量存储空间,在集群规模较小的时候可能还不是那么明显,但是对于大规模集群就比较明显了。如果按照1GB存储空间的成本是1$来算,如果数据规模是5T... 阅读全文
posted @ 2012-07-10 23:33 郝玉琨 阅读(3474) 评论(0) 推荐(0) 编辑