摘要: 用户编写Map和Reduce函数,Map函数的调用是针对一对<k,v>的,即如果输入有5对<k,v>,那么Map函数就会调用5次。对于每一次: 输入一对<k,v>,然后进行某些用户定义的操作,可以emit 出 一对或者多对的<k,v>这些Map函数输出的<k,v>写到本地的内存中,周期性的,这些内存中的数据对被写到本地磁盘上。Reduce函数的输入是< k,list<v> > ,即相同的key的value会被串在一个list里面。然后Reduce函数对于每条这样的输入进行某些用户自定义的操作,典型情况下,对于一 阅读全文
posted @ 2011-12-25 22:27 吴镝 阅读(838) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://dbmsmusings.blogspot.com/2011/12/replication-and-latency-consistency.htmlCAP:在出现网络分区的时候,在consistency和availability之间做tradeoff而在系统处于正常状态的时候,我们也需要对consistent和latency之间做tradeoffagreement也叫做consensus有三种做replication的技术:1.数据的更新同时被送到所有的replicas。 如果更新不是首先通过一个预处理层或者通过某种agreement协议,那么replica之间就会出现不 阅读全文
posted @ 2011-12-25 21:04 吴镝 阅读(636) 评论(0) 推荐(0) 编辑