2014年6月19日

快速找出故障机器

摘要: 关心数据挖掘和搜索引擎的程序员都知道,我们需要很多的计算机来存储和处理海量数据。 然而,计算机难免出现硬件故障而导致网络联系失败或死机。为了保证搜索引擎的服务质量,我们需要保证每份数据都有多个备份。 简单起见,假设每个机器存储一个标号为ID的记录(ID是小于十亿的整数),假设每份数据都保存两个备份,这样就有两个机器储存了同样的数据。   1.在某个时间,如果得到一个数据文件ID的列表,是否能够快速地找出这个表中仅出现一次的ID?   2.如果已经知道只有一台机器死机(也就是说只有一个备份丢失)呢?如果有两台机器死机呢(假设同一个数据的两个备份不会同时丢失)? 阅读全文

posted @ 2014-06-19 11:25 熊小熊-chris 阅读(419) 评论(0) 推荐(0) 编辑

导航