摘要: 现实:数据量不断快速增加问题:硬盘容量增加的同时,数据从硬盘的读取速度为增加解决方案:将文件分散的保存在多个磁盘上,同时从多个磁盘上并行读取数据挑战1:解决硬件故障:为了避免数据丢失,通过系统保存数据的冗余副本,发生故障时,使用数据的另一份副本。挑战2:从多个磁盘中取出分散的数据后,需要将数据合并,并保证正确性。引出:hadoop提供稳定的共享存储和分析系统,存储有HDFS实现,分析由MapReduce实现优势:1、磁盘驱动器的发展趋势:寻址时间的提速远远慢于传输速率的提速2、更新大部分数据库数据时,B树(关系型数据库使用的数据结构)效率没有MapReduce高擅长领域:RDBMS适用于点查询 阅读全文
posted @ 2012-03-08 23:23 KAYAK 阅读(294) 评论(0) 推荐(0) 编辑
摘要: 之前项目中也遇到了对文档的相关性进行分析。今天看到了《数学之美》的一篇文章,谈到谷歌使用余弦定理为文档进行相关性搜索,感觉特别有趣,在此记录。计算机只能进行快速的计算,它读不懂新闻,图片,因此,对于新闻的描述、归类是件很麻烦的事情,曾经听百度介绍,为了给图片库的图片打上标签,他们开发了一款游戏,在游戏过程中,玩家输入图片描述,通过此法,才完成了对大量图片的描述构建。然而,谷歌,利用余弦定理,轻松地对心肺分类和整理进行自动化。主要分为几步:step1:维护一张词汇表,这张词汇表中记录平时新闻中经常出现的字、词例如:1、啊 2、中国 3、的4、报到。。。。。。。 10000、冬天step2:统计每 阅读全文
posted @ 2012-03-04 18:52 KAYAK 阅读(950) 评论(0) 推荐(0) 编辑
摘要: 三个塔座,X、Y、ZX上有n个直径大小各不相同从大到小依次编号为n的圆盘,将X塔上的圆盘移到Z塔,要求:*每次只能移动一个圆盘*任何时候不能将较大的圆盘压在较小的圆盘之上算法分析:如果X塔上只有一个圆盘,则直接移到Z轴上即可如果X塔上圆盘个数>1,先将X塔上的n-1个盘借助Z塔依次挪到Y塔上,将X塔上的n盘移到Z塔上以此类推,将Y他上的n-2个盘借助Z塔依次挪到X塔上,将Y塔上的n-1盘移到Z塔上边界条件 Z塔的盘子数量=n算法:伪代码//将x塔上的n个盘子,从X移到Z,用y做辅助void hannoi(int n ,char x,char y,char z){ if(n==1) { m 阅读全文
posted @ 2012-03-01 00:30 KAYAK 阅读(1579) 评论(0) 推荐(0) 编辑
摘要: 著名的ThoughtWork公司SteliosPantazopoulos迭代经理根据医疗领域,医生护士根据病人的健康状况图表,分析病人实时生命体征数据这一现象,提出了在软件开发过程中通过获取项目生命体征,来判断项目健康状况,并在此基础上分析了如何进行项目的体征分析。不同层面的人关注点不同,对项目的健康程度判断往往不同,通常情况下,项目经理关注预算使用情况,QA(质量保证)关注软件交付质量,开发人员关注项目范围的增长。不同的人的看法相互联系的同时又相互独立。总而言之,项目的健康程度受多个角度同时制约,因此,处于一致性考虑,应该列出所有的项目体征信息,对项目健康程度进行评估。SteliosPant 阅读全文
posted @ 2012-02-29 00:24 KAYAK 阅读(276) 评论(0) 推荐(0) 编辑