Republican

  :: 首页 :: 新随笔 :: :: 订阅 :: 管理 ::

随笔分类 -  DataProcess

摘要:Today we are going to introduce a new concept called amortized time.This is about the process of retrieving time consumption and flexible amorizized function positioning.Here it's time to prove 2 operation bounds:First comes some basic rules:1, X为斐波那契堆任一节点,ci isthe newing i-th child node, then c 阅读全文
posted @ 2012-09-10 21:22 Republist 阅读(215) 评论(0) 推荐(0)

摘要:GFS是一个可扩展的大型数据密集型应用的分布式文件系统,该文件系统可在廉价的硬件上运行,并具有可靠的容错能力,该文件系统可为用户提供极高的计算性能,而同时具备最小的硬件投资和运营成本。Caffeine将索引放置在由Google开发的分布式数据库BigTable上。作为Google继GFS和MapReduce两项创新后的又一项创新,其在设计用来针对海量数据处理情形下的管理结构型数据方面具有巨大的优势。这种海量数据可以定义为在云计算平台中数千台普通服务器上PB级的数据。Pregel主要绘制大量网上信息之间关系的“图形数据库”。专注于大型数据中心规模软件平台的加利福尼亚伯克利分校计算机科学教授Arm 阅读全文
posted @ 2012-08-23 14:56 Republist 阅读(508) 评论(0) 推荐(0)

摘要:今天剖析最大化石头堆问题,采用O(n^3)编程,问题不难,但很典型,也有更好的接近O(N^2)的代码进行优化。问题如下:在一个圆形操场的四周摆放着n堆石子。现要将石子有次序地合并成一堆。规定每次只能选相邻的2堆石子合并成新的一堆,并将新的一堆石子数记为该次合并的得分。试设计一个算法,计算出将n堆石子合并成一堆的最大得分。思路剖析:石头堆围成一个圆形操场,每次合并只能合并相邻堆,马上想到典型的邻接问题和菲波纳契数列,属于从局部最优到全局最优,并不断更新最大得分,直到运算完成才出结果。显然,最后的最大得分,并没有将随机输入进行综合考察,进行分布式,而是每一次的最大得分更新,都非常紧凑的依赖于前一次 阅读全文
posted @ 2012-08-17 23:04 Republist 阅读(286) 评论(0) 推荐(0)

摘要:Today I am here to upload and present the code I previously designed to sift out the loops demanded of standing out of the group, the strong branch loops.This set of code runs two dfs detours to get work done.Scenario: Define each item in a graph as "stand", each stand has in and out direc 阅读全文
posted @ 2012-08-16 00:13 Republist 阅读(276) 评论(0) 推荐(0)

摘要:Selected as the "No.1 popular" from the top ten classsic algorithms in the world through web investigation,I spent no more than 2 hours for a breath-retaking tour and detour around the entire Union-Find Algorithm:Here's my break-into-pieces whole analysis:Basic Concept--The inverse for 阅读全文
posted @ 2012-08-14 23:58 Republist 阅读(290) 评论(0) 推荐(0)