摘要:
当一个问题的规模很大时,直接求解往往比较困难。对于这类问题,很大一部分是可以采取分而治之的思想来处理的。 分治法是把问题划分成多个子问题来进行处理。这些子问题,在结构上跟原来的问题一样,但是规模比原来的问题要小。如果得到的子问题还是比较大,那么可以接着细分,一直细分到可以接受的程度为止。这样就可以用迭代的方法,分别求解这些子问题,最后再将子问题的解组合起来,就可以得到原问题的解。分治法的设计原理 对于一个规模为n的问题P(n),可以将它分解成k个规模较小的子问题,这些子问题互相独立,且结构跟原问题的结构相同。在解这些问题的时候,又可以对每一个子问题进行进一步的分解,直到某一个阈值n0时为止。. 阅读全文
posted @ 2012-07-17 19:31
Core Hua
阅读(841)
评论(1)
推荐(1)
摘要:
SAS是现今非常流行的数据分析和数据挖掘软件,想从事数据分析行业,掌握SAS很有必要。虽然SAS本身提供了丰富的人机交互界面,通过手动调用各个Menu能方便地完成数据统计分析的任务,但是,通过代码来调用各个功能模块无疑能为工作带来巨大的灵活性,并显著提高效率。 本文主要是根据网上找到的一个电子文档《SAS语句简介》(可能是某本书的其中一章)以及朱世武老师的《SAS编程技术... 阅读全文
posted @ 2012-07-17 10:48
Core Hua
阅读(14843)
评论(2)
推荐(1)
摘要:
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。s 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为)中。这样每个小文件的大约为300M。s 遍历文件b,采取和a相同的方式将url分别存储到1000各小文件(记为)。这样处理后,所有可能相同的url都在对应的小文件()中,不对应的小文件不可能有相同的url。然后我们只要求出1000对小 阅读全文
posted @ 2012-07-17 10:47
Core Hua
阅读(859)
评论(0)
推荐(0)

浙公网安备 33010602011771号