趣味编程之计算相亲数(上)

一直想写这篇关于算法的文章，但是由于看到园子里众多研究算法的高手让我一直没有决心写下来，但高手归高手，不是高手也可以写出来让高手们拍砖，所以今天就在这里献丑了。相亲数和完全数作为数学问题的确是顶级难题，可是拿来做娱乐就不同了，从刚接触编程时C语言书上的课后习题到两年前的Intel多核编程大赛，这个题目一直伴随着我们，让我们来娱乐一下吧。

简单说一下概念，相亲数是指两个正整数中，彼此的全部约数之和（本身除外）与另一方相等。举例来说：

220的全部约数(除掉本身)相加是：1+2+4+5+10+11+20+22+44+55+110=284

284的全部约数(除掉本身)相加的和是：1+2+4+71+142=220

所以220和284就是一对相亲数。

那什么是完全数呢？即它所有的真因子（即除了自身以外的约数）的和恰好等于它本身。例如：

第一个完全数是6，它有约数1、2、3、6，除去它本身6外，其余3个数相加，1+2+3=6

第二个完全数是28，它有约数1、2、4、7、14、28，除去它本身28外，其余5个数相加，1+2+4+7+14=28

概念不多说了，直接上算法。

算法一：直接计算约数之和

这是最直接的方式了，循环计算所有可能成为约数的数字然后加和，直接到不用做过多的解释，只要会写程序，用任何语言都能实现！

  1: /// <summary>
  2: /// 直接计算约数之和(串行)
  3: /// </summary>
  4: public class Algorithm1
  5: {
  6:     private int GetSum(int num)
  7:     {
  8:         int sum = 1;
  9:         int limit = (int)Math.Sqrt(num);
 10:         for (int i = 2; i <= limit; i++)
 11:             if (num % i == 0) sum += i + num / i;
 12:         return sum;
 13:     }
 14: 
 15:     public void Run(int from, int to)
 16:     {
 17:         int perfertCount = 0;
 18:         int amicablePairCount = 0;
 19:         for (int num = from; num <= to; num++)
 20:         {
 21:             int sum1 = this.GetSum(num);
 22:             if (sum1 == num)
 23:             {
 24:                 Console.WriteLine("{0}是完全数", num);
 25:                 perfertCount++;
 26:             }
 27:             if (sum1 > num)
 28:             {
 29:                 int sum2 = this.GetSum(sum1);
 30:                 if (sum2 == num)
 31:                 {
 32:                     Console.WriteLine("{0}和{1}是一对相亲数", sum1, sum2);
 33:                     amicablePairCount++;
 34:                 }
 35:             }
 36:         }
 37:         Console.WriteLine("在{0}到{1}中共有{2}个完全数和{3}对相亲数", from, to, perfertCount, amicablePairCount);
 38:     }
 39: }

测试代码，从2计算到5000000：

  1: static void Main(string[] args)
  2: {
  3:     var stopwatch = Stopwatch.StartNew();
  4:     Algorithm1 algorithm = new Algorithm1();
  5:     algorithm.Run(2, 5000000);
  6:     stopwatch.Stop();
  7:     Console.WriteLine("计算完成共花费{0}秒", stopwatch.Elapsed.TotalSeconds);
  8:     Console.ReadKey();
  9: }

在我的ThinkPad R400上测试运行时间大概在51秒左右，速度能不能再提高呢，让我们看看.Net4.0为我们带来的并行计算的新特性表现如何。

  1: /// <summary>
  2: /// 直接计算约数之和(并行)
  3: /// </summary>
  4: public class Algorithm2
  5: {
  6:     private int GetSum(int num)
  7:     {
  8:         int sum = 1;
  9:         int limit = (int)Math.Sqrt(num);
 10:         for (int i = 2; i <= limit; i++)
 11:             if (num % i == 0) sum += i + num / i;
 12:         return sum;
 13:     }
 14: 
 15:     public void Run(int from, int to)
 16:     {
 17:         int perfertCount = 0;
 18:         int amicablePairCount = 0;
 19:         Parallel.For(from, to, num =>
 20:         {
 21:             int sum1 = this.GetSum(num);
 22:             if (sum1 == num)
 23:             {
 24:                 Console.WriteLine("{0}是完全数", num);
 25:                 perfertCount++;
 26:             }
 27:             if (sum1 > num)
 28:             {
 29:                 int sum2 = this.GetSum(sum1);
 30:                 if (sum2 == num)
 31:                 {
 32:                     Console.WriteLine("{0}和{1}是一对相亲数", sum1, sum2);
 33:                     amicablePairCount++;
 34:                 }
 35:             }
 36:         });
 37:         Console.WriteLine("在{0}到{1}中共有{2}个完全数和{3}对相亲数", from, to, perfertCount, amicablePairCount);
 38:     }
 39: }

注意第19行，我们使用System.Threading.Tasks下的Parallel类取代传统的for循环，由于在该算法中每一次计算都是独立的，所以很适合并行，废话不多说，直接运行看结果，运行时间在26秒左右，由于我的机器是双核，所以同样是从2计算到5000000，并行的时间差不多是之前的(51秒)一半，看来Parallel真是不错的新工具啊！当然，这个是从技术上达到了速度的提升，算法本质还没有变，那能不能从算法本身提高计算效率呢？答案当然是肯定的！

算法二：通过计算所有质因数来计算约数之和

先说一下原理：记得小学的奥赛有一个题型是计算一个自然数的约数的个数(现在还有没有不清楚)，截法很简单，先分解质因数，然后把所有质因子的幂加一再相乘就是约数的个数，例如数字36=2^2×3^2，那么36就有(2+1)×(2+1)=9个约数(1,2,3,4,6,9,12,18,36)。其实能算出有9个约数，自然可以计算9个约数是什么，是2个2和2个3排列组合的结果，剩下的就不用我废话了，该算法的思路就是先分解质因数然后在逐个计算约数并加和，上代码：

  1: /// <summary>
  2: /// 通过计算所有质因数来计算约数之和（串行）
  3: /// </summary>
  4: public class Algorithm3
  5: {
  6:     private int GetNextFactor(int num)
  7:     {
  8:         int limit = (int)(Math.Sqrt(num));
  9:         for (int i = 2; i <= limit; i++)
 10:             if (num % i == 0)
 11:                 return i;
 12:         return num;
 13:     }
 14:     private List<int> Decomposition(int num)
 15:     {
 16:         var factors = new List<int>();
 17:         while (true)
 18:         {
 19:             var divisor = GetNextFactor(num);
 20:             factors.Add(divisor);
 21:             if (divisor == num) break;
 22:             num = num / divisor;
 23:         }
 24:         return factors;
 25:     }
 26:     private int Sum(List<int> divisors)
 27:     {
 28:         int sum = 0;
 29:         for (int i = 0, count = divisors.Count - 1; i < count; i++)
 30:             sum += divisors[i];
 31:         return sum;
 32:     }
 33:     private int GetSum(List<int> factors)
 34:     {
 35:         if (factors.Count == 1) return 1;//质数
 36:         var divisors = new List<int>() { 1 };
 37:         var factorPows = new List<List<int>>() { new List<int>() { factors[0] } };
 38:         for (int i = 1, count = factors.Count; i < count; i++)
 39:         {
 40:             var length = factorPows.Count;
 41:             if (factors[i] == factorPows[length - 1][0])
 42:                 factorPows[length - 1].Add(Convert.ToInt32(Math.Pow(Convert.ToDouble(factors[i]), Convert.ToDouble(factorPows[length - 1].Count + 1))));
 43:             else
 44:                 factorPows.Add(new List<int>() { factors[i] });
 45:         }
 46:         for (int f = 0, fCount = factorPows.Count; f < fCount; f++)
 47:             for (int d = 0, dCount = divisors.Count; d < dCount; d++)
 48:                 for (int p = 0, pCount = factorPows[f].Count; p < pCount; p++)
 49:                     divisors.Add(divisors[d] * factorPows[f][p]);
 50:         return Sum(divisors);
 51:     }
 52:     public void Run(int from, int to)
 53:     {
 54:         int perfertCount = 0;
 55:         int amicablePairCount = 0;
 56:         for (var num = from; num < to; num++)
 57:         {
 58:             int sum1 = this.GetSum(Decomposition(num));
 59:             if (sum1 == num)
 60:             {
 61:                 Console.WriteLine("{0}是完全数", num);
 62:                 perfertCount++;
 63:             }
 64:             if (sum1 > num)
 65:             {
 66:                 int sum2 = this.GetSum(Decomposition(sum1));
 67:                 if (sum2 == num)
 68:                 {
 69:                     Console.WriteLine("{0}和{1}是一对相亲数", sum1, sum2);
 70:                     amicablePairCount++;
 71:                 }
 72:             }
 73:         }
 74:         Console.WriteLine("在{0}到{1}中共有{2}个完全数和{3}对相亲数", from, to, perfertCount, amicablePairCount);
 75:     }
 76: }

先看速度如何，是否比算法一更快，从2计算到5000000花费近27秒，几乎与算法一的并行版本接近，果然快很多，那么快在哪里了呢？算法一做了大量的取模和除法操作，相比于加、减、乘等操作这些操作都是很耗时的，而算法二先计算质因数，减少了很多取模和除法操作，取而代之的是很多乘法和指数运算，性能自然得到提升，但还算细心的我并没有就此下结论，我把计算范围缩小到2到100000，此时，算法一花费时间是0.18秒而算法而则是0.36秒，算法一反而取胜了，其实道理很简单，随着数字的增大，算法一计算取模和除法的操作增加也不断增加，而算法二随着数字增大计算次数却增加不明显，因为分解质因数其实是找质数的过程，但找到第一个质因数后，数字就变小了，计算量并没增加多少，相反，找到的质因数越多，计算约数的计算量就越大，所以在数字不大(相对不大)的领域里，试商次数不多所以算法一很快完成了计算，而算法二相对于算法一的却没什么太大优势，但随着数字的变大，算法二的优势会越来越明显！例如我从5000000计算到5500000，算法一就豪无优势了，落后算法二一半都不止，这让我想起了一个古老的但却众所周知的梵塔问题，算法一就是这样一个梵塔……

当然我也没忘记把这个算法改成并行版本，我就不贴代码了，只要改第56行的for就可以了，从2计算到5000000花费在16秒左右，这样我们已经从最初的51秒降低到16秒，还能更快吗？我绞尽脑汁暂时还没什么结果，因为我发现最后所花的时间都是在寻找质数上了，难怪数学界的顶级难题都跟质数有关或者围绕质数展开，还有我们程序员熟悉的加密算法RSA，也是基于大整数难以分解的“特性”上，如果不幸被我找到了快速分解算法我就不用在这写博客啦，扯远了，还是回归娱乐吧，我们还有没有办法让它再快点呢？

算法二SP1：之所以叫SP1是因为它并没有本质上的更改，只是在外围让它显得更快。话说算法界有两大秘籍，九阴真经和九阳神功——都不是，开个玩笑，其实没什么秘籍，而是方法论，无非就是时间换空间和空间换时间，根据我们的需要，时间和空间在我们的代码中转换来转换去，既然我追求的是速度，那自然是用空间来换时间喽。

算法一我还没想到哪里可以用空间来换取速度，倒是在对算法二的研究过程中我意识到大量的重复计算，最典型的是计算质数，如果缓存这些质数速度会不会快一些呢，其实是废话当然会快，花了空间速度还没提升的事情谁会愿意做呢，但仅仅缓存质数远远不够，因为最大量的计算根本不在这里，如果连续的看待分解的过程，你就会发现它是一个递归的过程，之前的计算结果对后面很有用，比如我们已经分解了36=2^2×3^2。那么当我们分解72的时候是怎样的过程呢，先找到了第一个因子2，然后得到36，继续分解，36的分解过程又做一次，重复量可想而知，有人说，你把2^2×3^2记录下来，在计算72的时候直接利用36的计算结果，说的没错，但我记录的信息是不是太大了，空间也不是这么挥霍的啊，于是我权衡再三，采用了下面的算法，先看代码：

  1: /// <summary>
  2: /// 通过计算所有质因数来计算约数之和（空间算法）
  3: /// </summary>
  4: public class Algorithm5
  5: {
  6:     public List<int> primeList = new List<int>();
  7:     public int[] firstFactorList;
  8:     public int[] remainingList;
  9:     public int[] resultList;
 10:     public int GetNextFactor(int num)
 11:     {
 12:         var max = (int)Math.Sqrt(num);
 13:         for (int i = 0; i < primeList.Count; i++)
 14:         {
 15:             var p = primeList[i];
 16:             if (p > max) break;
 17:             if (num % p == 0)
 18:                 return p;
 19:         }
 20:         primeList.Add(num);
 21:         return num;
 22:     }
 23:     public List<int> Decomposition(int num)
 24:     {
 25:         var divisors = new List<int>();
 26:         var factor = firstFactorList[num] = GetNextFactor(num);
 27:         if (factor == num)
 28:             remainingList[num] = 1;
 29:         else
 30:             remainingList[num] = num / firstFactorList[num];
 31:         while (true)
 32:         {
 33:             divisors.Add(firstFactorList[num]);
 34:             if (remainingList[num] == 1) break;
 35:             num = remainingList[num];
 36:         }
 37:         return divisors;
 38:     }
 39:     private int Sum(List<int> divisors)
 40:     {
 41:         int sum = 0;
 42:         for (int i = 0, count = divisors.Count - 1; i < count; i++)
 43:             sum += divisors[i];
 44:         return sum;
 45:     }
 46:     public int GetSum(List<int> factors)
 47:     {
 48:         if (factors.Count == 1) return 1;//质数
 49:         var divisors = new List<int>() { 1 };
 50:         var factorPows = new List<List<int>>() { new List<int>() { factors[0] } };
 51:         for (int i = 1, count = factors.Count; i < count; i++)
 52:         {
 53:             var length = factorPows.Count;
 54:             if (factors[i] == factorPows[length - 1][0])
 55:                 factorPows[length - 1].Add(Convert.ToInt32(Math.Pow(Convert.ToDouble(factors[i]), Convert.ToDouble(factorPows[length - 1].Count + 1))));
 56:             else
 57:                 factorPows.Add(new List<int>() { factors[i] });
 58:         }
 59:         for (int f = 0, fCount = factorPows.Count; f < fCount; f++)
 60:             for (int d = 0, dCount = divisors.Count; d < dCount; d++)
 61:                 for (int p = 0, pCount = factorPows[f].Count; p < pCount; p++)
 62:                     divisors.Add(divisors[d] * factorPows[f][p]);
 63:         return Sum(divisors);
 64:     }
 65:     public void Run(int limit)
 66:     {
 67:         firstFactorList = new int[limit];
 68:         remainingList = new int[limit];
 69:         resultList = new int[limit];
 70:         int perfertCount = 0;
 71:         int amicablePairCount = 0;
 72:         for (var num = 2; num < limit; num++)
 73:         {
 74:             var result = resultList[num] = this.GetSum(Decomposition(num));
 75:             if (result == num)
 76:             {
 77:                 Console.WriteLine("{0}是完全数", num);
 78:                 perfertCount++;
 79:             }
 80:             else if (result < num && resultList[result] == num)
 81:             {
 82:                 Console.WriteLine("{0}和{1}是一对相亲数", result, num);
 83:                 amicablePairCount++;
 84:             }
 85:         }
 86:         Console.WriteLine("在{0}到{1}中至少有{2}个完全数和{3}对相亲数", 2, limit, perfertCount, amicablePairCount);
 87:     }
 88: }

我缓存了质数，每个数字的第一个因子和剩余因子的乘积以及每个数字的约数和，代码之所以没有注释是因为我写不清楚，给大家举个例子，大家再对照代码看就好：比如分解72，先找到它的第一个因子2，和剩余因子的乘积36(其实就是72/2)，然后缓存2和36做为72对应的缓存变量，然后在缓存列表中找到36的第一个因子(因为之前已经计算过)，也是2，然后看看36剩余因子的乘积是18有找到了18的第一个因子9……就这样利用了原来的结果，把取模和除法变成了查(缓存)表，这样无疑有个弊端，我们不能从中间开始算了，必须从2开始计算，先不管了，看看速度再说，从2计算到5000000花费了13秒左右，注意这里计算次数跟之前不一样，之前的算法是算到5000000，但可以超过5000000，而现在是只算到5000000，不管怎样，速度比并行版本的算法二还要快一些(前提是从2开始计算)，缓存的效果不错哦，不过内存也被吃去大片，空间换时间的代价……

算法二SP2：本来以上就是我要记录的全部内容，但由于迟迟未成文，所以最近我又发现一个“超级”快速的空间换时间的算法，比SP1快很多，请允许我先卖一个关子，先公布结果，从2计算到5000000只需要2.8秒，具体实现且听下回分解……(无耻的淫笑)

后记：郑重声明，本贴纯属娱乐帖，很多代码并没有在细节性能上过多纠缠(比如Math.Sqrt的性能还有提升空间，List申请空间处的性能提升等等……)，另外卖关子不是吊胃口，而是要说明这个SP2算法所花费的篇幅可能比较长，实在写不动了，就卖了一个关子，小弟会尽快完成下一篇，敬请期待！不过通过把这篇文章写出来(很多代码多年前就写好了)还是感触颇深的，我们面对一个问题，可以从多个角度去分析优化解决，可以从根本上想办法(算法本身)，也可以找工具(并行)，还可以在外围和结构等方面想办法(缓存……)，只要我们不停的思考，从多个角度想办法，总会有些手段给我们利用。最后，不知大家是不是也研究过此类问题，或许您有更好的算法，无论是出于兴趣还是其它，欢迎一起讨论and拍砖。

希望本文对您有帮助(完整代码下篇一起提供)。

posted @ 2010-08-22 15:16 devil0153 阅读(2874) 评论(5) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

趣味编程之计算相亲数(上)

公告