最大公共子序列 LCS

http://dsqiu.iteye.com/blog/1701541

最长公共子序列

问题描述

最长公共子序列就是寻找两个给定序列的子序列,该子序列在两个序列中以相同的顺序出现,但是不必要是连续的。

动态规划求解

使用动态规划求解这个问题,先寻找最优子结构。设X=<x1,x2,…,xm>和Y=<y1,y2,…,yn>为两个序列,LCS(X,Y)表示X和Y的一个最长公共子序列,可以看出

  1. 如果xm=yn,则LCS ( X,Y ) = xm + LCS ( Xm-1,Yn-1 )。
  2. 如果xm!=yn,则LCS( X,Y )= max{ LCS ( Xm-1, Y ), LCS ( X, Yn-1 ) }

LCS问题也具有重叠子问题性质:为找出X和Y的一个LCS,可能需要找X和Yn-1的一个LCS以及Xm-1和Y的一个LCS。但这两个子问题都包含着找Xm-1和Yn-1的一个LCS,等等。

为了找到最长的LCS,我们定义dp[i][j]记录序列LCS的长度,合法状态的初始值为当序列X的长度为0或Y的长度为0,公共子序列LCS长度为0,即dp[i][j]=0,所以用i和j分别表示序列X的长度和序列Y的长度,状态转移方程为 dp[i][j] = 0 如果i=0或j=0 dp[i][j] = dp[i-1][j-1] + 1 如果X[i-1] = Y[i-1] dp[i][j] = max{ dp[i-1][j], dp[i][j-1] } 如果X[i-1] != Y[i-1] 求出了最长公共子序列的长度后,输出LCS就是输出dp的最优方案了,既可以用一个额外的矩阵存储路径,也可以直接根据状态转移矩阵倒推最优方案。

 复杂度分析:O(n^2)

Cpp代码 复制代码 收藏代码
  1. #include <iostream>   
  2. using namespace std;   
  3.     
  4. /* LCS  
  5.  * 设序列长度都不超过20  
  6. */  
  7.     
  8. int dp[21][21]; /* 存储LCS长度, 下标i,j表示序列X,Y长度 */  
  9. char X[21];   
  10. char Y[21];   
  11. int i, j;   
  12.     
  13. void main()   
  14. {   
  15.     cin.getline(X,20);   
  16.     cin.getline(Y,20);   
  17.     
  18.     int xlen = strlen(X);   
  19.     int ylen = strlen(Y);   
  20.     
  21.     /* dp[0-xlen][0] & dp[0][0-ylen] 都已初始化0 */  
  22.     for(i = 1; i <= xlen; ++i)   
  23.     {   
  24.         for(j = 1; j <= ylen; ++j)   
  25.         {   
  26.             if(X[i-1] == Y[j-1])   
  27.             {   
  28.                 dp[i][j] = dp[i-1][j-1] + 1;   
  29.             }else if(dp[i][j-1] > dp[i-1][j])   
  30.             {   
  31.                 dp[i][j] = dp[i][j-1];   
  32.             }else  
  33.             {   
  34.                 dp[i][j] = dp[i-1][j];   
  35.             }   
  36.         }   
  37.     }   
  38.     printf("len of LCS is: %d\n", dp[xlen][ylen]);   
  39.     
  40.     /* 输出LCS 本来是逆序打印的,可以写一递归函数完成正序打印  
  41.        这里采用的方法是将Y作为临时存储LCS的数组,最后输出Y  
  42.     */  
  43. i = xlen;   
  44. j = ylen;   
  45. int k = dp[i][j];   
  46. char lcs[21] = {'\0'};   
  47. while(i && j)   
  48. {   
  49.   
  50.     if(X[i-1] == Y[j-1] && dp[i][j] == dp[i-1][j-1] + 1)   
  51.   
  52.     {   
  53.   
  54.         lcs[--k] = X[i-1];   
  55.   
  56.         --i; --j;   
  57.   
  58.     }else if(X[i-1] != Y[j-1] && dp[i-1][j] > dp[i][j-1])   
  59.   
  60.     {   
  61.   
  62.         --i;   
  63.   
  64.     }else  
  65.   
  66.     {   
  67.   
  68.         --j;   
  69.   
  70.     }   
  71. }   
  72. printf("%s\n",lcs);   
  73.   
posted @ 2013-08-29 18:00  sandyhit  阅读(54)  评论(0)    收藏  举报