算法导论-动态规划(最长公共子序列问题LCS)-C++实现

    首先定义一个给定序列的子序列,就是将给定序列中零个或多个元素去掉之后得到的结果,其形式化定义如下:给定一个序列X = <x1,x,..., xm>,另一个序列Z =<z1,z,..., zk> 满足如下条件时称为X的子序列,即存在一个严格递增的X的下标序列<i1,i,..., ik>,对于所有j = 1,2,...,k,满足xij = zj,例如,Z=<B,C,D,B>是X=<A,B,C,B,D,A,B>的子序列,对应的下标序列为<2,3,5,7>。给定两个序列X和Y,如果Z是X的子序列,也是Y的子序列,则称它是X和Y的公共子序列。

   最长公共子序列问题(longest-common-subsequence problem)可用动态规划方法高效地求解。

   步骤1:刻画最长公共子序列的特征

   LCS问题具有 最优子结构性质。子问题的自然分类对应两个输入序列的“前缀"对。"前缀"的定义如下:给定一个序列X = <x1,x,..., xm>,对于i = 0,1,...,m,定义X的第i前缀为Xi = <x1,x,..., xi>。例如,若 X = <A,B,C,B,D,A,B>,则 X4 = <A,B,C,B>,X0为空串。

    令X = <x1,x,..., xm>和Y = <y1,y,..., yn> 为两个序列,Z =<z1,z,..., zk>为X和Y的任意LCS。

  1.     如果Xm = Yn,则 Zk =  Xm = Yn且Zk-1 是Xm-1和Yn-1的一个LCS。
  2.     如果 Xm ≠ Yn,那么Zk ≠  Xm意味着Z是Xm-1和Y的一个LCS。
  3.     如果 Xm ≠ Yn,那么Zk ≠  Yn意味着Z是X和Yn-1的一个LCS。

    步骤2:一个递归解

    很容易看出LCS问题的重叠子问题性质。为了求X和Y的一个LCS,我们可能需要求X和Yn-1的一个LCS及Xm-1和Y的一个LCS。但是这几个子问题都包含求解Xm-1和Yn-1的LCS的子子问题。我们定义c[i,j]表示Xi和Yj的LCS的长度。如果i= 0 或j = 0,即一个序列长度为0,那么LCS的长度为0,根据LCS问题的最优子结构性质,可得如下公式:

     步骤3:计算LCS的长度

    过程LCS-LENGTH接受两个序列X = <x1,x,..., xm>和Y = <y1,y,..., yn>为输入。它将c[i,j]的值保存在表c[0...m,0...n]中,过程还维护一个表b[1...m,1...n],帮助构造最优解。b[i,j]指向的表项对应计算c[i,j]时所选择的子问题最优解。过程返回表b和表c,c[m,n]保存了X和Y的长度。

//伪代码
LCS-LENGTH(X,Y)
m = X.length
n = Y.length
let b[1..m,1..n] and c[0..m,0..n]be new tables
for i = 1 to m
    c[i,0] = 0
for j = 0 to n
    c[0,j] = 0
for i = 1 to m
    for j = 1 to n
    if xi == yi
      c[i,j] = c[i-1,j-1] + 1
      b[i,j] = "\"

    else if c[i-1,j] ≥ c[i,j-1]

      c[i,j] = c[i-1,j]

      b[i,j] = "|"

    else

      c[i,j] = c[i,j-1]

      b[i,j] = "—"

return c and b

下图显示了LCS-LENGTH对输入序列X= <A,B,C,B,D,A,B>和Y=<B,D,C,A,B,A>生成的结果。过程的运行时间为O(mn)。

    步骤4:构造LCS

    利用LCS-LENGTH返回的表b快速构造X和Y的LCS,只需简单地从b[m,n]开始,并按箭头方向追踪下去即可。挡在表项b[i,j]中遇到一个”\"时,意味着xi=yi是LCS的一个元素。下面的递归过程会按正确的顺序打印出X和Y的一个LCS。对它的起始调用为PRINT-LCS(b,X,X.length,Y.length)。

PRINT-LCS(b,X,i,j)

  if == 0 or j==0

    return

  if b[i,j] == "\"

    PRINT-LCS(b,X,i-1,j-1)

    print xi

  else if b[i,j] == "|"

    PRINT-LCS(b,X,i-1,j)

  else

    PRINT-LCS(b,X,i,j-1)

 

实现:

 1 void lcsLength(string x,string y, vector< vector<int>> &c, vector< vector<char>> &b)
 2 {
 3     int m = x.size();
 4     int n = y.size();
 5     c.resize(m+1);
 6     b.resize(m+1);
 7     for(int i = 0; i < c.size(); ++i)
 8         c[i].resize(n+1);
 9     for(int i = 0; i < b.size(); ++i)
10         b[i].resize(n+1);
11 
12     for(int i = 1; i <= m; ++i){
13         for(int j = 1; j <= n; ++j){
14             if(x[i-1] == y[j-1]){
15                 c[i][j] = c[i-1][j-1]+1;
16                 b[i][j] = 'c';
17             }else if(c[i-1][j] >= c[i][j-1]){
18                 c[i][j] = c[i-1][j];
19                 b[i][j] ='u';
20             }else{
21                 c[i][j] = c[i][j-1];
22                 b[i][j] = 'l';
23             }
24         }
25     }
26 }
 1 void print_lcs(vector< vector<char>> &b,string x, int i, int j)
 2 {
 3     if(i == 0 || j == 0)
 4         return;
 5     if(b[i][j] == 'c'){
 6         print_lcs(b,x,i-1,j-1);
 7         cout << x[i-1];
 8     }else if(b[i][j] == 'u')
 9         print_lcs(b,x,i-1,j);
10     else
11         print_lcs(b,x,i,j-1);
12 }

例子:

 1 int main()
 2 {
 3     string x = "ABCBDAB";
 4     string y = "BDCABA";
 5     vector< vector<int>> c;
 6     vector< vector<char>> b;
 7 
 8     lcsLength(x,y,c,b);
 9     print_lcs(b,x,x.size(),y.size());
10 }

输出:

posted @ 2016-07-12 18:50  JessieM  阅读(12921)  评论(0编辑  收藏  举报