算法导论-动态规划(最长公共子序列问题LCS)-C++实现

首先定义一个给定序列的子序列，就是将给定序列中零个或多个元素去掉之后得到的结果，其形式化定义如下：给定一个序列X = <x₁,x₂,..., x_m>，另一个序列Z =<z₁,z₂,..., z_k> 满足如下条件时称为X的子序列，即存在一个严格递增的X的下标序列<i₁,i₂,..., i_k>，对于所有j = 1,2,...,k，满足x_ij = z_j，例如，Z=<B,C,D,B>是X=<A,B,C,B,D,A,B>的子序列，对应的下标序列为<2,3,5,7>。给定两个序列X和Y，如果Z是X的子序列，也是Y的子序列，则称它是X和Y的公共子序列。

最长公共子序列问题(longest-common-subsequence problem)可用动态规划方法高效地求解。

步骤1：刻画最长公共子序列的特征

LCS问题具有最优子结构性质。子问题的自然分类对应两个输入序列的“前缀"对。"前缀"的定义如下：给定一个序列X = <x₁,x₂,..., x_m>，对于i = 0,1,...,m，定义X的第i前缀为X_i = <x₁,x₂,..., x_i>。例如，若 X = <A,B,C,B,D,A,B>，则 X₄= <A,B,C,B>，X₀为空串。

令X = <x₁,x₂,..., x_m>和Y = <y₁,y₂,..., y_n> 为两个序列，Z =<z₁,z₂,..., z_k>为X和Y的任意LCS。

如果X_m = Y_n，则 Z_k = X_m = Y_n且Z_k-1 是X_m-1和Y_n-1的一个LCS。
如果 X_m ≠ Y_n，那么Z_k ≠ X_m意味着Z是X_m-1和Y的一个LCS。
如果 X_m ≠ Y_n，那么Z_k ≠ Y_n意味着Z是X和Y_n-1的一个LCS。

步骤2：一个递归解

很容易看出LCS问题的重叠子问题性质。为了求X和Y的一个LCS，我们可能需要求X和Y_n-1的一个LCS及X_m-1和Y的一个LCS。但是这几个子问题都包含求解X_m-1和Y_n-1的LCS的子子问题。我们定义c[i,j]表示X_i和Y_j的LCS的长度。如果i= 0 或j = 0，即一个序列长度为0，那么LCS的长度为0，根据LCS问题的最优子结构性质，可得如下公式：

步骤3：计算LCS的长度

过程LCS-LENGTH接受两个序列X = <x₁,x₂,..., x_m>和Y = <y₁,y₂,..., y_n>为输入。它将c[i,j]的值保存在表c[0...m,0...n]中，过程还维护一个表b[1...m,1...n]，帮助构造最优解。b[i,j]指向的表项对应计算c[i,j]时所选择的子问题最优解。过程返回表b和表c，c[m,n]保存了X和Y的长度。

//伪代码
LCS-LENGTH(X,Y)
m = X.length
n = Y.length
let b[1..m,1..n] and c[0..m,0..n]be new tables
for i = 1 to m
c[i,0] = 0
for j = 0 to n
c[0,j] = 0
for i = 1 to m
for j = 1 to n
　　　　if xi == yi
　　　　　　c[i,j] = c[i-1,j-1] + 1
　　　　　　b[i,j] = "\"

　　　　else if c[i-1,j] ≥ c[i,j-1]

　　　　　　c[i,j] = c[i-1,j]

　　　　　　b[i,j] = "|"

　　　　else

　　　　　　c[i,j] = c[i,j-1]

　　　　　　b[i,j] = "—"

return c and b

下图显示了LCS-LENGTH对输入序列X= <A,B,C,B,D,A,B>和Y=<B,D,C,A,B,A>生成的结果。过程的运行时间为O(mn)。

步骤4：构造LCS

利用LCS-LENGTH返回的表b快速构造X和Y的LCS,只需简单地从b[m,n]开始，并按箭头方向追踪下去即可。挡在表项b[i,j]中遇到一个”\"时，意味着x_i=y_i是LCS的一个元素。下面的递归过程会按正确的顺序打印出X和Y的一个LCS。对它的起始调用为PRINT-LCS(b,X,X.length,Y.length)。

PRINT-LCS(b,X,i,j)

　　if == 0 or j==0

　　　　return

　　if b[i,j] == "\"

　　　　PRINT-LCS(b,X,i-1,j-1)

　　　　print x_i

　　else if b[i,j] == "|"

　　　　PRINT-LCS(b,X,i-1,j)

　　else

　　　　PRINT-LCS(b,X,i,j-1)

实现：

 1 void lcsLength(string x,string y, vector< vector<int>> &c, vector< vector<char>> &b)
 2 {
 3     int m = x.size();
 4     int n = y.size();
 5     c.resize(m+1);
 6     b.resize(m+1);
 7     for(int i = 0; i < c.size(); ++i)
 8         c[i].resize(n+1);
 9     for(int i = 0; i < b.size(); ++i)
10         b[i].resize(n+1);
11 
12     for(int i = 1; i <= m; ++i){
13         for(int j = 1; j <= n; ++j){
14             if(x[i-1] == y[j-1]){
15                 c[i][j] = c[i-1][j-1]+1;
16                 b[i][j] = 'c';
17             }else if(c[i-1][j] >= c[i][j-1]){
18                 c[i][j] = c[i-1][j];
19                 b[i][j] ='u';
20             }else{
21                 c[i][j] = c[i][j-1];
22                 b[i][j] = 'l';
23             }
24         }
25     }
26 }

 1 void print_lcs(vector< vector<char>> &b,string x, int i, int j)
 2 {
 3     if(i == 0 || j == 0)
 4         return;
 5     if(b[i][j] == 'c'){
 6         print_lcs(b,x,i-1,j-1);
 7         cout << x[i-1];
 8     }else if(b[i][j] == 'u')
 9         print_lcs(b,x,i-1,j);
10     else
11         print_lcs(b,x,i,j-1);
12 }

例子：

 1 int main()
 2 {
 3     string x = "ABCBDAB";
 4     string y = "BDCABA";
 5     vector< vector<int>> c;
 6     vector< vector<char>> b;
 7 
 8     lcsLength(x,y,c,b);
 9     print_lcs(b,x,x.size(),y.size());
10 }

输出：

posted @ 2016-07-12 18:50 JessieM 阅读(12921) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

JessieM

算法导论-动态规划(最长公共子序列问题LCS)-C++实现

公告