第3章上机实践报告

1、实践题目

7-3 编辑距离问题 (30 分)

2、问题描述

设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括 (1)删除一个字符; (2)插入一个字符; (3)将一个字符改为另一个字符。 将字符串A变换为字符串B所用的最少字符操作数称为字符串A到 B的编辑距离,记为d(A,B)。 对于给定的字符串A和字符串B,计算其编辑距离 d(A,B)。

3、算法描述

★数据输入:输入1组数据。每组数据两行,每行一个字符串。 每个字符串长度不超过2000;

★初始化:开一个二维数组d[i][j]来记录a0-ai与b0-bj之间的编辑距离。首先给定第一行和第一列。dp[0][i],就是说A串是一个空串,而B串是个长度为i的串,很显然A串变为B串就是插入i个字符,即dp[0][i]=i;而dp[i][0] ,就是说A串是个长度为i的串,而B串是一个空串,很显然A串变为B串就是删除i个字符,即dp[i][0]=i。

★计算d[i][j]:定义一个二维数组dp[i][j]表示状态,dp[i][j]表示a的前i个和b的前j个相同后的最短距离。

                     dp[i][j]来自于三种状态

                                1、删除,dp[i-1][j]+1;

                                2、插入,dp[i][j-1]+1;

                                3、替换,if(a[i]==b[j]) dp[i][j]=dp[i-1][j-1],else dp[i][j]=dp[i-1][j-1]+1;

                      然后对于每个值d[i,j]这样计算:d[i][j] = min(d[i-1][j]+1, d[i][j-1]+1, d[i-1][j-1]+(s1[i]==s2[j]?0:1));

★输出:最后一行,最后一列的那个值就是最小编辑距离。即输出dp[la][lb]。

编辑最短距离的部分算法代码可描述如下:

 


int la=strlen(a);
int lb=strlen(b);
for(int i=1;i<=la;i++)
dp[i][0]=i;
for(int j=1;j<=lb;j++)
dp[0][j]=j;
for(int i=1;i<=la;i++)
{
for(int j=1;j<=lb;j++)
{
int insert=dp[i][j-1]+1;
int deletes=dp[i-1][j]+1;
int replace;
if(a[i-1]==b[j-1])
replace=dp[i-1][j-1];
else
replace=dp[i-1][j-1]+1;
dp[i][j]=min(min(insert,deletes),replace);
}
}
cout<<dp[la][lb];

4、算法时间及空间复杂度分析

总的时间复杂度为T(la*lb+la+lb)=O(la*lb) 

开设了dp数组,空间复杂度为O(la * lb)

5、心得体会

一开始我和结对编程的队友对于这道实践题的思路是先利用LCS求最长公共子序列,再在最长公共子序列的基础上求出删除插入替换的最小次数,结果一直纠结在在求LCS的过程中怎么找删除插入的次数,最后我们换了思路,经过很长时间的思考,结合动态规划的一些解题主要步骤,我们终于找到了解题方法,对于两个字符串,如果要将其中一个修改为另外一个,那么只有三种可能:一、把要变换的字符串的最后一个字符删掉;二、把目标字符串的最后一个字符插入到要被变的字符串的最后;三、把两个字符串的右边对齐了,然后看看最后一个字符串是不是一样的。如果是那就不需要任何改变,否则就把原来的字符替换掉。不管是删掉、插入还是替换,修改次数都是1,剩下的一种情况修改次数为0。有难度的地方在于从所得到的矩阵中得出如何进行变换的信息,这个步骤我们想了很久,还好解决了。最后,一定要夸一下动态规划算法实在是太有用了,还要夸一下结对编程的效率实在是太高了,老师真的是位优秀的老师!

posted @ 2018-10-31 23:51  嘉兰  阅读(345)  评论(0编辑  收藏  举报