2013年7月11日

字符串相似度算法 递归与动态规划求解分析

摘要: 1.概念 编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括:(1)将一个字符替换成另一个字符,(2)插入一个字符,(3)删除一个字符。 相似度,等于“编辑距离+1”的倒数。2.分析 设有字符串a[0...n],b[0...m]。 (1)当a[i]=b[j]时,说明这时候不需要编辑操作。编辑距离保持,即f(i,j)=f(i-1,j-1) (2)当a[i]!=b[j]时,可以有三种编辑操作。 其中删除和插入操作,只对一个下标i或者j产生影响。如在下图中,当前匹配到(t1,t2)处,如果采用删除'g',只改变t1的下标。 其中替换操作,会. 阅读全文

posted @ 2013-07-11 14:25 旭东的博客 阅读(4879) 评论(0) 推荐(0)

导航