莱文斯坦距离
莱文斯坦距离,又称Levenshtein距离,是编辑距离的一种。指两个字串之间,由一个转成另一个所需的最少编辑操作次数。允许的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
- sitten (k→s)
- sittin (e→i)
- sitting (→g)
俄罗斯科学家弗拉基米尔·莱文斯坦在1965年提出这个概念。
应用
算法
动态规划经常被用来作为这个问题的解决手段之一。
int LevenshteinDistcance(string str1[1..lenStr1], string str2[1..lenStr2])
int d[0..lenStr1, 0..lenStr2]
int i, j, cost
for i = 0 to lenStr1
d[i, 0] := i
for j = 0 to lenStr2
d[0, j] := j
for i = 1 to lenStr1
for j = 1 to lenStr2
if str1[i] = str2[j]
cost := 0
else
cost := 1
d[i, j] := min(
d[i-1, j ] + 1, // 删除
d[i , j-1] + 1, // 插入
d[i-1, j-1] + cost // 替換
)
return d[lenStr1, lenStr2]
我的网站 http://www.a-du.net


浙公网安备 33010602011771号