字符串相似度算法(Levenshtein Distance)
摘要:
Levenshtein Distance(LD)算法是比较两字符串的相似性。它们的距离就是一个字符串转换成那一个字符串过程中的添加、删除、修改数值,如果s是源字符串souce,t是目标字符串target,比较s和t是否相似,如下:如果s="test",t="test",那么LD(str1,str2) = 0。没有经过转换。如果s="test",t="tent",那么LD(str1,str2) = 1。str1的"s"转换"n",转换了一个字符,所以是1。如果它们的距离越大,说明它们越不同。Levenshtein distance最先是由俄国科学家Vladimir Levenshtein在196 阅读全文
posted @ 2010-12-05 22:38 ATAK 阅读(413) 评论(0) 推荐(0) 编辑