摘要: 算法原理 在计算文本的相似性时,经常会用到编辑距离。编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。通常来说,编辑距离越小,两个文本的相似性越大。这里的编辑操作主要包括三种: 插入:将一个字符插入某个字符串; 删除:将字符串中的某个字符删除; 替换 阅读全文
posted @ 2020-05-31 21:47 火热的茶独独 阅读(5839) 评论(0) 推荐(0)