随笔分类 -  文本相似度

摘要:发现commons-lang 中有实现: StringUtils.class 阅读全文
posted @ 2016-11-02 17:02 风云力 阅读(774) 评论(0) 推荐(0)
摘要:编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符 实现方案: 1. 找出最长公共子串长度 参考代码: apache commons-lang 阅读全文
posted @ 2016-11-02 16:59 风云力 阅读(290) 评论(0) 推荐(0)