摘要: 具体算法代码网上有现成的工具类。不一一列举了。我在做某个项目的时候发现LD算法有个弊端。就是对于较大文本(>5w)的相似度计算会特别慢,原因在于LD的计算形式是: LD 可能衡量两字符串的相似性。它们的距离就是一个字符串转换成那一个字符串过程中的添加、删除、修改数值。如果文本变的非常的大可以想象计算 阅读全文
posted @ 2019-12-28 12:03 飘若逸 阅读(567) 评论(0) 推荐(0)