会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
飘若逸
博客园
首页
新随笔
联系
订阅
管理
2019年12月28日
关于文本相似度-LD算法和余弦算法的比较
摘要: 具体算法代码网上有现成的工具类。不一一列举了。我在做某个项目的时候发现LD算法有个弊端。就是对于较大文本(>5w)的相似度计算会特别慢,原因在于LD的计算形式是: LD 可能衡量两字符串的相似性。它们的距离就是一个字符串转换成那一个字符串过程中的添加、删除、修改数值。如果文本变的非常的大可以想象计算
阅读全文
posted @ 2019-12-28 12:03 飘若逸
阅读(567)
评论(0)
推荐(0)
公告