会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
xingoo
博客园
首页
管理
2017年12月12日
基于编辑距离来判断词语相似度方法(scala版)
摘要: 词语相似性比较,最容易想到的就是编辑距离,也叫做Levenshtein Distance算法。在Python中是有现成的模块可以帮助做这个的,不过代码也很简单,我这边就用scala实现了一版。 编辑距离 编辑距离是指一个字符串改编成另一个字符串的最短距离,它描述了两个字符串的相近程度。比如: 因此所
阅读全文
posted @ 2017-12-12 17:38 xingoo
阅读(2659)
评论(0)
推荐(2)
编辑
公告