相似度计算

变量s 为三个数据库中的句子

下面三句为用户问的句子

第一个用户提问:KVS找谁申请,系统计算相似度,0.83  ,0, 0  取最大值 第一句即:KVS如何申请

从三个提问可以看出,提问越精确,概率越高。

 

from snownlp import SnowNLP
s = SnowNLP([[u'KVS', u'如何',u'申请'],
[u'这东西', u'好玩'],
[u'没意思']])

print(s.sim([u'KVS', u'找谁',u'申请']))
print(s.sim([u'KVS', u'找你',u'吗']))
print(s.sim([u'KVS', u'找谁',u'开通']))

posted @ 2017-11-22 23:33  Daniel_Lu  阅读(1255)  评论(0编辑  收藏  举报