摘要:
集合模型向量空间模型局部敏感哈希minhashsimhash主题模型参考相似性计算常常是聚类分析、数据去重、信息检索以及推荐系统的一个基础工具,这里列举了一些常用的特征提取和相似性计算方法。集合模型基于集合模型的相似度计算可以先使用所谓k-Shingling的办法,对一个句子或者文档做切片,对于中文... 阅读全文
posted @ 2015-11-27 05:54
刺猬的温驯
阅读(489)
评论(0)
推荐(0)
浙公网安备 33010602011771号