【LSA推荐算法】简单理解

1：公式

2：实例

2-1：实例文章标题

2-2：每个关键词出现的次数(人为分辨)

2-3:S = T*S*D（也就是上面这个图的分解，公式分辨）

2-4:得出的二维图:（这里做下解释。如果两个文章的夹角越小，那么这两个文章越相似）

2-5:计算相似度：向量模型（将原始数据降为二维空间的数值，再进行公式的计算）

总结：简单的大概步骤为：将数据二值化，接着通过对应的计算相似度公式(比如最常用的余弦定理)去计算值，得到的最大的那一组就是最为相似的一组

posted @ 2020-05-26 17:05 PythonNew_Mr.Wang Views(401) Comments(0) 收藏举报

刷新页面返回顶部