会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lypbendlf
博客园
首页
新随笔
联系
订阅
管理
LSI潜在语义索引
https://www.jianshu.com/p/28f2bc62a75b
1.定义
利用SVD分解来找到词项-文档矩阵C的某个
低秩逼近
,在这个低秩逼近下能够为文档集中的
每篇文档产生一个新的表示
。同样,查询也可以映射到这个低秩表示的空间,从而可以
基于新的表示
来进行查询和文档的相似度计算。这个过程称为LSI。(潜在语义索引)
LSI通过term-document矩阵的SVD将term和document投影到一个低维的空间中,在这个过程中丢弃了一些影响比较小(小的奇异值)的信息,这些信息可能是噪声。
posted @
2020-11-07 16:54
lypbendlf
阅读(
144
) 评论(
0
)
收藏
举报
刷新页面
返回顶部
公告