向量空间模型(VSM)
摘要:
向量空间模型将文档映射为一个特征向量V(d)=(t1,ω1(d);…;tn, ωn(d)),其中ti(i=1,2, …,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值, 一般被定义为ti在d中出现频率tfi(d)的函数,即 。 在信息检索中常用的词条权值计算方法为 TF-IDF 函数,其中N为所有文档的数目,ni为含有词条ti的文档数... 阅读全文
posted @ 2009-09-07 16:32 蜗牛与老鹰 阅读(3497) 评论(0) 推荐(2)
浙公网安备 33010602011771号