摘要:
倒排索引要存哪些信息 提到倒排索引,第一感觉是词到文档列表的映射,实际上,倒排索引需要存储的信息不止词和文档列表。为了使用余弦相似度计算搜索词和文档的相似度,需要计算文档中每个词的 "TF IDF" 值,这样就需要记录词在每个文档中出现的频率以及包含这个词的文档数量,前者需要 阅读全文
posted @ 2017-03-10 20:12
Razzit
阅读(581)
评论(0)
推荐(0)
2014年4月6日
2012年12月25日
2012年12月15日
2012年11月15日
2012年11月1日
2012年10月30日
2012年10月16日
2012年10月6日