2012年8月31日

信息检索笔记(10)-Lucene文档评分机制

摘要: Lucene文档评分机制 再论文档评分中提到可以不对所有文档的评分结果排序而直接选出Top K篇文档 计算出文档的得分以后,最后一步就是选出得分最高的K 篇文档呈现给用户。尽管可以先对上述所有得分进行排序然后再挑选出前K 个结果,但是一个更好的方法是通过某种堆结构只返回头K 篇文档。假定余弦相似度(或某种相似度计算方法)得分非零的文档数目是J,那么建立这样的堆结构需要2J 次比较,对于排名前K ... 阅读全文

posted @ 2012-08-31 12:59 God bless you 阅读(2429) 评论(0) 推荐(1) 编辑

导航