随笔分类 -  搜索

关注搜索中的相关技术、方案
摘要:BM25的作用 BM25:best matching 在检索中,经常需要计算query与文本的相关性,而BM25就是这样一种算法,它是TF-IDF算法的延申 BM25的计算过程 针对一个query$Q$,切词后包含$q_1$,...,\(q_n\),query与某个文档$D$的BM25分数为: \( 阅读全文
posted @ 2020-11-08 20:57 baishengguan 阅读(354) 评论(0) 推荐(0)
摘要:TF-IDF的作用 TF-IDF用以评估一个字词对于一个文件集或一个语料库中其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。 TF-IDF的 阅读全文
posted @ 2020-11-07 09:38 baishengguan 阅读(279) 评论(0) 推荐(0)