摘要:
bm25算法与tf-idf算法比较 一、tf-idf算法介绍 词频(TF)=某篇文章中某个关键词出现的次数/文章总字数,逆文档频率(IDF) = log(语料库文章总数/包含该关键词的文章总数+1),tfidf=tf*idf,下面给大家举个实例,你大概就明白了,例如语料库中有以下三篇文章: 第一篇: 阅读全文
posted @ 2023-08-01 19:47
孙龙-程序员
阅读(2063)
评论(0)
推荐(1)
浙公网安备 33010602011771号