关于TF-IDF的解释
摘要:
TF:term frequency ,词频 。指的是 term 出现的评率。词频和 2 个因数有关,在一个文档中出现这个词条次数越多,词频越高,文档总词条总数越多这个值被稀释。 所以 一般 TF = 词条在文档出现的次数 / 文档总词数。 IDF:倒排索引的频率。 log ( docment 数量/ 阅读全文
posted @ 2018-10-30 14:59 zhangyukun 阅读(341) 评论(0) 推荐(0)
浙公网安备 33010602011771号