2018年10月30日

关于TF-IDF的解释

摘要: TF:term frequency ,词频 。指的是 term 出现的评率。词频和 2 个因数有关,在一个文档中出现这个词条次数越多,词频越高,文档总词条总数越多这个值被稀释。 所以 一般 TF = 词条在文档出现的次数 / 文档总词数。 IDF:倒排索引的频率。 log ( docment 数量/ 阅读全文

posted @ 2018-10-30 14:59 zhangyukun 阅读(341) 评论(0) 推荐(0)

导航