TF-IDF模型

TF-IDF(Term Frequency-Inverse DocumentFrequency, 词频-逆文件频率),一种用于资讯检索和资讯探勘的常用加权技术。

词项t的词项频率(以下简称词频)tft,d是指词项t在文档d中出现的次数,是与文档相关的一个量,可以认为是文档内代表度的一个量,也可以认为是一种局部信息。

 

posted @ 2019-09-27 10:54  ddfs  阅读(257)  评论(0)    收藏  举报