摘要:
TF-IDF 认为一个单词出现的文本频率越小,它区别不同类别的能力就越大,所以引入了逆文本频度 IDF 的概念:以 TF 和 IDF 的乘积作为特征空间坐标系的取值测度。 Wi 表示第 i 个特征词的权重,TFi(t,d) 表示词 t 在文档 d 中的出现频率,N 表示总的文档数,DF(t) 表示包 阅读全文
posted @ 2019-07-24 14:08
luckc#
阅读(1051)
评论(0)
推荐(0)


浙公网安备 33010602011771号