03 2020 档案

摘要:TF-IDF算法: TfidfVectorizer()基于TF-IDF算法。此算法包括两部分TF和IDF,两者相乘得到TF-IDF算法。 TF算法统计某训练文本中,某个词的出现次数,计算公式如下: 或 IDF算法,用于调整词频的权重系数,如果一个词越常见,那么分母就越大,逆文档频率就越小越接近0。 阅读全文
posted @ 2020-03-25 18:15 奶妮 阅读(877) 评论(0) 推荐(0)