摘要: TF-IDF 计算公式(一个词的 tf-idf 值在不同文档,它的值也不同): 1、根据已有的原始数据,只展示了前5片文档,content是文档内容,s_words是通过jieba分词将文档划分成了若干个词: 2、统计整个语料库所有词的词频,只计算前5000个高频词的TF-IDF值(因为如果词表太大 阅读全文
posted @ 2022-06-15 14:43 ISGuXing 阅读(748) 评论(0) 推荐(0) 编辑