摘要: TF-IDF算法可用来提取文档的关键词,关键词在文本聚类、文本分类、文献检索、自动文摘等方面有着重要应用。 算法原理 TF:Term Frequency,词频 IDF:Inverse Document Frequency,逆文档频率 词频(TF):某一个词在该文件中出现的频率 计算方法为: 逆文档频 阅读全文
posted @ 2019-07-01 00:42 一个芝麻糕 阅读(2442) 评论(0) 推荐(0)