代码改变世界

随笔分类 -  算法/理论

【转】TF-IDF算法扫盲2

2010-06-20 00:25 by 码农.KEN, 4123 阅读, 收藏, 编辑
摘要: 本文转载自http://www.mryang.org/logs/45675845.htmlTF-IDF算法是一种简单快捷的文档特征词抽取方法,通过统计文档中的词频来对文档进行主题分类。TF-IDF(term frequency–inverse document frequency)是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文... 阅读全文