特征权重量化 TF-IDF 用于信息检索和数据挖掘的加权技术
摘要:
TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF逆向文件频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。T... 阅读全文
posted @ 2015-12-05 19:44
不做圣人做神人
阅读(381)
评论(0)
推荐(0)