摘要: 文章关键词提取最简单经典的算法。首先给出TF-IDF的计算公式:TF-IDF = TF * IDFTF = 文章的某个词频 = 某个词出现的次数 / 所有词出现的总次数IDF = 逆文档频率 = log(语料库的文档总数 / (包含该词的文档数 + 1)) // log函数防止IDF值太小而溢出为0... 阅读全文
posted @ 2015-04-07 21:11 dmJason 阅读(129) 评论(0) 推荐(0)