会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dmJason
博客园
首页
新随笔
联系
订阅
管理
2015年4月7日
tf-idf
摘要: 文章关键词提取最简单经典的算法。首先给出TF-IDF的计算公式:TF-IDF = TF * IDFTF = 文章的某个词频 = 某个词出现的次数 / 所有词出现的总次数IDF = 逆文档频率 = log(语料库的文档总数 / (包含该词的文档数 + 1)) // log函数防止IDF值太小而溢出为0...
阅读全文
posted @ 2015-04-07 21:11 dmJason
阅读(129)
评论(0)
推荐(0)
公告