会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
MurphyCheng
博客园
首页
新随笔
联系
订阅
管理
2021年12月9日
逆文档频率IDF
摘要: 1. 没有IDF之前存在的问题 比如TF统计量,停用词“的”在一篇文档中TF值很高,但“的”能代表这篇文档的重点吗?显然不能。因为“的”在很多文档中TF值都很高,具有普遍性,而不能代表某一篇文档的特征。 2. 那么普遍性怎么衡量呢? 看一个term在多少篇文档中出现过。从而有了IDF。 IDF =
阅读全文
posted @ 2021-12-09 13:31 MurphyCheng
阅读(321)
评论(0)
推荐(0)
公告