• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
孙龙 程序员
少时总觉为人易,华年方知立业难
博客园    首页    新随笔    联系   管理    订阅  订阅
2023年8月1日
bm25算法与tf-idf比较,区别,已经使用长江
摘要: bm25算法与tf-idf算法比较 一、tf-idf算法介绍 词频(TF)=某篇文章中某个关键词出现的次数/文章总字数,逆文档频率(IDF) = log(语料库文章总数/包含该关键词的文章总数+1),tfidf=tf*idf,下面给大家举个实例,你大概就明白了,例如语料库中有以下三篇文章: 第一篇: 阅读全文
posted @ 2023-08-01 19:47 孙龙-程序员 阅读(2064) 评论(0) 推荐(1)
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3