会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ISGuXing
路途很艰辛,但是也很有趣。 千里之行,始于足下~
博客园
首页
新随笔
联系
订阅
管理
2022年6月15日
python、numpy计算不同文档下的词的TF-IDF值以及进行文档相似度匹配(实战)
摘要: TF-IDF 计算公式(一个词的 tf-idf 值在不同文档,它的值也不同): 1、根据已有的原始数据,只展示了前5片文档,content是文档内容,s_words是通过jieba分词将文档划分成了若干个词: 2、统计整个语料库所有词的词频,只计算前5000个高频词的TF-IDF值(因为如果词表太大
阅读全文
posted @ 2022-06-15 14:43 ISGuXing
阅读(795)
评论(0)
推荐(0)
编辑
公告