2019年7月8日

NLP传统基础(2)---LDA主题模型---学习文档主题的概率分布(文本分类/聚类)

摘要: 一、简介 https://cloud.tencent.com/developer/article/1058777 1、LDA是一种主题模型 作用:可以将每篇文档的主题以概率分布的形式给出【给定一篇文档,推测其主题分布】。我们的目标是找到每一篇文档的主题分布和每一个主题中词的分布。 从而通过分析一些文 阅读全文

posted @ 2019-07-08 11:47 吱吱了了 阅读(3321) 评论(0) 推荐(0)

NLP传统基础(1)---BM25算法---计算文档和query相关性

摘要: 一、简介:TF-IDF 的改进算法 https://blog.csdn.net/weixin_41090915/article/details/79053584 bm25 是一种用来评价搜索词和文档之间相关性的算法。通俗地说:主要就是计算一个query里面所有词q和文档的相关度,然后再把分数做累加操 阅读全文

posted @ 2019-07-08 11:00 吱吱了了 阅读(3344) 评论(0) 推荐(0)

导航