博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2013年10月13日

摘要: LDA是主题模型(Topic Model)中较简单的一种,由David Blei在2003年提出[1]。作为一种生成模型(Generative Model),它将文档视为多个Topic的混合,每个Topic可由语料库中词的分布来表示。与另一种类似模型pLSA,最大的不同是LDA假设Topic的分布存在有一个Dirichlet先验分布。作者在论文中提出LDA也遵从Bag-of-Words的假设,但也是可能推广至n-grams... 阅读全文

posted @ 2013-10-13 20:45 虾米服务器开发团队 阅读(734) 评论(0) 推荐(0)