摘要: [本文链接:http://www.cnblogs.com/breezedeus/archive/2013/01/20/2868930.html,转载请注明出处。]LDA是个generative model,它首先从Dirichlet分布Dir(β)中抽取每个topic对应的参数,然后语料集D中第j篇文档的产生方式如下:1. 选择文档长度: N ~ Poission(ξ) ;2. 选择文档参数: θ ~ Dir(α) ;3. 按照以下方式选取文档中的每个词: (a) 选择一个topic: (b) 从W个词中选取出此词:LDA的图表示如下,其中z、θ和Φ为隐藏变量,α和β为超参数。利用上面LDA的 阅读全文
posted @ 2013-01-20 21:54 BreezeDeus 阅读(15563) 评论(2) 推荐(0) 编辑