摘要:LDA(Latent Dirichlet Allocation)模型是Dirichlet分布的实际应用。 在自然语言处理中,LDA模型及其许多延伸主要用于文本聚类、分类、信息抽取和情感分析等。 例如,我们要对许多新闻按主题进行分类。目前用的比较多的方法是:假设每篇新闻都有一个主题,然后通过分析新闻的
阅读全文
摘要:一、先验概率的定义 假设有随机变量θ,其取值仅为0或1;另有事件X,其取值仅为a或b。 我们又令当θ = 0时,X = a;当θ = 1时,X = b。也就是说,θ的取值决定了X的取值。 现在,我们做一个游戏,游戏要求我们在不知道θ是多少(0或1)的情况下,估计X的值。 怎么办?由于θ的取值决定了X
阅读全文
摘要:一、结合实际应用 之前讲到,当不知道原因的概率的时候,可以选取一种相对灵活的概率分布表示先验概率的分布。 而选取哪种分布往往取决于实际应用或问题是什么。 在继续介绍该如何选取分布类型之前,我们先以一个简单的例子描述一下我们需要解决的问题: 假设有两枚硬币C1和C2,C1硬币抛出正面的概率是0.6,C
阅读全文
摘要:从文本到向量 1 京东速度杠杠的!信任京东!昨晚11:30付的尾款!本来显示的是预计12号送达的!结果下午还是送来了!效率没得说!要的就是这速度!东西看着还不错吧!小巧玲珑的很好看!目前没发现什么问题!我个人觉得这屏幕分辨率太低了点!!不知道这个电子狗功能是不是鸡肋!看上的就是这个功能,希望好用!因
阅读全文