摘要:
如果有两类随机变量X和Y,由某个联合分布中可以采样(X,Y)。根据采样可以估算互信息H(Y|X),相信很多人都会。但是,这样的户信息是否有意义呢?现在来看,至少存在两个问题:1. 计算户信息需要得到联合分布或条件分布,而用样本来估计分布会有天然的误差;2. X或Y可能不是合适的状态的定义。第1条比较简单,已经有若干方法可以解决,如加入先验Beta分布。第2条是什么意思呢?比如某个用户u访问了一个页面p,我们可以用这个页面的ID来代表这个页面,用用户的cookie来代表用户,进而计算互信息(不限于互信息,还可以是其它反映u和p之间的correlation的量)。在这种情况下,我们可以通过U和P的 阅读全文
posted @ 2013-11-12 13:18
潘多拉盒子
阅读(324)
评论(0)
推荐(0)
浙公网安备 33010602011771号