概率论杂记

摘要:

  1.本福特定律

  2.商品推荐的惊喜度

  3.贝叶斯学派和频率学派

  4.指数分布族

  5.期望

  6.方差

  7.协方差

  8.皮尔逊相关系数

  9.概率(联合概率,条件概率,后验概率,贝叶斯公式,全概率公式,独立,条件独立。。。)待续。。。

内容:

1.本福特定律

github代码部分 

 

2.商品推荐的惊喜度:

商品推荐场景中过于聚集的商品推荐往往会损害用户体验,在有些场景中,系统会通过一定程度的随机性给用户带来发现的惊喜度。假设A,B商品与当前用户的匹配度分别为0.8,0.2,系统将随机为A生成一个均匀分布于0到0.8的最终得分,为B生成一个0到0.2的得分,问终B的得分大于A的得分的概率?

 

3.贝叶斯学派和频率学派(参数空间,统计推断):

贝叶斯学派:假定参数本身是变化的,服从某个分布。求在这个分布约束下使得某目标函数极大/极小(贝叶斯模型)

频率学派:假定参数是某个/某些未知的定值,求这些参数如何取值,能够使得某目标函数取极大/极小(矩估计,似然估计,最大熵,期望最大化等)

扩展:知乎问答

 

4.指数分布族:

注:验证高斯分布属于指数分布族

 

5.期望(expectation)

概率加权下的平均值

 

X的函数的期望:

 设Y是随机变量X的函数clip_image041(g是连续函数),那么

    (1) X是离散型随机变量,它的分布律为clip_image043,k=1,2,…。若clip_image045绝对收敛,则有clip_image047

      (2) X是连续型随机变量,它的概率密度为clip_image049,若clip_image051绝对收敛,则有clip_image053

 

 

阿里试题1:从1,2,3,...,98,99,1024这100个数中任意选择若干个数求异或,则异或的期望值是什么?

解:若干个数异或,只有当某位取奇数个1时第i位才为1,故此题只要考虑各个位数取1的概率即可

1024的二进制表示为100,0000,0000,明显这里第7,8,9位不为1,,而其余99个数也取不到这3位,则有 

而对于其余位,有如下计算:

 

阿里试题2:

由二项分布的期望,有np=1,得S的元素个数是1024

 

6.方差:

 

7.协方差:

协方差矩阵式对称阵

 

8.相关系数

扩展:常见的距离算法和相似度(相关系数)计算方法

 

posted @ 2017-01-08 18:05  混沌战神阿瑞斯  阅读(625)  评论(0编辑  收藏  举报