正态分布高阶矩与完全图k匹配方案数的联系

0.前言

在学习正态分布时,我们会学到高阶矩的递推公式,其证明可以用分部积分完成。

假如我们把参数 \(\mu\)\(\sigma\) 看做占位符,那么高阶矩实际上可以看做是一个二元生成函数。

将这个二元生成函数的三角系数输入到 OEIS 中,推荐的第一条内容就是完全图k匹配方案数的三角系数,OEIS 给出这个三角系数的名字叫贝塞尔数(但是并没有在简中互联网找到这个名称)。

本文将深入研究两者之间的联系。

1.正态分布的高阶矩

设随机变量 \(X\) 符合高斯分布 \(\mathscr{N}(\mu,\sigma^2)\),则其 \(k\) 阶矩满足递推公式:

\[E[X^{k}]=\mu E[X^{k-1}]+(k-1)\sigma^2E[X^{k-2}] \]

其中递推初值为 \(E[X^{0}]=1, E[X^{1}]=\mu\)

证明

利用分部积分即可证明。

\[\begin{aligned} E[X^{n-1}]&=\int_{-\infty}^{+\infty}x^{n-1}\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-\mu)^2}{2\sigma^2}}\text{d}x\\\\ &=\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-\mu)^2}{2\sigma^2}}\text{d}\frac{x^{n}}{n}\\\\ &=[\frac{x^{n}}{n}\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-\mu)^2}{2\sigma^2}}]|_{x=-\infty}^{+\infty}-\int_{-\infty}^{+\infty}\frac{x^{n}}{n}\text{d}\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-\mu)^2}{2\sigma^2}}\\\\ &=0-\int_{-\infty}^{+\infty}\frac{x^{n}}{n}\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-\mu)^2}{2\sigma^2}}\cdot\frac{\mu-x}{\sigma^2}\text{d}x\\\\ &=-\frac{\mu}{n\sigma^2}\int_{-\infty}^{+\infty}x^{n}\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-\mu)^2}{2\sigma^2}}\text{d}x+\frac{1}{n\sigma^2}\int_{-\infty}^{+\infty}x^{n+1}\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-\mu)^2}{2\sigma^2}}\text{d}x\\\\ &=-\frac{\mu E[X^n]}{n\sigma^2}+\frac{E[X^{n+1}]}{n\sigma^2}\\\\ \end{aligned} \]

2.完全图k匹配方案数

对于 \(n\) 个点的完全图 \(K_{n}\),它的 \(k\) 匹配方案数 \(B(n, k)\) 满足计算式:

\[B(n, k)= \begin{cases} \frac{n!}{k!(n-2k)!2^{k}}, & 0\leq k\leq \lfloor\frac{n}{2}\rfloor\\\\ 0, & \text{otherwise} \end{cases} \]

证明 (组合意义)

先选出匹配集中的点:\(C_{n}^{2k}\)

然后把匹配集分成两个大小为 \(k\) 的集合:\(C_{2k}^{k}\)

每个左部点任意匹配右部点:\(k!\)

容易发现每个匹配方案被重复计算了 \(2^k\) 次,所以答案即为 \(\frac{C_{n}^{2k}C_{2k}^{k}k!}{2^k}\),化简后即为给出的计算式。

3.联系

观察 \(E[X^k]\) 这个二元生成函数的形式:

\[\begin{aligned} E[X^0]&=1\\\\ E[X^1]&=\mu\\\\ E[X^2]&=\mu^2+\sigma^2\\\\ E[X^3]&=\mu^3+3\mu\sigma^2\\\\ \end{aligned} \]

容易归纳得到 \(E[X^k]\) 的形式:

\[E[X^k]=\sum_{i=0}^{k}a_{k, i}\mu^i\sigma^{k-i} \]

根据生成函数的递推式我们可以得到三角系数的递推式:

\[a_{k, i}=a_{k-1, i-1}+(k-1)a_{k-2, i} \]

其递推初值为 \(a_{0,0}=1, a_{1, 0}=0, a_{1, 1}=1\)

做一个下标偏移:\(a_{k, i}=b_{k, \frac{k-i}{2}}\) (容易观察到只有 \(k\)\(i\) 奇偶性相同的项非0)。

我们重写递推式:

\[b_{k, i}=b_{k-1, i}+(k-1)b_{k-2, i-1} \]

其递推初值为 \(b_{0,0}=1, b_{1, 0}=1\)

此时我们回过头来,考虑用递推的方式推导完全图k匹配方案数:

  • 假设我们要计算 \(K_{k}\)\(i\) 匹配方案数 \(B(k, i)\)

  • 进行分类:\(k\) 号点不在匹配集/\(k\) 号点在匹配集。

  • \(k\) 号点不在匹配集

    • 这部分的方案数为 \(B(k-1, i)\)
  • \(k\) 号点在匹配集

    • \(k\) 号点匹配的方案有 \((k-1)\) 种,我们需要在未匹配点形成的导出子图中再找 \((i-1)\) 个匹配。

    • 所以这部分的方案数为 \((k-1)B(k-2, i-1)\)

  • 所以 \(B(k, i)=B(k-1, i)+(k-1)B(k-2, i-1)\)

至此,我们得到了两者之间的联系:\(a_{k, i}=B(k, \frac{k-i}{2})\)

4.总结

我们在两个看似完全没有关系的问题之间找到了神秘的联系。

可以发现,整个推导过程与组合意义紧密相连,这启发我们在寻找联系时从组合意义思考是一个很好的方向。

笔者暂时没有想到这个东西更多的应用。

5.Reference

[香港科技大学(广州)] 本科课程 UFUG2104-Applied Statistics

[OEIS] A100861

posted @ 2025-04-02 20:31  Displace  阅读(97)  评论(1)    收藏  举报