概率论与数理统计

1 公式

1.1 条件概率

\[\begin{aligned} 条件概率 &\quad P(A|B)=\dfrac{P(AB)}{P(B)}\\ 乘法公式 &\quad P(AB)=P(A)P(B|A)=P(A|B)P(B)\\ 全概率公式 &\quad P(A)=\sum P(A|B_i) P(B_i)\\ 贝叶斯公式 &\quad P(B_i|A)=\dfrac{P(B_iA)}{P(A)}=\dfrac{P(A|B_i)P(B_i)}{\sum P(A|B_j) P(B_j)}\\ \end{aligned} \]

1.2 常见分布

\[\begin{aligned} 0-1分布 &\quad P(X=k)=p^k(1-p)^{1-k}\\ 二项分布B(n,p) &\quad P(X=k)=C^k_n p^k (1-p)^{n-k}\\ 泊松分布P(\lambda) &\quad P(X=k)=\dfrac{\lambda^k}{k!}\text e^{-\lambda}\\ 均匀分布U(a,b) &\quad f(x)=\dfrac{1}{b-a}\\ 正态分布N(\mu,\sigma^2) &\quad \varphi(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\\ 指数分布E(\lambda) &\quad f(x)=\lambda\text e^{-\lambda x}\\ 几何分布G(p) &\quad P(X=k)=p(1-p)^{k-1}\\ 超几何分布H(N,M,n) &\quad P(X=k)=\dfrac{C^k_M C^{n-k}_{N-M}}{C^n_N}\\ 二维均匀分布 &\quad f(x,y)=\dfrac{1}{S_D}\\ 二维正态分布 &\quad \varphi(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\text e^{-\frac{1}{2(1-\rho^2)}\left(\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}\right)}\\ \end{aligned} \]

1.3 联合概率分布

\[\begin{aligned} 联合分布函数 &\quad F(x,y)=\int_{-\infty}^x \int_{-\infty}^y f(x,y)\text dx\text dy\\ 边际分布函数 &\quad F_X(x)=\int_{-\infty}^x\int_{-\infty}^{+\infty} f(x,y)\text dx\text dy\\ 边际密度函数 &\quad f_X(x)=\int_{-\infty}^{+\infty} f(x,y) \text dy\\ 条件密度函数 &\quad f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)} \end{aligned} \]

1.4 随机变量函数的概率分布

\[\begin{aligned} 一元离散型 &\quad P(Y=y_j)=\sum_{g(x_i)=y_i} P(X=x_i)\\ 多元离散型 &\quad P(Z=z_k)=\sum_{g(x_i,y_j)=z_k} P(X=x_i,Y=y_j)\\ 一元连续型 &\quad F_Y(y)=P(Y\leq y)=P(g(x)\leq y)=\int_{g(x)\leq y} f_X(x) \text dx \quad f_Y(y)=F'_Y(y)\\ 多元连续型 &\quad F_Z(z)=P(Z\leq z)=P(g(x,y)\leq z)=\iint_{g(x,y)\leq z} f(x,y)\text dx\text dy \quad f_Z(z)=F'_Z(z) \end{aligned} \]

1.5 正态分布

\[\begin{aligned} 标准正态分布 &\quad X\sim N(0,1) \Rightarrow \Phi(a)=P(X\leq a)\\ 一般正态分布 &\quad X\sim N(\mu,\sigma^2) \Rightarrow \dfrac{X-\mu}{\sigma}\sim N(0,1),\Phi\left(\dfrac{a-\mu}{\sigma}\right)=P(X\leq a)\\ 二维边际性质 &\quad (X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) \Rightarrow X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\\ &\quad aX+ bY\sim N(a\mu_1+b\mu_2,a^2\sigma_1^2+b^2\sigma_2^2+2ab\text{Cov}(X,Y)) \end{aligned} \]

1.6 数学期望

\[\begin{aligned} 一元离散型 &\quad E(X)=\sum_k x_kp_k\\ 多元离散型 &\quad E(Z)=\sum_i\sum_j g(x_i,y_j)p_{ij}\\ 一元连续型 &\quad E(X)=\int_{-\infty}^{+\infty} xf(x)\text dx\\ 多元连续型 &\quad E(Z)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} g(x,y)f(x,y) \text dx\text dy\\ 线性性质 &\quad E(aX+bY)=aE(X)+bE(Y) \end{aligned} \]

1.7 方差与相关系数

\[\begin{aligned} 方差 &\quad D(X)=E(X-E(X))^2=E(X^2)-E^2(X)\\ &\quad D(aX+bY)=a^2D(X)+b^2D(Y)+2ab\text{Cov}(X,Y)\\ 协方差 &\quad \text{Cov}(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY)-E(X)E(Y)\\ &\quad\text{Cov}(X_1+X_2,Y)=\text{Cov}(X_1,Y)+\text{Cov}(X_2,Y)\\ 相关系数 &\quad\rho_{xy}=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}=\frac{\text{Cov}(X,Y)}{\sigma_1\sigma_2} \end{aligned} \]

1.8 大数定律与中心极限定理

\[\begin{aligned} &\text{契比雪夫不等式}\\ &\quad\quad\quad\quad\quad\quad\quad\quad P(|X-\mu|< k)\geq 1-\frac{\sigma^2}{k^2}\\ &n\text{个相互独立的随机变量的算术平均值，在}n\text{无限增加时趋近一个期望值}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty} P\left(\left|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^nE(X_i)\right|\geq \varepsilon\right)=0\\ &n\text{重独立重复实验，事件发生频率趋近概率}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\left|\frac{n_A}{n}-p\right|\geq \varepsilon\right)=0\\ &\text{独立同分布的随机变量序列的样本均值的极限分布是正态分布}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\frac{\sum_{i=1}^nX_i-n\mu}{\sqrt{n}\sigma}\leq x\right)=\Phi(x)\\ &\text{二项分布的极限分布是正态分布}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\frac{X-np}{\sqrt{np(1-p)}}\leq x\right)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x \text e^{-\frac{t^2}{2}}\text dt=\Phi(x) \end{aligned} \]

1.9 \(\chi^2\) 分布

\[\begin{aligned} &X_i\sim N(0,1)\Rightarrow\chi^2=X_1^2+X_2^2+\cdots+X_n^2\\ &X\sim\chi^2(n), Y\sim\chi^2(m)\Rightarrow X+Y\sim\chi^2(n+m)\\ &X\sim\chi^2(n)\Rightarrow E\left(\chi^2(n)\right)=n, D\left(\chi^2(n)\right)=2n \end{aligned} \]

1.10 \(t\) 分布

\[\begin{aligned} &X\sim N(0,1),Y\sim\chi^2(n)\Rightarrow t=\frac{X}{\sqrt{\frac{Y}{n}}}\\ &\lim_{n\rightarrow\infty}f(x)=\frac{1}{\sqrt{2\pi}}\text e^{-\frac{x^2}{2}} \end{aligned} \]

1.11 \(F\) 分布

\[\begin{aligned} &X\sim\chi^2(n),Y\sim\chi^2(m)\Rightarrow F=\frac{\frac{X}{n}}{\frac{Y}{m}}\\ &X\sim F(n,m)\Rightarrow \frac{1}{X}\sim F(m,n)\\ &t\sim t(n)\Rightarrow t^2\sim F(1,n) \end{aligned} \]

1.12 正态总体的抽样分布

\[\begin{aligned} 单正态总体 &\quad \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)\\ &\quad \frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1)\\ &\quad \frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}\sim t(n-1)\\ 双正态总体 &\quad \frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}}}\sim N(0,1)\\ &\quad \frac{S_1^2}{S_2^2}\cdot\frac{\sigma_2^2}{\sigma_1^2}\sim F(n-1,m-1)\\ &\sigma_1=\sigma_2,S_\omega=\sqrt{\dfrac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\Rightarrow\dfrac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{S_\omega\sqrt{\frac{1}{n}+\frac{1}{m}}}\sim t(n+m-2) \end{aligned} \]

1.13 点估计

\[\begin{aligned} 矩估计法 &\quad E(X^i)=A_i=\frac{1}{n}\sum_{j=1}^n x_j^i\\ 最大似然法 &\quad L(\hat{\theta})=\text{max}L(\theta)=\text{max}\prod_{i=1}^n p(x_i,\theta)\\ 无偏性 &\quad E(\hat{\theta})=\theta\\ 有效性 &\quad D(\hat{\theta}_1)<D(\hat{\theta}_2)\\ 一致性 &\quad \lim_{n\rightarrow\infty} P(|\hat{\theta}_n-\theta|<\varepsilon)=1 \end{aligned} \]

1.14 分位点

\[\begin{aligned} 区间估计 &\quad P\left(Y<Y_\alpha\right)=1-\alpha\\ &\quad P\left(Y>Y_{1-\alpha}\right)=1-\alpha\\ &\quad P\left(Y_{1-\frac{\alpha}{2}}<Y<Y_{\frac{\alpha}{2}}\right)=1-\alpha\\ 假设检验 &\quad P\left(Y>Y_\alpha \right)=\alpha\\ &\quad P\left(Y<Y_{1-\alpha} \right)=\alpha\\ &\quad P\left(Y<Y_{1-\frac{\alpha}{2}} \vee Y>Y_{\frac{\alpha}{2}} \right)=\alpha \end{aligned} \]

2 练习

\(\text{Qn1}\quad\) 设二维随机变量 \((X,Y)\) 的联合密度函数为：

\[f(x,y)=\begin{cases} \dfrac{1}{4}(1+xy)\quad |x|<1,|y|<1\\ 0\quad 其他 \end{cases} \]

证明：\(X\) 与 \(Y\) 不独立，\(X^2\) 与 \(Y^2\) 独立。

\(\text{Sol}\quad\) 显然

\[\begin{aligned} &f(x)=\int_{-1}^1\dfrac{1}{4}(1+xy)\text dy=\dfrac12\quad f(y)=f(x)=\dfrac12\\ &f(x)\cdot f(y)\neq f(x,y) \end{aligned} \]

设 \(U=X^2,V=Y^2\)

\[\begin{aligned} F(u,v)=&P(U\leq u,V\leq v)\\ =&P(X^2<u,Y^2<v)\\ =&\int_{-\sqrt{u}}^{\sqrt{u}}\int_{-\sqrt{v}}^{\sqrt{v}}\dfrac{1}{4}(1+xy)\text dx\text dy\\ =&\sqrt{uv} \end{aligned} \]

而

\[\begin{aligned} &F(u)=F(u,1)=\sqrt{u}\quad F(v)=F(1,v)=\sqrt{v}\\ &F(u,v)=F(u)\cdot F(v) \end{aligned} \]

证毕。

\(\text{Qn2}\quad\) 设随机变量 \(X\) 和 \(Y\) 独立，其中 \(X\) 的概率分布为 \(X\sim\left(\begin{matrix}1&2\\0.3&0.7\end{matrix}\right)\), 而 \(Y\) 的概率密度为 \(f(y)\), 求随机变量 \(Z=Y-X^2\) 的概率密度。

\(\text{Sol}\quad\)

\[\begin{aligned} F_Z(z)=&P(Z\leq z)\\ =&P(Y-X^2\leq z)\\ =&\sum_{i=1}^2 P(Y\leq z+x^2|X=i)P(X=i)\\ =&\dfrac{3}{10}\int_{-\infty}^{z+1} f(y)\text dy+\dfrac{7}{10} \int_{-\infty}^{z+4} f(y)\text dy\\ f_Z(z)=&F_Z'(z)\\ =&\dfrac{3}{10}f(z+1)+\dfrac{7}{10}f(z+4) \end{aligned} \]

\(\text{Qn3}\quad\) 已知 \((X,Y)\) 的联合分布列为

\[P(X=n,Y=m)=\dfrac{(p\lambda)^m (q\lambda)^{n-m}}{m!(n-m)!}\text e^{-\lambda} \]

其中 \(\lambda>0,p+q=1,n=0,1,2,\cdots,m=0,1,2,\cdots,n\)，求 \(Z=X-Y\) 的分布列，并证明 \(Y\) 与 \(Z\) 相互独立。

\(\text{Sol}\quad\) 先

\[\begin{aligned} P(Z=k)=&P(X-Y=k)\\ =&\sum_{i=0}^\infty P(X=k+i,Y=i)\\ =&\sum_{i=0}^\infty \dfrac{(p\lambda)^i(q\lambda)^k}{i!k!}\text e^{-\lambda}\\ =&\dfrac{(q\lambda)^k}{k!}\text e^{-q\lambda} \end{aligned} \]

后

\[\begin{aligned} P(Y=m)=&\sum_{j=m}^\infty P(X=j,Y=m)\\ =&\sum_{j=m}^\infty \dfrac{(p\lambda)^m(q\lambda)^{j-m}}{m!(j-m)!}\text e^{-\lambda}\\ =&\dfrac{(p\lambda)^m}{m!}\text e^{-p\lambda} \end{aligned} \]

判断独立性

\[\begin{aligned} &P(Z=k)P(Y=m)=\dfrac{p^mq^k}{m!k!}\lambda^{k+m}\text e^{-\lambda}\\ &P(Z=k,Y=m)=P(X=k+m,Y=m)=\dfrac{p^mq^k}{m!k!}\lambda^{k+m}\text e^{-\lambda}\\ \end{aligned} \]

\(\text{Qn4}\quad\) 设 \(X\sim N(0,\sigma^2),Y\sim N(0,\sigma^2)\) 且相互独立，求 \(Z=\displaystyle\sqrt{X^2+Y^2}\) 的分布。

\(\text{Sol}\quad\) 考虑

\[\begin{aligned} &f_X(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{x^2}{2\sigma^2}}\\ &f(x,y)=\dfrac{1}{2\pi\sigma^2}\text e^{-\frac{x^2+y^2}{2\sigma^2}} \end{aligned} \]

那么

\[\begin{aligned} F_Z(z)=&\iint\limits_{\rho(z)} f(x,y) \text dx\text dy \\ =& \int_0^{2\pi}\text d \theta \int_0^z \dfrac{r}{2\pi\sigma^2} \text e^{-\frac{r^2}{2\sigma^2}}\text dr \\ =& 1-\text e^{-\frac{z^2}{2\sigma^2}} \end{aligned} \]

顺带提一下雅可比行列式忘了怎么办吧. 考虑到 \(\text dx\text dy\) 是面积微元的意思, 而面积微元的定义是 \(\text dx\wedge\text dy\). 用外积展开就好了.

\(\text{Qn5}\quad\) 从区间 \([0,1]\) 上任取 \(n\) 个点，求最大点与最小点之间距离的数学期望。

\(\text{Sol}\quad\) 设 \(X_1,X_2,\cdots,X_n\) 为 \(n\) 个点，令 \(Y=\text{max}(X_1,X_2,\cdots,X_n),Z=\text{min}(X_1,X_2,\cdots,X_n)\)

\[\begin{aligned} &F_{\text{max}}(x)=\prod_i P(X_i<x)=x^n\\ &f_{\text{max}}(x)=nx^{n-1}\\ &F_{\text{min}}(x)=\prod_i P(X_i>x)=1-(1-x)^n\\ &f_{\text{min}}(x)=n(1-x)^{n-1} \end{aligned} \]

因此

\[E(Y)=\int_0^1 nx^n \text dx=\frac{n}{n+1},\quad E(Z)=\int_0^1 nx(1-x)^{n-1}\text dx=\frac{1}{n+1} \]

\[E(Y-Z)=E(Y)-E(Z)=\frac{n-1}{n+1} \]

\(\text{Qn6}\quad\) 设 \((X,Y)\sim N(1,1,2^2,3^2,0.5)\)，求 \(E(\text{max}(X,Y))\)。

\(\text{Sol}\quad\) 小技巧 \(\text{max}(X,Y)=\dfrac{1}{2}(X+Y+|X-Y|)\)

其中

\[\begin{aligned} E(X+Y)=&E(X)+E(Y)=2\\ E(X-Y)=&E(X)-E(Y)=0,\quad D(X-Y)=D(X)+D(Y)-2\text{Cov}(X,Y)=7\\ E|X-Y|=&\int_{-\infty}^{+\infty} |t|\frac{1}{\sqrt{14\pi}}\text e^{-\frac{t^2}{14}}\text dt\\ =&\frac{2}{\sqrt{14\pi}}\int_0^{+\infty}t\text e^{-\frac{t^2}{14}}\text dt\\ =&\sqrt{\frac{14}{\pi}} \end{aligned} \]

因此

\[E(\text{max}(X,Y))=1+\sqrt{\frac{7}{2\pi}} \]

\(\text{Qn7}\quad\) 将 \(n\) 个编号为 \(1,2,\cdots,n\) 的球随机放入编号为 \(1,2,\cdots,n\) 的 \(n\) 个盒子中，一个盒子只能装一个球，如果第 \(i\) 号球正好放入了第 \(i\) 号盒子，称为一个配对。求配对数的期望与方差。

\(\text{Sol}\quad\) 令

\[X_i=\begin{cases} 1,\quad 第 i 个盒子配对\\ 0,\quad 第 i 个盒子没配对\\ \end{cases}\quad,\quad i=1,2,\cdots,n \]

则 \(X=\displaystyle\sum_{i=1}^n X_i\) 表示配对数，且 \(E(X_i)=\dfrac{1}{n},D(X_i)=\dfrac{n-1}{n^2}\)

因此

\[\begin{aligned} E(X)=&\sum_{i=1}^n E(X_i)=n\frac{1}{n}=1\\ D(X)=&\sum_{i=1}^n D(X_i)+\sum_{i\neq j}\text{Cov}(X_i,X_j)\\ =&n\frac{n-1}{n^2}+\sum_{i\neq j}E(X_iX_j)-E(X_i)E(X_j)\\ =&\frac{n-1}{n}+2\text C^2_n\left(\frac{1}{n(n-1)}-\frac{1}{n^2}\right)\\ =&1 \end{aligned} \]

\(\text{Qn8}\quad\) 设 \(X_1,X_2,\cdots,X_n,X_{n+1}\) 是正态总体 \(X\sim N(\mu,\sigma^2)\) 的样本，记

\[\bar{X}_n=\frac{1}{n}\sum_{i=1}^n X_i,\quad S_n^2=\frac{1}{n}\sum_{i=1}^n (X_i-\bar{X}_n)^2 \]

试证明统计量 \(U=\sqrt{\dfrac{n-1}{n+1}}\dfrac{X_{n+1}-\bar{X}_n}{S_n}\) 服从 \(t(n-1)\) 分布.

\(\text{Sol}\quad\) 考虑 \(\displaystyle{\frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1)}\)，原式转化为

\[\frac{\sqrt{\frac{n}{n+1}}\frac{X_{n+1}-\bar{X}_n}{\sigma}}{\sqrt{\frac{\chi^2(n-1)}{n-1}}} \]

而

\[\begin{aligned} \sqrt{\frac{n}{n+1}}\frac{X_{n+1}-\bar{X}_n}{\sigma}=&\sqrt{\frac{n}{n+1}}\frac{N(\mu,\sigma^2)-N(\mu,\frac{\sigma^2}{n})}{\sigma}\\ =&\sqrt{\frac{n}{n+1}}\frac{N(0,\frac{n+1}{n}\sigma^2)}{\sigma}\\ =&\frac{N(0,\frac{n+1}{n}\sigma^2)}{\frac{\sigma}{\sqrt{\frac{n+1}{n}}}} \end{aligned} \]

因此原式服从 \(t(n-1)\) 分布.

\(\text{Qn9}\quad\) 设总体 \(X\sim N(\mu_1,\sigma^2)\) 与总体 \(Y\sim N(\mu_2,\sigma^2)\) 相互独立, \(X_1,X_2,\cdots,X_n\) 与 \(Y_1,Y_2,\cdots,Y_m\) 分别为 \(X\) 和 \(Y\) 的样本，\(\alpha,\beta\) 为常数，证明

\[T=\frac{\alpha(\bar{X}-\mu_1)+\beta(\bar{Y}-\mu_2)}{\sqrt{\frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\sqrt{\frac{\alpha^2}{n}+\frac{\beta^2}{m}}} \]

服从 \(t(n+m-2)\) 分布.

\(\text{Sol}\quad\) 先考虑

\[\begin{aligned} S_\omega=&\sqrt{\frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\\ =&\sigma\sqrt{\frac{\frac{(n-1)S_1^2}{\sigma^2}+\frac{(m-1)S_2^2}{\sigma^2}}{n+m-2}}\\ =&\sigma\sqrt{\frac{\chi^2(n+m-2)}{n+m-2}} \end{aligned} \]

接下来

\[\alpha(\bar{X}-\mu_1)+\beta(\bar{Y}-\mu_2)=N(\alpha\mu_1+\beta\mu_2,\alpha^2\frac{\sigma^2}{n}+\beta^2\frac{\sigma^2}{m})-(\alpha\mu_1+\beta\mu_2) \]

标准化得证。

\(\text{Qn10}\quad\) 设总体为 \(X\), 总体均值 \(E(X)=\mu\) 和总体方差 \(D(X)=\sigma^2\) 存在. \(X_1,X_2,\cdots,X_n\) 为来自总体 \(X\) 的一个样本，求 \(\mu\) 和 \(\sigma^2\) 的矩估计量。

\(\text{Sol}\quad\) 矩估计：

\[\begin{cases} E(X)=\bar{X}\\ E(X^2)=D(X)+(E(X))^2=A_2 \end{cases} \]

即

\[\begin{cases} \mu=\bar{X}\\ \sigma^2+\mu^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n X_i^2 \end{cases} \]

解得

\[\begin{cases} \hat{\mu}=\bar{X}\\ \hat{\sigma}^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (X_i-\bar{X})^2 \end{cases} \]

\(\text{Qn11}\quad\) 设总体 \(X\sim N(\mu,\sigma^2)\), \(X_1,X_2,\cdots,X_n\) 为来自总体的一个样本，求未知参数 \(\mu\) 和 \(\sigma^2\) 的最大似然估计量.

\(\text{Sol}\quad\) 概率密度函数为

\[f(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]

似然函数为

\[L(\mu,\sigma^2)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}=(2\pi\sigma^2)^{-\frac{n}{2}}\text e^{-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2} \]

取对数后关于 \(\mu\), \(\sigma^2\) 求偏导

\[\begin{cases} \dfrac{\partial \ln L(\mu,\sigma^2)}{\partial \mu}=\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n (x_i-\mu)=0\\ \dfrac{\partial \ln L(\mu,\sigma^2)}{\partial \sigma^2}=-\dfrac{n}{2\sigma^2}+\dfrac{1}{2\sigma^4}\displaystyle\sum_{i=1}^n (x_i-\mu)^2=0 \end{cases} \]

解得

\[\begin{cases} \hat{\mu}=\bar{X}\\ \hat{\sigma}^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (X_i-\bar{X})^2 \end{cases} \]

最大似然法解得的结果和矩估计法不总是相同.

\(\text{Qn12}\quad\) 设某车间生产的滚珠的直径 \(X\sim N(\mu,\sigma^2)\), 现从某日生产的滚珠中抽取 \(9\) 个,测得样本方差为 \(s^2=0.25^2\), 在 \(0.95\) 置信度下求总体方差的 \(\sigma^2\) 的置信区间.

\(\text{Sol}\quad\) 先判定为单总体, 使用

\[\frac{n-1}{\sigma^2}s^2\sim \chi^2(n-1) \]

根据分位点的恒等式

\[\begin{aligned} P\left(\chi^2_{1-\frac{\alpha}{2}}(n-1)\leq \frac{n-1}{\sigma^2}s^2\leq \chi^2_{\frac{\alpha}{2}}(n-1) \right)=1-\alpha \end{aligned} \]

解得

\[\frac{(n-1)s^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}\leq \sigma^2 \leq \frac{(n-1)s^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)} \]

代入数据得置信区间 \([0.03,0.23]\).

\(\text{Qn13}\quad\) 设某车间生产的滚珠的直径 \(X\sim N(\mu,\sigma^2)\), 现从某日生产的滚珠中抽取 \(9\) 个, 测得样本方差为 \(s^2=0.25^2\), 在显著性水平 \(0.05\) 下是否可以认为总体方差的 \(\sigma^2=0.36^2\)?

\(\text{Sol}\quad\) 先判定为双侧检验, 原假设 \(H_0:\sigma^2=0.36^2\), 备择假设 \(H_1:\sigma^2\neq 0.36^2\)

使用统计量

\[\chi^2=\frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1) \]

得

\[P\left(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1) \vee \chi^2> \chi^2_{\frac{\alpha}{2}}(n-1) \right)=\alpha \]

拒绝域为 \(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\) 或 \(\chi^2> \chi^2_{\frac{\alpha}{2}}(n-1)\)
代入数据得 \(\chi^2\) 没有落在拒绝域中, 应接受原假设.

\(\text{Qn14}\quad\) 推导

\[F_{\alpha}(m,n)=\frac{1}{F_{1-\alpha}(n,m)} \]

\(\text{Sol}\quad\) 根据定义

\[\begin{aligned} &X\sim F(m,n)\quad\quad Y\sim F(n,m)\\ &x=F_{\alpha}(m,n)\quad\quad y=F_{1-\alpha}(n,m)\\ &P(X>x)=\alpha\quad\quad P(Y\leq y)=\alpha \end{aligned} \]

考虑

\[\begin{aligned} &X=\frac{1}{Y}\\ &P(X>x)=P(Y\leq y) \end{aligned} \]

因此

\[F_{\alpha}(m,n)=\frac{1}{F_{1-\alpha}(n,m)} \]

\(\text{Qn15}\quad\) 推导泊松分布的分布列是二项分布的极限.

\(\text{Sol}\quad\) 目标是证明

\[\begin{aligned} \lim_{n\rightarrow\infty}np=\lambda\quad\Rightarrow\quad\lim_{n\rightarrow\infty}C^k_n p^k(1-p)^{n-k}=\frac{\lambda^k}{k!}\text e^{-\lambda} \end{aligned} \]

考虑展开

\[\begin{aligned} C^k_n p^k(1-p)^{n-k}\rightarrow& \frac{n!}{k!(n-k)!}\cdot\frac{\lambda^k}{n^k}\cdot\left(1-\frac{\lambda}{n}\right)^{n-k}\\ \rightarrow& \frac{n!}{(n-k)!(n-\lambda)^k}\cdot\frac{\lambda^k}{k!}\text e^{-\lambda}\\ \rightarrow& \frac{\lambda^k}{k!}\text e^{-\lambda} \end{aligned} \]

\(\text{Qn16}\quad\) 推导正态分布标准化方法.

\(\text{Sol}\quad\) 目标是证明

\[\begin{cases} \varphi(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\\ t=\dfrac{x-\mu}{\sigma} \end{cases}\quad\Rightarrow\quad{f(t)=\dfrac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}}} \]

考虑分布函数

\[\begin{aligned} F(t)=&P(T\leq t)\\ =&P(X\leq \sigma t+\mu)\\ =&\int_{-\infty}^{\sigma t+\mu}\varphi(x)\text dx\\ =&\int_{-\infty}^{\sigma t+\mu}\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\text dx\\ =&\int_{-\infty}^t \frac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}}\text dt\\ \end{aligned} \]

因此

\[f(t)=\frac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}} \]

\(\text{Qn17}\quad\) 推导方差的计算公式.

\(\text{Sol}\quad\)

\[\begin{aligned} D(X)=&E((X-E(X))^2)\\ =&E((X-\sum_i x_ip_i)^2)\\ =&\sum_j(x_j-\sum_i x_ip_i)^2p_j\\ =&\sum_j x_j^2p_j-2\sum_jx_jp_j\sum_ix_ip_i+\sum_jp_j(\sum_i x_ip_i)^2\\ =&E(X^2)-2E^2(X)+E(E^2(X))\\ =&E(X^2)-E^2(X) \end{aligned} \]

特殊地, 若 \(p_i=\dfrac{1}{n}\), 则 \(\displaystyle{D(X)=\frac{1}{n}\sum_{i=1}^n x_i^2-\bar{X}^2}\).

\(\text{Qn18}\quad\) 计算各种分布的期望和方差.

\(\text{Sol}\quad\) 0-1 分布:

\[E(X)=p,\quad D(X)=E(X^2)-E^2(X)=p-p^2 \]

二项分布:

\[\begin{aligned} E(X)=&\sum_{k=1}^n kC_n^k p^k(1-p)^{n-k}\\ =&n\sum_{k=1}^n C^{k-1}_{n-1} p^k (1-p)^{n-k}\\ =&np\sum_{k=1}^n C^{k-1}_{n-1} p^{k-1}(1-p)^{n-k}\\ =&np(p+1-p)^{n-1}\\ =&np\\ D(X)=&E(X^2)-E^2(X)\\ =&\sum_{i=1}^n k^2C^k_n p^k (1-p)^{n-k}-n^2p^2\\ =&np\sum_{k=1}^n C^{k-1}_{n-1} p^{k-1}(1-p)^{n-k}+n(n-1)p^2\sum_{k=2}^n C^{k-2}_{n-2}p^{k-2}(1-p)^{n-k}-n^2p^2\\ =&np+n(n-1)p^2-n^2p^2\\ =&np(1-p) \end{aligned} \]

泊松分布:

\[\begin{aligned} E(X)=&\sum_{i=1}^{\infty} i\frac{\lambda^{i}}{i!}\text e^{-\lambda}\\ =&\lambda \text e^{-\lambda}\sum_{i=0}^{\infty} \frac{\lambda^{i}}{i!}\\ =&\lambda\\ D(X)=&E(X^2)-E^2(X)\\ =&\lambda\text e^{-\lambda} \sum_{i=1}^\infty i\frac{\lambda^{i-1}}{(i-1)!}-\lambda^2\\ =&\lambda(\lambda+1)\text e^{-\lambda}\sum_{i=0}^\infty \frac{\lambda^i}{i!}-\lambda^2\\ =&\lambda^2+\lambda-\lambda^2\\ =&\lambda \end{aligned} \]

几何分布:

\[\begin{aligned} E(X)=&\sum_{k=1}^\infty kp(1-p)^{k-1}\\ =&-p\frac{\text d}{\text dp}\sum_{k=0}^\infty (1-p)^k\\ =&-p\frac{\text d}{\text dp}\frac{1}{p}\\ =&\frac{1}{p}\\ D(X)=&E(X^2)-E^2(X)\\ =&\sum_{k=1}^\infty k^2 p(1-p)^{k-1}-\frac{1}{p^2}\\ =&p\frac{\text d}{\text dp}\left((1-p)\frac{\text d}{\text dp}\sum_{k=1}^\infty (1-p)^k\right)-\frac{1}{p^2}\\ =&-\frac{1}{p}+\frac{2}{p^2}-\frac{1}{p^2}\\ =&\frac{1-p}{p^2} \end{aligned} \]

均匀分布:

\[\begin{aligned} E(X)=&\int_a^b \frac{1}{b-a}x\text dx\\ =&\frac{1}{b-a}\left(\frac{b^2}{2}-\frac{a^2}{2}\right)\\ =&\frac{a+b}{2}\\ D(X)=&E(X^2)-E^2(X)\\ =&\int_a^b \frac{1}{b-a} x^2\text dx-\frac{(a+b)^2}{4}\\ =&\frac{1}{3}(a^2+b^2+ab)-\frac{1}{4}(a+b)^2\\ =&\frac{(b-a)^2}{12} \end{aligned} \]

指数分布:

\[\begin{aligned} E(X)=&\lambda \int_0^{+\infty} x \text e^{-\lambda x}\text dx\\ =&\left(-x\text e^{-\lambda x}-\frac{\text e^{-\lambda x}}{\lambda}\right)\bigg|_0^{+\infty}\\ =&\frac{1}{\lambda}\\ D(X)=&E(X^2)-E^2(X)\\ =&\lambda\int_0^{+\infty}x^2\text e^{-\lambda x}\text dx-\frac{1}{\lambda^2}\\ =&\frac{2}{\lambda^2}-\frac{1}{\lambda^2}\\ =&\frac{1}{\lambda^2} \end{aligned} \]

\(\text{Qn19}\quad\) 证明独立的正态分布的和仍然服从正态分布.

\(\text{Sol}\quad\) 先说明一个引理:

\[P(X+Y=z)=\sum P(X=x,Y=z-x)=\int_{-\infty}^{+\infty} f(x,z-x)\text dx \]

这告诉我们变量的和分布等同于变量的卷积.

下面开始证明:
设 \(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2), Z=aX+bY, \sigma=\sqrt{\sigma_1^2+\sigma_2^2}\)

\[\begin{aligned} f(z)=&\int_{-\infty}^{+\infty} f(x,z-x)\text dx\\ =&\int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)\text dx\\ =&\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma_1}\text e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\cdot \frac{1}{\sqrt{2\pi}\sigma_2}\text e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}\text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{\sigma_2^2(x-\mu_1)^2+\sigma_1^2(z-x-\mu_2)^2}{2\sigma_1^2\sigma_2^2}} \text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{(\sigma_1^2+\sigma_2^2)x^2+2((\mu_2-z)\sigma_1^2-\mu_1\sigma_2^2)x+(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{2\sigma_1^2\sigma_2^2}}\text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{x^2+\frac{2((\mu_2-z)\sigma_1^2-\mu_1\sigma_2^2)x}{\sigma^2}+\frac{(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{\sigma^2}}{\frac{2\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{\left(x-\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2+\frac{(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{\sigma^2}-\left(\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{\sigma^2((z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2)-((z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2)^2}{2\sigma^2\sigma_1^2\sigma_2^2}} \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\frac{\sigma_1\sigma_2}{\sigma}} \text e^{-\frac{\left(x-\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2}{2\frac{\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{\sigma_1^2\sigma_2^2z^2-2\sigma_1^2\sigma_2^2(\mu_1+\mu_2)z+\sigma_1^2\sigma_2^2(\mu_1^2+\mu_2^2)+2\mu_1\mu_2\sigma_1^2\sigma_2^2}{2\sigma^2\sigma_1^2\sigma_2^2}}\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{z^2-2(\mu_1+\mu_2)z+(\mu_1+\mu_2)^2}{2\sigma^2}}\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(z-(\mu_1+\mu_2))^2}{2\sigma^2}} \end{aligned} \]

证毕.

\(\text{Qn20}\quad\) 证明样本均值 \(\bar{X}\) 和样本方差 \(S^2\) 分别是 \(\mu\) 和 \(\sigma^2\) 的无偏估计量.

\(\text{Sol}\quad\)

\[\begin{aligned} E(\bar{X})=&E\left(\frac{1}{n}\sum_{i=1}^n X_i\right)\\ =&\frac{1}{n}\sum_{i=1}^n E(X_i)\\ =&\frac{1}{n}\cdot n\mu\\ =&\mu\\ E(S^2)=&E\left(\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2\right)\\ =&\frac{1}{n-1}E\left(\sum_{i=1}^n X_i^2-n\bar{X}^2\right)\\ =&\frac{1}{n-1}\left(\sum_{i=1}^n E(X_i^2)-nE(\bar{X}^2)\right)\\ =&\frac{1}{n-1}\left(\sum_{i=1}^n\left(E^2(X_i)+D(X_i)\right)- n\left(E^2(\bar{X})+D(\bar{X})\right) \right)\\ =&\frac{1}{n-1}\left(n(\mu^2+\sigma^2)-n\left(\mu^2+\frac{\sigma^2}{n}\right)\right)\\ =&\sigma^2 \end{aligned} \]

3 理解

大写字母代表随机变量, 小写字母代表随机变量的值.
全概率公式基于样本空间的划分计算总概率, 由原因推结果; 贝叶斯公式基于总概率反推原先划分的概率, 由结果推原因.
独立事件的条件概率只需要将条件代入即可, 不用将积事件除以条件事件.
分布函数 (CDF, Cumulative Distribution Function) 是不超过某个值的概率总和, 离散的分布列 (PMF, Probability Mass Function) 或连续的密度函数 (PDF, Probability Density Function) 是某个值的概率. 分布函数一定单调不减趋于 1.
相关性指的是两个变量具有线性关系的程度, 独立性指的是一个变量的取值对另一个变量没有影响. 如果两变量独立, 那么相关系数一定为 0. 只有任意阶原点矩的相关性均为 0, 两变量才独立.
期望等同于均值, 一个随机变量取到期望的概率最大. 方差用来描述随机变量的离散程度, 方差越小数据越集中.
协方差是描述两个随机变量的线性相关方向的指标, 它的值与变量取值有关, 因此其大小无意义; 相关系数是描述两个随机变量的线性相关方向和程度的指标, 它的值是标准化后的协方差, 因此其大小可以衡量程度.
在能够计算理论值的前提下, 期望和方差就像高中学过的那样计算; 在不能够得知样本全貌的情况下, 我们只能计算样本均值和样本方差, 然后通过它们预计理论上期望和方差的值.
点估计用于从样本数据计算出总体参数的单一值; 区间估计用于从样本数据计算出总体参数范围; 假设检验用于从样本数据对总体参数进行推断，它可以用来检验总体参数的假设值是否成立; 它们思想的本质都是用测量的数据趋近理论的数据.

4 真题

\(\text{Qn1}\quad\) 判断对错:
(1) 三个事件 \(A,B,C\) 两两独立, 那么 \(A,B,C\) 相互独立.
(2) 随机变量分为离散型随机变量和连续型随机变量.
(3) 伯努利大数定律表明只要重复试验的次数充分大, 那么事件发生的频率就是概率.
(4) 若事件 \(A\) 与事件 \(B\) 相互独立, \(C\) 为 \(B\) 的子集, 则 \(A\) 与 \(C\) 也相互独立.

\(\text{Sol}\quad\) 全错.
(1) 对于 \(n\) 个事件, 如果对于任意 \(2\) 个, 任意 \(3\) 个, \(\cdots\), 任意 \(n\) 个事件的积事件的概率, 都等于各事件概率的积, 那么称这些事件相互独立.
(2) 随机变量可以又不离散又不连续, 比如分段的.
(3) 体会一下 "收敛于" 概率和 "就是" 概率的区别.
(4) \(A\) 和 \(C\) 可以没有任何交集, 因此不一定独立.

\(\text{Qn2}\quad\) 已知 \(P(A)=0.1, P(B)=0.5, A\subset B\), 求 \(P(A\cup \bar{B}|\bar{A})\).

\(\text{Sol}\quad\)

\[\begin{aligned} P(A\cup \bar{B}|\bar{A})=&\frac{P(\bar{A}\cap\bar{B})}{P(\bar{A})}\\ =&\frac{P(\overline{A\cup B})}{P(\bar{A})}\\ =&\frac{1-P(B)}{1-P(A)}\\ =&\frac{5}{9} \end{aligned} \]

\(\text{Qn3}\quad\) 设 \(X_1,X_2,\cdots,X_10\) 是来自总体 \(X\) 的一组样本, 样本一阶矩和二阶矩分别是 \(2.6\) 和 \(12.9\), 计算样本方差.

\(\text{Sol}\quad\) 考虑

\[\begin{cases} E(X)=A_1\\ D(X)+E^2(X)=A_2\\ S^2=\dfrac{n}{n-1}D(X) \end{cases} \]

联立解得 \(S^2=6.82\).

\(\text{Qn4}\quad\) 将一个骰子连续重复掷 \(4\) 次, 以 \(X\) 表示 \(4\) 次掷出的点数之和, 则 \(P(10<X<18)\geq?\)

\(\text{Sol}\quad\) 记 \(X_k\) 表示第 \(k\) 次的点数, 则它们独立同分布.

\[E(X_k)=\frac{7}{2}\quad D(X_k)=E(X_k^2)-E^2(X_k)=\frac{1}{6}(1^2+2^2+\cdots+6^2)-\left(\frac{7}{2}\right)^2=\frac{35}{12} \]

令 \(X=\displaystyle\sum_{k=1}^4 X_k\)

\[E(X)=4E(X_k)=14\quad D(X)=D(\sum_{k=1}^4 X_k)=4D(X_k)=\frac{35}{3} \]

由契比雪夫不等式

\[P(10<X<18)=P(|X-14|<4)\geq1-\frac{\frac{35}{3}}{4^2}=\frac{13}{48} \]

\(\text{Qn5}\quad\) 已知联合密度函数 \(f(x,y)=\text e^{-x}\), \(0<y<x\), 计算条件概率 \(P(Y>2|X=3)\).

\(\text{Sol}\quad\) 根据定义, 首先计算 \(f_{Y|X}(y|x)\)

\[\begin{aligned} f_{Y|X}(y|x)=&\frac{f(x,y)}{f_X(x)}\\ =&\frac{f(x,y)}{\int_{-\infty}^{+\infty} f(x,y)\text dy}\\ =&\frac{\text e^{-x}}{x\text e^{-x}}\\ =&\frac{1}{x} \end{aligned} \]

后代入 \(X=3\)

\[\begin{aligned} P(Y>2|X=3)=&1-P(Y\leq 2|X=3)\\ =&1-\int_{-\infty}^2 f_{Y|X}(y|x) \text dy\\ =&1-\int_{-\infty}^2 \frac{1}{x} \text dy\\ =&\frac{1}{3} \end{aligned} \]

\(\text{Qn6}\quad\) 设 \((X,Y)\) 的联合密度函数为 \(\displaystyle{f(x,y)=\frac{1}{2\pi}\text e^{-\frac{x^2+y^2}{2}}(1+\sin x\sin y)}\), 计算: (1) \(f_X(x),f_Y(y)\), 并判断 \(X,Y\) 独立性; (2) \(f_{Y|X}(y|x)\), \(P(Y<0|X=0)\).

\(\text{Sol}\quad\) (1) \(X\) 和 \(Y\) 是对称的

\[\begin{aligned} f_X(x)=&\int_{-\infty}^{+\infty} f(x,y)\text dy\\ =&\frac{1}{2\pi}\int_{-\infty}^{+\infty} \text e^{-\frac{x^2+y^2}{2}}(1+\sin x\sin y) \text dy\\ =&\frac{1}{2\pi}\text e^{-\frac{x^2}{2}}\left(\int_{-\infty}^{+\infty}\text e^{-\frac{y^2}{2}}+\sin x\int_{-\infty}^{+\infty}\text e^{-\frac{y^2}{2}}\sin y\text dy\right)\\ =&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{x^2}{2}}\\ f_Y(y)=&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}} \end{aligned} \]

由 \(f_X(x)f_Y(y)\neq f(x,y)\) 知 \(X\) 与 \(Y\) 不独立.

(2)

\[\begin{aligned} f_{Y|X}(y|x)=&\frac{f(x,y)}{f_X(x)}\\ =&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}}(1+\sin x\sin y) \end{aligned} \]

代入 \(X=0\), 考虑正态分布的性质

\[P(Y<0|X=0)=\int_{-\infty}^0 \frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}}\text dy=\frac{1}{2} \]

\(\text{Qn7}\quad\) 已知二维随机变量 \((X,Y)\) 的联合分布函数为 \(F(x,y)=A(B+\arctan x)(C+\arctan y)\)
(1) 求常数 \(A,B,C\)
(2) 判断 \(X\) 与 \(Y\) 是否独立
(3) 求 \(f_{X|Y}(x|y)\)

\(\text{Sol}\quad\) (1) 考虑 \(F(+\infty,+\infty)=1,F(-\infty,y)=F(x,-\infty)=0\)
解得 \(A=\dfrac{1}{\pi^2},B=\dfrac{\pi}{2},C=\dfrac{\pi}{2}\)

(2)

\[\begin{aligned} F_X(x)=&F(x,+\infty)=\frac{1}{\pi}(\frac{\pi}{2}+\arctan x)\\ F_Y(y)=&F(+\infty,y)=\frac{1}{\pi}(\frac{\pi}{2}+\arctan y)\\ F(x,y)=&F_X(x)F_Y(y) \end{aligned} \]

因此相互独立.

(3)

\[\begin{aligned} f_{X|Y}(x|y)=&\frac{f(x,y)}{f_Y(y)}\\ =&f_X(x)\\ =&\frac{1}{\pi}\frac{1}{1+x^2} \end{aligned} \]

\(\text{Qn8}\quad\) 随机变量 \(X\) 的概率密度 \(f(x)=\begin{cases}2x,\quad 0<x<1\\0,\quad \text{其他}\end{cases}\), 对 \(X\) 独立重复试验 \(162\) 次, 设观察到的值小于 \(\dfrac{1}{3}\) 的次数为 \(Y\), 求 \(P(Y>22)\) 的近似值.

\(\text{Sol}\quad\) 先计算二项分布的 \(p\)

\[\begin{aligned} p=&P(X<\frac{1}{3})\\ =&F(\frac{1}{3})\\ =&\int_0^{\frac{1}{3}} 2x\text dx\\ =&\frac{1}{9} \end{aligned} \]

接下来计算二项分布的期望和方差

\[\begin{aligned} E(X)=&np=18\\ D(X)=&np(1-p)=16 \end{aligned} \]

由中心极限定理, 二项分布趋近于正态分布 \(N(18,16)\)

\[\begin{aligned} P(Y>22)=&P\left(\frac{Y-18}{4}>1\right)\\ =&1-\Phi(1)\\ =&0.1587 \end{aligned} \]

\(\text{Qn9}\quad\) 设总体 \(X\) 的概率密度为 \(f(x)=\begin{cases}\theta c^{\theta} x^{-(\theta+1)},\quad x>c\\0,\quad x\leq c\end{cases}\), 其中 \(c>0\) 为已知参数, \(\theta>1\) 为未知参数, \(X_1,X_2,\cdots,X_n\) 为来自 \(X\) 的一个样本, \(x_1,x_2,\cdots,x_n\) 为相应的样本值, 求 \(\theta\) 的矩估计量与最大似然估计量.

\(\text{Sol}\quad\) 矩估计:

\[\begin{aligned} E(X)=\frac{1}{n}\sum_{i=1}^n x_i=\int_c^{+\infty} \theta c^{\theta}x^{-\theta}\text dx=\frac{c\theta}{\theta-1} \end{aligned} \]

解得

\[\hat{\theta}=\frac{\sum_{i=1}^n x_i}{\sum_{i=1}^n x_i-cn} \]

最大似然法:

\[\begin{aligned} L(\theta)=&\prod_{i=1}^n \theta c^{\theta} x_i^{-(\theta+1)}\\ =&(\theta c^\theta)^n \left(\prod_{i=1}^n x_i\right)^{-(\theta+1)}\\ \ln L(\theta)=&n\ln\theta+\left(n\ln c-\sum_{i=1}^n \ln(x_i)\right)\theta-\sum_{i=1}^n \ln(x_i)\\ \frac{\text d}{\text d\theta}\ln L(\theta)=&\frac{n}{\theta}+n\ln c-\sum_{i=1}^n \ln(x_i)=0 \end{aligned} \]

解得

\[\hat{\theta}=\frac{n}{\sum_{i=1}^n\ln(x_i)-n\ln c} \]

\(\text{Qn10}\quad\) 一位中学校长在报纸上看到这样一则报道: 中学生每周至少看 \(8\) 小时电视. 他认为他所在学校学生看电视时间明显小于 \(8\) 小时. 为此在该校随机调查了 \(100\) 名学生, 计算平均每周看电视的时间为 \(6.5\) 小时. 假设学生每周看电视的时间服从正态分布, 总体方差为 \(4\), 在显著性水平 \(0.05\) 的条件下, 是否可以认为这个校长的看法正确?

\(\text{Sol}\quad\) 原假设 \(H_0: \mu\geq 8\), 备择假设 \(H_1: \mu<8\)
考虑

\[z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1) \]

拒绝域

\[P(z<z_{1-\alpha})=\alpha \]

计算得

\[z=-7.5<-1.64=z_{0.95} \]

因此落在拒绝域中, 选择备择假设 \(H_1\)

关于怎样判定拒绝域的方向: 通常情况下和 \(H_1\) 的方向相同. 本题中, 由于 \(\mu\) 越大也就是 \(z\) 越小, 越容易落在拒绝域中, 因此判定为左侧检验, 拒绝域在左侧.

posted @ 2023-03-19 10:12 rainrzk 阅读(305) 评论(0) 收藏举报

刷新页面返回顶部

Rain

概率论与数理统计

1 公式

1.1 条件概率

1.2 常见分布

1.3 联合概率分布

1.4 随机变量函数的概率分布

1.5 正态分布

1.6 数学期望

1.7 方差与相关系数

1.8 大数定律与中心极限定理

1.9 \(\chi^2\) 分布

1.10 \(t\) 分布

1.11 \(F\) 分布

1.12 正态总体的抽样分布

1.13 点估计

1.14 分位点

2 练习

3 理解

4 真题

公告