1 公式
1.1 条件概率
\[\begin{aligned}
条件概率 &\quad P(A|B)=\dfrac{P(AB)}{P(B)}\\
乘法公式 &\quad P(AB)=P(A)P(B|A)=P(A|B)P(B)\\
全概率公式 &\quad P(A)=\sum P(A|B_i) P(B_i)\\
贝叶斯公式 &\quad P(B_i|A)=\dfrac{P(B_iA)}{P(A)}=\dfrac{P(A|B_i)P(B_i)}{\sum P(A|B_j) P(B_j)}\\
\end{aligned}
\]
1.2 常见分布
\[\begin{aligned}
0-1分布 &\quad P(X=k)=p^k(1-p)^{1-k}\\
二项分布B(n,p) &\quad P(X=k)=C^k_n p^k (1-p)^{n-k}\\
泊松分布P(\lambda) &\quad P(X=k)=\dfrac{\lambda^k}{k!}\text e^{-\lambda}\\
均匀分布U(a,b) &\quad f(x)=\dfrac{1}{b-a}\\
正态分布N(\mu,\sigma^2) &\quad \varphi(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\\
指数分布E(\lambda) &\quad f(x)=\lambda\text e^{-\lambda x}\\
几何分布G(p) &\quad P(X=k)=p(1-p)^{k-1}\\
超几何分布H(N,M,n) &\quad P(X=k)=\dfrac{C^k_M C^{n-k}_{N-M}}{C^n_N}\\
二维均匀分布 &\quad f(x,y)=\dfrac{1}{S_D}\\
二维正态分布 &\quad \varphi(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\text e^{-\frac{1}{2(1-\rho^2)}\left(\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}\right)}\\
\end{aligned}
\]
1.3 联合概率分布
\[\begin{aligned}
联合分布函数 &\quad F(x,y)=\int_{-\infty}^x \int_{-\infty}^y f(x,y)\text dx\text dy\\
边际分布函数 &\quad F_X(x)=\int_{-\infty}^x\int_{-\infty}^{+\infty} f(x,y)\text dx\text dy\\
边际密度函数 &\quad f_X(x)=\int_{-\infty}^{+\infty} f(x,y) \text dy\\
条件密度函数 &\quad f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}
\end{aligned}
\]
1.4 随机变量函数的概率分布
\[\begin{aligned}
一元离散型 &\quad P(Y=y_j)=\sum_{g(x_i)=y_i} P(X=x_i)\\
多元离散型 &\quad P(Z=z_k)=\sum_{g(x_i,y_j)=z_k} P(X=x_i,Y=y_j)\\
一元连续型 &\quad F_Y(y)=P(Y\leq y)=P(g(x)\leq y)=\int_{g(x)\leq y} f_X(x) \text dx
\quad f_Y(y)=F'_Y(y)\\
多元连续型 &\quad F_Z(z)=P(Z\leq z)=P(g(x,y)\leq z)=\iint_{g(x,y)\leq z} f(x,y)\text dx\text dy
\quad f_Z(z)=F'_Z(z)
\end{aligned}
\]
1.5 正态分布
\[\begin{aligned}
标准正态分布 &\quad X\sim N(0,1) \Rightarrow \Phi(a)=P(X\leq a)\\
一般正态分布 &\quad X\sim N(\mu,\sigma^2) \Rightarrow \dfrac{X-\mu}{\sigma}\sim N(0,1),\Phi\left(\dfrac{a-\mu}{\sigma}\right)=P(X\leq a)\\
二维边际性质 &\quad (X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) \Rightarrow X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\\
&\quad aX+ bY\sim N(a\mu_1+b\mu_2,a^2\sigma_1^2+b^2\sigma_2^2+2ab\text{Cov}(X,Y))
\end{aligned}
\]
1.6 数学期望
\[\begin{aligned}
一元离散型 &\quad E(X)=\sum_k x_kp_k\\
多元离散型 &\quad E(Z)=\sum_i\sum_j g(x_i,y_j)p_{ij}\\
一元连续型 &\quad E(X)=\int_{-\infty}^{+\infty} xf(x)\text dx\\
多元连续型 &\quad E(Z)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} g(x,y)f(x,y) \text dx\text dy\\
线性性质 &\quad E(aX+bY)=aE(X)+bE(Y)
\end{aligned}
\]
1.7 方差与相关系数
\[\begin{aligned}
方差 &\quad D(X)=E(X-E(X))^2=E(X^2)-E^2(X)\\
&\quad D(aX+bY)=a^2D(X)+b^2D(Y)+2ab\text{Cov}(X,Y)\\
协方差 &\quad \text{Cov}(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY)-E(X)E(Y)\\
&\quad\text{Cov}(X_1+X_2,Y)=\text{Cov}(X_1,Y)+\text{Cov}(X_2,Y)\\
相关系数 &\quad\rho_{xy}=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}=\frac{\text{Cov}(X,Y)}{\sigma_1\sigma_2}
\end{aligned}
\]
1.8 大数定律与中心极限定理
\[\begin{aligned}
&\text{契比雪夫不等式}\\
&\quad\quad\quad\quad\quad\quad\quad\quad P(|X-\mu|< k)\geq 1-\frac{\sigma^2}{k^2}\\
&n\text{个相互独立的随机变量的算术平均值,在}n\text{无限增加时趋近一个期望值}\\
&\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty} P\left(\left|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^nE(X_i)\right|\geq \varepsilon\right)=0\\
&n\text{重独立重复实验,事件发生频率趋近概率}\\
&\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\left|\frac{n_A}{n}-p\right|\geq \varepsilon\right)=0\\
&\text{独立同分布的随机变量序列的样本均值的极限分布是正态分布}\\
&\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\frac{\sum_{i=1}^nX_i-n\mu}{\sqrt{n}\sigma}\leq x\right)=\Phi(x)\\
&\text{二项分布的极限分布是正态分布}\\
&\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\frac{X-np}{\sqrt{np(1-p)}}\leq x\right)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x \text e^{-\frac{t^2}{2}}\text dt=\Phi(x)
\end{aligned}
\]
1.9 \(\chi^2\) 分布
\[\begin{aligned}
&X_i\sim N(0,1)\Rightarrow\chi^2=X_1^2+X_2^2+\cdots+X_n^2\\
&X\sim\chi^2(n), Y\sim\chi^2(m)\Rightarrow X+Y\sim\chi^2(n+m)\\
&X\sim\chi^2(n)\Rightarrow E\left(\chi^2(n)\right)=n, D\left(\chi^2(n)\right)=2n
\end{aligned}
\]
1.10 \(t\) 分布
\[\begin{aligned}
&X\sim N(0,1),Y\sim\chi^2(n)\Rightarrow t=\frac{X}{\sqrt{\frac{Y}{n}}}\\
&\lim_{n\rightarrow\infty}f(x)=\frac{1}{\sqrt{2\pi}}\text e^{-\frac{x^2}{2}}
\end{aligned}
\]
1.11 \(F\) 分布
\[\begin{aligned}
&X\sim\chi^2(n),Y\sim\chi^2(m)\Rightarrow F=\frac{\frac{X}{n}}{\frac{Y}{m}}\\
&X\sim F(n,m)\Rightarrow \frac{1}{X}\sim F(m,n)\\
&t\sim t(n)\Rightarrow t^2\sim F(1,n)
\end{aligned}
\]
1.12 正态总体的抽样分布
\[\begin{aligned}
单正态总体 &\quad \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)\\
&\quad \frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1)\\
&\quad \frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}\sim t(n-1)\\
双正态总体 &\quad \frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}}}\sim N(0,1)\\
&\quad \frac{S_1^2}{S_2^2}\cdot\frac{\sigma_2^2}{\sigma_1^2}\sim F(n-1,m-1)\\
&\sigma_1=\sigma_2,S_\omega=\sqrt{\dfrac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\Rightarrow\dfrac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{S_\omega\sqrt{\frac{1}{n}+\frac{1}{m}}}\sim t(n+m-2)
\end{aligned}
\]
1.13 点估计
\[\begin{aligned}
矩估计法 &\quad E(X^i)=A_i=\frac{1}{n}\sum_{j=1}^n x_j^i\\
最大似然法 &\quad L(\hat{\theta})=\text{max}L(\theta)=\text{max}\prod_{i=1}^n p(x_i,\theta)\\
无偏性 &\quad E(\hat{\theta})=\theta\\
有效性 &\quad D(\hat{\theta}_1)<D(\hat{\theta}_2)\\
一致性 &\quad \lim_{n\rightarrow\infty} P(|\hat{\theta}_n-\theta|<\varepsilon)=1
\end{aligned}
\]
1.14 分位点
\[\begin{aligned}
区间估计 &\quad P\left(Y<Y_\alpha\right)=1-\alpha\\
&\quad P\left(Y>Y_{1-\alpha}\right)=1-\alpha\\
&\quad P\left(Y_{1-\frac{\alpha}{2}}<Y<Y_{\frac{\alpha}{2}}\right)=1-\alpha\\
假设检验 &\quad P\left(Y>Y_\alpha \right)=\alpha\\
&\quad P\left(Y<Y_{1-\alpha} \right)=\alpha\\
&\quad P\left(Y<Y_{1-\frac{\alpha}{2}} \vee Y>Y_{\frac{\alpha}{2}} \right)=\alpha
\end{aligned}
\]
2 练习
\(\text{Qn1}\quad\) 设二维随机变量 \((X,Y)\) 的联合密度函数为:
\[f(x,y)=\begin{cases}
\dfrac{1}{4}(1+xy)\quad |x|<1,|y|<1\\
0\quad 其他
\end{cases}
\]
证明:\(X\) 与 \(Y\) 不独立,\(X^2\) 与 \(Y^2\) 独立。
\(\text{Sol}\quad\) 显然
\[\begin{aligned}
&f(x)=\int_{-1}^1\dfrac{1}{4}(1+xy)\text dy=\dfrac12\quad f(y)=f(x)=\dfrac12\\
&f(x)\cdot f(y)\neq f(x,y)
\end{aligned}
\]
设 \(U=X^2,V=Y^2\)
\[\begin{aligned}
F(u,v)=&P(U\leq u,V\leq v)\\
=&P(X^2<u,Y^2<v)\\
=&\int_{-\sqrt{u}}^{\sqrt{u}}\int_{-\sqrt{v}}^{\sqrt{v}}\dfrac{1}{4}(1+xy)\text dx\text dy\\
=&\sqrt{uv}
\end{aligned}
\]
而
\[\begin{aligned}
&F(u)=F(u,1)=\sqrt{u}\quad F(v)=F(1,v)=\sqrt{v}\\
&F(u,v)=F(u)\cdot F(v)
\end{aligned}
\]
证毕。
\(\text{Qn2}\quad\) 设随机变量 \(X\) 和 \(Y\) 独立,其中 \(X\) 的概率分布为 \(X\sim\left(\begin{matrix}1&2\\0.3&0.7\end{matrix}\right)\), 而 \(Y\) 的概率密度为 \(f(y)\), 求随机变量 \(Z=Y-X^2\) 的概率密度。
\(\text{Sol}\quad\)
\[\begin{aligned}
F_Z(z)=&P(Z\leq z)\\
=&P(Y-X^2\leq z)\\
=&\sum_{i=1}^2 P(Y\leq z+x^2|X=i)P(X=i)\\
=&\dfrac{3}{10}\int_{-\infty}^{z+1} f(y)\text dy+\dfrac{7}{10} \int_{-\infty}^{z+4} f(y)\text dy\\
f_Z(z)=&F_Z'(z)\\
=&\dfrac{3}{10}f(z+1)+\dfrac{7}{10}f(z+4)
\end{aligned}
\]
\(\text{Qn3}\quad\) 已知 \((X,Y)\) 的联合分布列为
\[P(X=n,Y=m)=\dfrac{(p\lambda)^m (q\lambda)^{n-m}}{m!(n-m)!}\text e^{-\lambda}
\]
其中 \(\lambda>0,p+q=1,n=0,1,2,\cdots,m=0,1,2,\cdots,n\),求 \(Z=X-Y\) 的分布列,并证明 \(Y\) 与 \(Z\) 相互独立。
\(\text{Sol}\quad\) 先
\[\begin{aligned}
P(Z=k)=&P(X-Y=k)\\
=&\sum_{i=0}^\infty P(X=k+i,Y=i)\\
=&\sum_{i=0}^\infty \dfrac{(p\lambda)^i(q\lambda)^k}{i!k!}\text e^{-\lambda}\\
=&\dfrac{(q\lambda)^k}{k!}\text e^{-q\lambda}
\end{aligned}
\]
后
\[\begin{aligned}
P(Y=m)=&\sum_{j=m}^\infty P(X=j,Y=m)\\
=&\sum_{j=m}^\infty \dfrac{(p\lambda)^m(q\lambda)^{j-m}}{m!(j-m)!}\text e^{-\lambda}\\
=&\dfrac{(p\lambda)^m}{m!}\text e^{-p\lambda}
\end{aligned}
\]
判断独立性
\[\begin{aligned}
&P(Z=k)P(Y=m)=\dfrac{p^mq^k}{m!k!}\lambda^{k+m}\text e^{-\lambda}\\
&P(Z=k,Y=m)=P(X=k+m,Y=m)=\dfrac{p^mq^k}{m!k!}\lambda^{k+m}\text e^{-\lambda}\\
\end{aligned}
\]
\(\text{Qn4}\quad\) 设 \(X\sim N(0,\sigma^2),Y\sim N(0,\sigma^2)\) 且相互独立,求 \(Z=\displaystyle\sqrt{X^2+Y^2}\) 的分布。
\(\text{Sol}\quad\) 考虑
\[\begin{aligned}
&f_X(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{x^2}{2\sigma^2}}\\
&f(x,y)=\dfrac{1}{2\pi\sigma^2}\text e^{-\frac{x^2+y^2}{2\sigma^2}}
\end{aligned}
\]
那么
\[\begin{aligned}
F_Z(z)=&\iint\limits_{\rho(z)} f(x,y) \text dx\text dy \\
=& \int_0^{2\pi}\text d \theta \int_0^z \dfrac{r}{2\pi\sigma^2} \text e^{-\frac{r^2}{2\sigma^2}}\text dr \\
=& 1-\text e^{-\frac{z^2}{2\sigma^2}}
\end{aligned}
\]
顺带提一下雅可比行列式忘了怎么办吧. 考虑到 \(\text dx\text dy\) 是面积微元的意思, 而面积微元的定义是 \(\text dx\wedge\text dy\). 用外积展开就好了.
\(\text{Qn5}\quad\) 从区间 \([0,1]\) 上任取 \(n\) 个点,求最大点与最小点之间距离的数学期望。
\(\text{Sol}\quad\) 设 \(X_1,X_2,\cdots,X_n\) 为 \(n\) 个点,令 \(Y=\text{max}(X_1,X_2,\cdots,X_n),Z=\text{min}(X_1,X_2,\cdots,X_n)\)
\[\begin{aligned}
&F_{\text{max}}(x)=\prod_i P(X_i<x)=x^n\\
&f_{\text{max}}(x)=nx^{n-1}\\
&F_{\text{min}}(x)=\prod_i P(X_i>x)=1-(1-x)^n\\
&f_{\text{min}}(x)=n(1-x)^{n-1}
\end{aligned}
\]
因此
\[E(Y)=\int_0^1 nx^n \text dx=\frac{n}{n+1},\quad E(Z)=\int_0^1 nx(1-x)^{n-1}\text dx=\frac{1}{n+1}
\]
\[E(Y-Z)=E(Y)-E(Z)=\frac{n-1}{n+1}
\]
\(\text{Qn6}\quad\) 设 \((X,Y)\sim N(1,1,2^2,3^2,0.5)\),求 \(E(\text{max}(X,Y))\)。
\(\text{Sol}\quad\) 小技巧 \(\text{max}(X,Y)=\dfrac{1}{2}(X+Y+|X-Y|)\)
其中
\[\begin{aligned}
E(X+Y)=&E(X)+E(Y)=2\\
E(X-Y)=&E(X)-E(Y)=0,\quad D(X-Y)=D(X)+D(Y)-2\text{Cov}(X,Y)=7\\
E|X-Y|=&\int_{-\infty}^{+\infty} |t|\frac{1}{\sqrt{14\pi}}\text e^{-\frac{t^2}{14}}\text dt\\
=&\frac{2}{\sqrt{14\pi}}\int_0^{+\infty}t\text e^{-\frac{t^2}{14}}\text dt\\
=&\sqrt{\frac{14}{\pi}}
\end{aligned}
\]
因此
\[E(\text{max}(X,Y))=1+\sqrt{\frac{7}{2\pi}}
\]
\(\text{Qn7}\quad\) 将 \(n\) 个编号为 \(1,2,\cdots,n\) 的球随机放入编号为 \(1,2,\cdots,n\) 的 \(n\) 个盒子中,一个盒子只能装一个球,如果第 \(i\) 号球正好放入了第 \(i\) 号盒子,称为一个配对。求配对数的期望与方差。
\(\text{Sol}\quad\) 令
\[X_i=\begin{cases}
1,\quad 第 i 个盒子配对\\
0,\quad 第 i 个盒子没配对\\
\end{cases}\quad,\quad i=1,2,\cdots,n
\]
则 \(X=\displaystyle\sum_{i=1}^n X_i\) 表示配对数,且 \(E(X_i)=\dfrac{1}{n},D(X_i)=\dfrac{n-1}{n^2}\)
因此
\[\begin{aligned}
E(X)=&\sum_{i=1}^n E(X_i)=n\frac{1}{n}=1\\
D(X)=&\sum_{i=1}^n D(X_i)+\sum_{i\neq j}\text{Cov}(X_i,X_j)\\
=&n\frac{n-1}{n^2}+\sum_{i\neq j}E(X_iX_j)-E(X_i)E(X_j)\\
=&\frac{n-1}{n}+2\text C^2_n\left(\frac{1}{n(n-1)}-\frac{1}{n^2}\right)\\
=&1
\end{aligned}
\]
\(\text{Qn8}\quad\) 设 \(X_1,X_2,\cdots,X_n,X_{n+1}\) 是正态总体 \(X\sim N(\mu,\sigma^2)\) 的样本,记
\[\bar{X}_n=\frac{1}{n}\sum_{i=1}^n X_i,\quad S_n^2=\frac{1}{n}\sum_{i=1}^n (X_i-\bar{X}_n)^2
\]
试证明统计量 \(U=\sqrt{\dfrac{n-1}{n+1}}\dfrac{X_{n+1}-\bar{X}_n}{S_n}\) 服从 \(t(n-1)\) 分布.
\(\text{Sol}\quad\) 考虑 \(\displaystyle{\frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1)}\),原式转化为
\[\frac{\sqrt{\frac{n}{n+1}}\frac{X_{n+1}-\bar{X}_n}{\sigma}}{\sqrt{\frac{\chi^2(n-1)}{n-1}}}
\]
而
\[\begin{aligned}
\sqrt{\frac{n}{n+1}}\frac{X_{n+1}-\bar{X}_n}{\sigma}=&\sqrt{\frac{n}{n+1}}\frac{N(\mu,\sigma^2)-N(\mu,\frac{\sigma^2}{n})}{\sigma}\\
=&\sqrt{\frac{n}{n+1}}\frac{N(0,\frac{n+1}{n}\sigma^2)}{\sigma}\\
=&\frac{N(0,\frac{n+1}{n}\sigma^2)}{\frac{\sigma}{\sqrt{\frac{n+1}{n}}}}
\end{aligned}
\]
因此原式服从 \(t(n-1)\) 分布.
\(\text{Qn9}\quad\) 设总体 \(X\sim N(\mu_1,\sigma^2)\) 与总体 \(Y\sim N(\mu_2,\sigma^2)\) 相互独立, \(X_1,X_2,\cdots,X_n\) 与 \(Y_1,Y_2,\cdots,Y_m\) 分别为 \(X\) 和 \(Y\) 的样本,\(\alpha,\beta\) 为常数,证明
\[T=\frac{\alpha(\bar{X}-\mu_1)+\beta(\bar{Y}-\mu_2)}{\sqrt{\frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\sqrt{\frac{\alpha^2}{n}+\frac{\beta^2}{m}}}
\]
服从 \(t(n+m-2)\) 分布.
\(\text{Sol}\quad\) 先考虑
\[\begin{aligned}
S_\omega=&\sqrt{\frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\\
=&\sigma\sqrt{\frac{\frac{(n-1)S_1^2}{\sigma^2}+\frac{(m-1)S_2^2}{\sigma^2}}{n+m-2}}\\
=&\sigma\sqrt{\frac{\chi^2(n+m-2)}{n+m-2}}
\end{aligned}
\]
接下来
\[\alpha(\bar{X}-\mu_1)+\beta(\bar{Y}-\mu_2)=N(\alpha\mu_1+\beta\mu_2,\alpha^2\frac{\sigma^2}{n}+\beta^2\frac{\sigma^2}{m})-(\alpha\mu_1+\beta\mu_2)
\]
标准化得证。
\(\text{Qn10}\quad\) 设总体为 \(X\), 总体均值 \(E(X)=\mu\) 和总体方差 \(D(X)=\sigma^2\) 存在. \(X_1,X_2,\cdots,X_n\) 为来自总体 \(X\) 的一个样本,求 \(\mu\) 和 \(\sigma^2\) 的矩估计量。
\(\text{Sol}\quad\) 矩估计:
\[\begin{cases}
E(X)=\bar{X}\\
E(X^2)=D(X)+(E(X))^2=A_2
\end{cases}
\]
即
\[\begin{cases}
\mu=\bar{X}\\
\sigma^2+\mu^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n X_i^2
\end{cases}
\]
解得
\[\begin{cases}
\hat{\mu}=\bar{X}\\
\hat{\sigma}^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (X_i-\bar{X})^2
\end{cases}
\]
\(\text{Qn11}\quad\) 设总体 \(X\sim N(\mu,\sigma^2)\), \(X_1,X_2,\cdots,X_n\) 为来自总体的一个样本,求未知参数 \(\mu\) 和 \(\sigma^2\) 的最大似然估计量.
\(\text{Sol}\quad\) 概率密度函数为
\[f(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}
\]
似然函数为
\[L(\mu,\sigma^2)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}=(2\pi\sigma^2)^{-\frac{n}{2}}\text e^{-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2}
\]
取对数后关于 \(\mu\), \(\sigma^2\) 求偏导
\[\begin{cases}
\dfrac{\partial \ln L(\mu,\sigma^2)}{\partial \mu}=\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n (x_i-\mu)=0\\
\dfrac{\partial \ln L(\mu,\sigma^2)}{\partial \sigma^2}=-\dfrac{n}{2\sigma^2}+\dfrac{1}{2\sigma^4}\displaystyle\sum_{i=1}^n (x_i-\mu)^2=0
\end{cases}
\]
解得
\[\begin{cases}
\hat{\mu}=\bar{X}\\
\hat{\sigma}^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (X_i-\bar{X})^2
\end{cases}
\]
最大似然法解得的结果和矩估计法不总是相同.
\(\text{Qn12}\quad\) 设某车间生产的滚珠的直径 \(X\sim N(\mu,\sigma^2)\), 现从某日生产的滚珠中抽取 \(9\) 个,测得样本方差为 \(s^2=0.25^2\), 在 \(0.95\) 置信度下求总体方差的 \(\sigma^2\) 的置信区间.
\(\text{Sol}\quad\) 先判定为单总体, 使用
\[\frac{n-1}{\sigma^2}s^2\sim \chi^2(n-1)
\]
根据分位点的恒等式
\[\begin{aligned}
P\left(\chi^2_{1-\frac{\alpha}{2}}(n-1)\leq \frac{n-1}{\sigma^2}s^2\leq \chi^2_{\frac{\alpha}{2}}(n-1) \right)=1-\alpha
\end{aligned}
\]
解得
\[\frac{(n-1)s^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}\leq \sigma^2 \leq \frac{(n-1)s^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}
\]
代入数据得置信区间 \([0.03,0.23]\).
\(\text{Qn13}\quad\) 设某车间生产的滚珠的直径 \(X\sim N(\mu,\sigma^2)\), 现从某日生产的滚珠中抽取 \(9\) 个, 测得样本方差为 \(s^2=0.25^2\), 在显著性水平 \(0.05\) 下是否可以认为总体方差的 \(\sigma^2=0.36^2\)?
\(\text{Sol}\quad\) 先判定为双侧检验, 原假设 \(H_0:\sigma^2=0.36^2\), 备择假设 \(H_1:\sigma^2\neq 0.36^2\)
使用统计量
\[\chi^2=\frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1)
\]
得
\[P\left(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1) \vee \chi^2> \chi^2_{\frac{\alpha}{2}}(n-1) \right)=\alpha
\]
拒绝域为 \(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\) 或 \(\chi^2> \chi^2_{\frac{\alpha}{2}}(n-1)\)
代入数据得 \(\chi^2\) 没有落在拒绝域中, 应接受原假设.
\(\text{Qn14}\quad\) 推导
\[F_{\alpha}(m,n)=\frac{1}{F_{1-\alpha}(n,m)}
\]
\(\text{Sol}\quad\) 根据定义
\[\begin{aligned}
&X\sim F(m,n)\quad\quad Y\sim F(n,m)\\
&x=F_{\alpha}(m,n)\quad\quad y=F_{1-\alpha}(n,m)\\
&P(X>x)=\alpha\quad\quad P(Y\leq y)=\alpha
\end{aligned}
\]
考虑
\[\begin{aligned}
&X=\frac{1}{Y}\\
&P(X>x)=P(Y\leq y)
\end{aligned}
\]
因此
\[F_{\alpha}(m,n)=\frac{1}{F_{1-\alpha}(n,m)}
\]
\(\text{Qn15}\quad\) 推导泊松分布的分布列是二项分布的极限.
\(\text{Sol}\quad\) 目标是证明
\[\begin{aligned}
\lim_{n\rightarrow\infty}np=\lambda\quad\Rightarrow\quad\lim_{n\rightarrow\infty}C^k_n p^k(1-p)^{n-k}=\frac{\lambda^k}{k!}\text e^{-\lambda}
\end{aligned}
\]
考虑展开
\[\begin{aligned}
C^k_n p^k(1-p)^{n-k}\rightarrow& \frac{n!}{k!(n-k)!}\cdot\frac{\lambda^k}{n^k}\cdot\left(1-\frac{\lambda}{n}\right)^{n-k}\\
\rightarrow& \frac{n!}{(n-k)!(n-\lambda)^k}\cdot\frac{\lambda^k}{k!}\text e^{-\lambda}\\
\rightarrow& \frac{\lambda^k}{k!}\text e^{-\lambda}
\end{aligned}
\]
\(\text{Qn16}\quad\) 推导正态分布标准化方法.
\(\text{Sol}\quad\) 目标是证明
\[\begin{cases}
\varphi(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\\
t=\dfrac{x-\mu}{\sigma}
\end{cases}\quad\Rightarrow\quad{f(t)=\dfrac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}}}
\]
考虑分布函数
\[\begin{aligned}
F(t)=&P(T\leq t)\\
=&P(X\leq \sigma t+\mu)\\
=&\int_{-\infty}^{\sigma t+\mu}\varphi(x)\text dx\\
=&\int_{-\infty}^{\sigma t+\mu}\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\text dx\\
=&\int_{-\infty}^t \frac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}}\text dt\\
\end{aligned}
\]
因此
\[f(t)=\frac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}}
\]
\(\text{Qn17}\quad\) 推导方差的计算公式.
\(\text{Sol}\quad\)
\[\begin{aligned}
D(X)=&E((X-E(X))^2)\\
=&E((X-\sum_i x_ip_i)^2)\\
=&\sum_j(x_j-\sum_i x_ip_i)^2p_j\\
=&\sum_j x_j^2p_j-2\sum_jx_jp_j\sum_ix_ip_i+\sum_jp_j(\sum_i x_ip_i)^2\\
=&E(X^2)-2E^2(X)+E(E^2(X))\\
=&E(X^2)-E^2(X)
\end{aligned}
\]
特殊地, 若 \(p_i=\dfrac{1}{n}\), 则 \(\displaystyle{D(X)=\frac{1}{n}\sum_{i=1}^n x_i^2-\bar{X}^2}\).
\(\text{Qn18}\quad\) 计算各种分布的期望和方差.
\(\text{Sol}\quad\) 0-1 分布:
\[E(X)=p,\quad D(X)=E(X^2)-E^2(X)=p-p^2
\]
二项分布:
\[\begin{aligned}
E(X)=&\sum_{k=1}^n kC_n^k p^k(1-p)^{n-k}\\
=&n\sum_{k=1}^n C^{k-1}_{n-1} p^k (1-p)^{n-k}\\
=&np\sum_{k=1}^n C^{k-1}_{n-1} p^{k-1}(1-p)^{n-k}\\
=&np(p+1-p)^{n-1}\\
=&np\\
D(X)=&E(X^2)-E^2(X)\\
=&\sum_{i=1}^n k^2C^k_n p^k (1-p)^{n-k}-n^2p^2\\
=&np\sum_{k=1}^n C^{k-1}_{n-1} p^{k-1}(1-p)^{n-k}+n(n-1)p^2\sum_{k=2}^n C^{k-2}_{n-2}p^{k-2}(1-p)^{n-k}-n^2p^2\\
=&np+n(n-1)p^2-n^2p^2\\
=&np(1-p)
\end{aligned}
\]
泊松分布:
\[\begin{aligned}
E(X)=&\sum_{i=1}^{\infty} i\frac{\lambda^{i}}{i!}\text e^{-\lambda}\\
=&\lambda \text e^{-\lambda}\sum_{i=0}^{\infty} \frac{\lambda^{i}}{i!}\\
=&\lambda\\
D(X)=&E(X^2)-E^2(X)\\
=&\lambda\text e^{-\lambda} \sum_{i=1}^\infty i\frac{\lambda^{i-1}}{(i-1)!}-\lambda^2\\
=&\lambda(\lambda+1)\text e^{-\lambda}\sum_{i=0}^\infty \frac{\lambda^i}{i!}-\lambda^2\\
=&\lambda^2+\lambda-\lambda^2\\
=&\lambda
\end{aligned}
\]
几何分布:
\[\begin{aligned}
E(X)=&\sum_{k=1}^\infty kp(1-p)^{k-1}\\
=&-p\frac{\text d}{\text dp}\sum_{k=0}^\infty (1-p)^k\\
=&-p\frac{\text d}{\text dp}\frac{1}{p}\\
=&\frac{1}{p}\\
D(X)=&E(X^2)-E^2(X)\\
=&\sum_{k=1}^\infty k^2 p(1-p)^{k-1}-\frac{1}{p^2}\\
=&p\frac{\text d}{\text dp}\left((1-p)\frac{\text d}{\text dp}\sum_{k=1}^\infty (1-p)^k\right)-\frac{1}{p^2}\\
=&-\frac{1}{p}+\frac{2}{p^2}-\frac{1}{p^2}\\
=&\frac{1-p}{p^2}
\end{aligned}
\]
均匀分布:
\[\begin{aligned}
E(X)=&\int_a^b \frac{1}{b-a}x\text dx\\
=&\frac{1}{b-a}\left(\frac{b^2}{2}-\frac{a^2}{2}\right)\\
=&\frac{a+b}{2}\\
D(X)=&E(X^2)-E^2(X)\\
=&\int_a^b \frac{1}{b-a} x^2\text dx-\frac{(a+b)^2}{4}\\
=&\frac{1}{3}(a^2+b^2+ab)-\frac{1}{4}(a+b)^2\\
=&\frac{(b-a)^2}{12}
\end{aligned}
\]
指数分布:
\[\begin{aligned}
E(X)=&\lambda \int_0^{+\infty} x \text e^{-\lambda x}\text dx\\
=&\left(-x\text e^{-\lambda x}-\frac{\text e^{-\lambda x}}{\lambda}\right)\bigg|_0^{+\infty}\\
=&\frac{1}{\lambda}\\
D(X)=&E(X^2)-E^2(X)\\
=&\lambda\int_0^{+\infty}x^2\text e^{-\lambda x}\text dx-\frac{1}{\lambda^2}\\
=&\frac{2}{\lambda^2}-\frac{1}{\lambda^2}\\
=&\frac{1}{\lambda^2}
\end{aligned}
\]
\(\text{Qn19}\quad\) 证明独立的正态分布的和仍然服从正态分布.
\(\text{Sol}\quad\) 先说明一个引理:
\[P(X+Y=z)=\sum P(X=x,Y=z-x)=\int_{-\infty}^{+\infty} f(x,z-x)\text dx
\]
这告诉我们变量的和分布等同于变量的卷积.
下面开始证明:
设 \(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2), Z=aX+bY, \sigma=\sqrt{\sigma_1^2+\sigma_2^2}\)
\[\begin{aligned}
f(z)=&\int_{-\infty}^{+\infty} f(x,z-x)\text dx\\
=&\int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)\text dx\\
=&\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma_1}\text e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\cdot \frac{1}{\sqrt{2\pi}\sigma_2}\text e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}\text dx\\
=&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{\sigma_2^2(x-\mu_1)^2+\sigma_1^2(z-x-\mu_2)^2}{2\sigma_1^2\sigma_2^2}} \text dx\\
=&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{(\sigma_1^2+\sigma_2^2)x^2+2((\mu_2-z)\sigma_1^2-\mu_1\sigma_2^2)x+(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{2\sigma_1^2\sigma_2^2}}\text dx\\
=&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{x^2+\frac{2((\mu_2-z)\sigma_1^2-\mu_1\sigma_2^2)x}{\sigma^2}+\frac{(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{\sigma^2}}{\frac{2\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\
=&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{\left(x-\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2+\frac{(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{\sigma^2}-\left(\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\
=&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{\sigma^2((z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2)-((z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2)^2}{2\sigma^2\sigma_1^2\sigma_2^2}} \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\frac{\sigma_1\sigma_2}{\sigma}} \text e^{-\frac{\left(x-\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2}{2\frac{\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\
=&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{\sigma_1^2\sigma_2^2z^2-2\sigma_1^2\sigma_2^2(\mu_1+\mu_2)z+\sigma_1^2\sigma_2^2(\mu_1^2+\mu_2^2)+2\mu_1\mu_2\sigma_1^2\sigma_2^2}{2\sigma^2\sigma_1^2\sigma_2^2}}\\
=&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{z^2-2(\mu_1+\mu_2)z+(\mu_1+\mu_2)^2}{2\sigma^2}}\\
=&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(z-(\mu_1+\mu_2))^2}{2\sigma^2}}
\end{aligned}
\]
证毕.
\(\text{Qn20}\quad\) 证明样本均值 \(\bar{X}\) 和样本方差 \(S^2\) 分别是 \(\mu\) 和 \(\sigma^2\) 的无偏估计量.
\(\text{Sol}\quad\)
\[\begin{aligned}
E(\bar{X})=&E\left(\frac{1}{n}\sum_{i=1}^n X_i\right)\\
=&\frac{1}{n}\sum_{i=1}^n E(X_i)\\
=&\frac{1}{n}\cdot n\mu\\
=&\mu\\
E(S^2)=&E\left(\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2\right)\\
=&\frac{1}{n-1}E\left(\sum_{i=1}^n X_i^2-n\bar{X}^2\right)\\
=&\frac{1}{n-1}\left(\sum_{i=1}^n E(X_i^2)-nE(\bar{X}^2)\right)\\
=&\frac{1}{n-1}\left(\sum_{i=1}^n\left(E^2(X_i)+D(X_i)\right)- n\left(E^2(\bar{X})+D(\bar{X})\right) \right)\\
=&\frac{1}{n-1}\left(n(\mu^2+\sigma^2)-n\left(\mu^2+\frac{\sigma^2}{n}\right)\right)\\
=&\sigma^2
\end{aligned}
\]
3 理解
-
大写字母代表随机变量, 小写字母代表随机变量的值.
-
全概率公式基于样本空间的划分计算总概率, 由原因推结果; 贝叶斯公式基于总概率反推原先划分的概率, 由结果推原因.
-
独立事件的条件概率只需要将条件代入即可, 不用将积事件除以条件事件.
-
分布函数 (CDF, Cumulative Distribution Function) 是不超过某个值的概率总和, 离散的分布列 (PMF, Probability Mass Function) 或连续的密度函数 (PDF, Probability Density Function) 是某个值的概率. 分布函数一定单调不减趋于 1.
-
相关性指的是两个变量具有线性关系的程度, 独立性指的是一个变量的取值对另一个变量没有影响. 如果两变量独立, 那么相关系数一定为 0. 只有任意阶原点矩的相关性均为 0, 两变量才独立.
-
期望等同于均值, 一个随机变量取到期望的概率最大. 方差用来描述随机变量的离散程度, 方差越小数据越集中.
-
协方差是描述两个随机变量的线性相关方向的指标, 它的值与变量取值有关, 因此其大小无意义; 相关系数是描述两个随机变量的线性相关方向和程度的指标, 它的值是标准化后的协方差, 因此其大小可以衡量程度.
-
在能够计算理论值的前提下, 期望和方差就像高中学过的那样计算; 在不能够得知样本全貌的情况下, 我们只能计算样本均值和样本方差, 然后通过它们预计理论上期望和方差的值.
-
点估计用于从样本数据计算出总体参数的单一值; 区间估计用于从样本数据计算出总体参数范围; 假设检验用于从样本数据对总体参数进行推断,它可以用来检验总体参数的假设值是否成立; 它们思想的本质都是用测量的数据趋近理论的数据.
4 真题
\(\text{Qn1}\quad\) 判断对错:
(1) 三个事件 \(A,B,C\) 两两独立, 那么 \(A,B,C\) 相互独立.
(2) 随机变量分为离散型随机变量和连续型随机变量.
(3) 伯努利大数定律表明只要重复试验的次数充分大, 那么事件发生的频率就是概率.
(4) 若事件 \(A\) 与事件 \(B\) 相互独立, \(C\) 为 \(B\) 的子集, 则 \(A\) 与 \(C\) 也相互独立.
\(\text{Sol}\quad\) 全错.
(1) 对于 \(n\) 个事件, 如果对于任意 \(2\) 个, 任意 \(3\) 个, \(\cdots\), 任意 \(n\) 个事件的积事件的概率, 都等于各事件概率的积, 那么称这些事件相互独立.
(2) 随机变量可以又不离散又不连续, 比如分段的.
(3) 体会一下 "收敛于" 概率和 "就是" 概率的区别.
(4) \(A\) 和 \(C\) 可以没有任何交集, 因此不一定独立.
\(\text{Qn2}\quad\) 已知 \(P(A)=0.1, P(B)=0.5, A\subset B\), 求 \(P(A\cup \bar{B}|\bar{A})\).
\(\text{Sol}\quad\)
\[\begin{aligned}
P(A\cup \bar{B}|\bar{A})=&\frac{P(\bar{A}\cap\bar{B})}{P(\bar{A})}\\
=&\frac{P(\overline{A\cup B})}{P(\bar{A})}\\
=&\frac{1-P(B)}{1-P(A)}\\
=&\frac{5}{9}
\end{aligned}
\]
\(\text{Qn3}\quad\) 设 \(X_1,X_2,\cdots,X_10\) 是来自总体 \(X\) 的一组样本, 样本一阶矩和二阶矩分别是 \(2.6\) 和 \(12.9\), 计算样本方差.
\(\text{Sol}\quad\) 考虑
\[\begin{cases}
E(X)=A_1\\
D(X)+E^2(X)=A_2\\
S^2=\dfrac{n}{n-1}D(X)
\end{cases}
\]
联立解得 \(S^2=6.82\).
\(\text{Qn4}\quad\) 将一个骰子连续重复掷 \(4\) 次, 以 \(X\) 表示 \(4\) 次掷出的点数之和, 则 \(P(10<X<18)\geq?\)
\(\text{Sol}\quad\) 记 \(X_k\) 表示第 \(k\) 次的点数, 则它们独立同分布.
\[E(X_k)=\frac{7}{2}\quad D(X_k)=E(X_k^2)-E^2(X_k)=\frac{1}{6}(1^2+2^2+\cdots+6^2)-\left(\frac{7}{2}\right)^2=\frac{35}{12}
\]
令 \(X=\displaystyle\sum_{k=1}^4 X_k\)
\[E(X)=4E(X_k)=14\quad D(X)=D(\sum_{k=1}^4 X_k)=4D(X_k)=\frac{35}{3}
\]
由契比雪夫不等式
\[P(10<X<18)=P(|X-14|<4)\geq1-\frac{\frac{35}{3}}{4^2}=\frac{13}{48}
\]
\(\text{Qn5}\quad\) 已知联合密度函数 \(f(x,y)=\text e^{-x}\), \(0<y<x\), 计算条件概率 \(P(Y>2|X=3)\).
\(\text{Sol}\quad\) 根据定义, 首先计算 \(f_{Y|X}(y|x)\)
\[\begin{aligned}
f_{Y|X}(y|x)=&\frac{f(x,y)}{f_X(x)}\\
=&\frac{f(x,y)}{\int_{-\infty}^{+\infty} f(x,y)\text dy}\\
=&\frac{\text e^{-x}}{x\text e^{-x}}\\
=&\frac{1}{x}
\end{aligned}
\]
后代入 \(X=3\)
\[\begin{aligned}
P(Y>2|X=3)=&1-P(Y\leq 2|X=3)\\
=&1-\int_{-\infty}^2 f_{Y|X}(y|x) \text dy\\
=&1-\int_{-\infty}^2 \frac{1}{x} \text dy\\
=&\frac{1}{3}
\end{aligned}
\]
\(\text{Qn6}\quad\) 设 \((X,Y)\) 的联合密度函数为 \(\displaystyle{f(x,y)=\frac{1}{2\pi}\text e^{-\frac{x^2+y^2}{2}}(1+\sin x\sin y)}\), 计算: (1) \(f_X(x),f_Y(y)\), 并判断 \(X,Y\) 独立性; (2) \(f_{Y|X}(y|x)\), \(P(Y<0|X=0)\).
\(\text{Sol}\quad\) (1) \(X\) 和 \(Y\) 是对称的
\[\begin{aligned}
f_X(x)=&\int_{-\infty}^{+\infty} f(x,y)\text dy\\
=&\frac{1}{2\pi}\int_{-\infty}^{+\infty} \text e^{-\frac{x^2+y^2}{2}}(1+\sin x\sin y) \text dy\\
=&\frac{1}{2\pi}\text e^{-\frac{x^2}{2}}\left(\int_{-\infty}^{+\infty}\text e^{-\frac{y^2}{2}}+\sin x\int_{-\infty}^{+\infty}\text e^{-\frac{y^2}{2}}\sin y\text dy\right)\\
=&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{x^2}{2}}\\
f_Y(y)=&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}}
\end{aligned}
\]
由 \(f_X(x)f_Y(y)\neq f(x,y)\) 知 \(X\) 与 \(Y\) 不独立.
(2)
\[\begin{aligned}
f_{Y|X}(y|x)=&\frac{f(x,y)}{f_X(x)}\\
=&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}}(1+\sin x\sin y)
\end{aligned}
\]
代入 \(X=0\), 考虑正态分布的性质
\[P(Y<0|X=0)=\int_{-\infty}^0 \frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}}\text dy=\frac{1}{2}
\]
\(\text{Qn7}\quad\) 已知二维随机变量 \((X,Y)\) 的联合分布函数为 \(F(x,y)=A(B+\arctan x)(C+\arctan y)\)
(1) 求常数 \(A,B,C\)
(2) 判断 \(X\) 与 \(Y\) 是否独立
(3) 求 \(f_{X|Y}(x|y)\)
\(\text{Sol}\quad\) (1) 考虑 \(F(+\infty,+\infty)=1,F(-\infty,y)=F(x,-\infty)=0\)
解得 \(A=\dfrac{1}{\pi^2},B=\dfrac{\pi}{2},C=\dfrac{\pi}{2}\)
(2)
\[\begin{aligned}
F_X(x)=&F(x,+\infty)=\frac{1}{\pi}(\frac{\pi}{2}+\arctan x)\\
F_Y(y)=&F(+\infty,y)=\frac{1}{\pi}(\frac{\pi}{2}+\arctan y)\\
F(x,y)=&F_X(x)F_Y(y)
\end{aligned}
\]
因此相互独立.
(3)
\[\begin{aligned}
f_{X|Y}(x|y)=&\frac{f(x,y)}{f_Y(y)}\\
=&f_X(x)\\
=&\frac{1}{\pi}\frac{1}{1+x^2}
\end{aligned}
\]
\(\text{Qn8}\quad\) 随机变量 \(X\) 的概率密度 \(f(x)=\begin{cases}2x,\quad 0<x<1\\0,\quad \text{其他}\end{cases}\), 对 \(X\) 独立重复试验 \(162\) 次, 设观察到的值小于 \(\dfrac{1}{3}\) 的次数为 \(Y\), 求 \(P(Y>22)\) 的近似值.
\(\text{Sol}\quad\) 先计算二项分布的 \(p\)
\[\begin{aligned}
p=&P(X<\frac{1}{3})\\
=&F(\frac{1}{3})\\
=&\int_0^{\frac{1}{3}} 2x\text dx\\
=&\frac{1}{9}
\end{aligned}
\]
接下来计算二项分布的期望和方差
\[\begin{aligned}
E(X)=&np=18\\
D(X)=&np(1-p)=16
\end{aligned}
\]
由中心极限定理, 二项分布趋近于正态分布 \(N(18,16)\)
\[\begin{aligned}
P(Y>22)=&P\left(\frac{Y-18}{4}>1\right)\\
=&1-\Phi(1)\\
=&0.1587
\end{aligned}
\]
\(\text{Qn9}\quad\) 设总体 \(X\) 的概率密度为 \(f(x)=\begin{cases}\theta c^{\theta} x^{-(\theta+1)},\quad x>c\\0,\quad x\leq c\end{cases}\), 其中 \(c>0\) 为已知参数, \(\theta>1\) 为未知参数, \(X_1,X_2,\cdots,X_n\) 为来自 \(X\) 的一个样本, \(x_1,x_2,\cdots,x_n\) 为相应的样本值, 求 \(\theta\) 的矩估计量与最大似然估计量.
\(\text{Sol}\quad\) 矩估计:
\[\begin{aligned}
E(X)=\frac{1}{n}\sum_{i=1}^n x_i=\int_c^{+\infty} \theta c^{\theta}x^{-\theta}\text dx=\frac{c\theta}{\theta-1}
\end{aligned}
\]
解得
\[\hat{\theta}=\frac{\sum_{i=1}^n x_i}{\sum_{i=1}^n x_i-cn}
\]
最大似然法:
\[\begin{aligned}
L(\theta)=&\prod_{i=1}^n \theta c^{\theta} x_i^{-(\theta+1)}\\
=&(\theta c^\theta)^n \left(\prod_{i=1}^n x_i\right)^{-(\theta+1)}\\
\ln L(\theta)=&n\ln\theta+\left(n\ln c-\sum_{i=1}^n \ln(x_i)\right)\theta-\sum_{i=1}^n \ln(x_i)\\
\frac{\text d}{\text d\theta}\ln L(\theta)=&\frac{n}{\theta}+n\ln c-\sum_{i=1}^n \ln(x_i)=0
\end{aligned}
\]
解得
\[\hat{\theta}=\frac{n}{\sum_{i=1}^n\ln(x_i)-n\ln c}
\]
\(\text{Qn10}\quad\) 一位中学校长在报纸上看到这样一则报道: 中学生每周至少看 \(8\) 小时电视. 他认为他所在学校学生看电视时间明显小于 \(8\) 小时. 为此在该校随机调查了 \(100\) 名学生, 计算平均每周看电视的时间为 \(6.5\) 小时. 假设学生每周看电视的时间服从正态分布, 总体方差为 \(4\), 在显著性水平 \(0.05\) 的条件下, 是否可以认为这个校长的看法正确?
\(\text{Sol}\quad\) 原假设 \(H_0: \mu\geq 8\), 备择假设 \(H_1: \mu<8\)
考虑
\[z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)
\]
拒绝域
\[P(z<z_{1-\alpha})=\alpha
\]
计算得
\[z=-7.5<-1.64=z_{0.95}
\]
因此落在拒绝域中, 选择备择假设 \(H_1\)
关于怎样判定拒绝域的方向: 通常情况下和 \(H_1\) 的方向相同. 本题中, 由于 \(\mu\) 越大也就是 \(z\) 越小, 越容易落在拒绝域中, 因此判定为左侧检验, 拒绝域在左侧.