概率论与数理统计

1 公式

1.1 条件概率

\[\begin{aligned} 条件概率 &\quad P(A|B)=\dfrac{P(AB)}{P(B)}\\ 乘法公式 &\quad P(AB)=P(A)P(B|A)=P(A|B)P(B)\\ 全概率公式 &\quad P(A)=\sum P(A|B_i) P(B_i)\\ 贝叶斯公式 &\quad P(B_i|A)=\dfrac{P(B_iA)}{P(A)}=\dfrac{P(A|B_i)P(B_i)}{\sum P(A|B_j) P(B_j)}\\ \end{aligned} \]

1.2 常见分布

\[\begin{aligned} 0-1分布 &\quad P(X=k)=p^k(1-p)^{1-k}\\ 二项分布B(n,p) &\quad P(X=k)=C^k_n p^k (1-p)^{n-k}\\ 泊松分布P(\lambda) &\quad P(X=k)=\dfrac{\lambda^k}{k!}\text e^{-\lambda}\\ 均匀分布U(a,b) &\quad f(x)=\dfrac{1}{b-a}\\ 正态分布N(\mu,\sigma^2) &\quad \varphi(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\\ 指数分布E(\lambda) &\quad f(x)=\lambda\text e^{-\lambda x}\\ 几何分布G(p) &\quad P(X=k)=p(1-p)^{k-1}\\ 超几何分布H(N,M,n) &\quad P(X=k)=\dfrac{C^k_M C^{n-k}_{N-M}}{C^n_N}\\ 二维均匀分布 &\quad f(x,y)=\dfrac{1}{S_D}\\ 二维正态分布 &\quad \varphi(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\text e^{-\frac{1}{2(1-\rho^2)}\left(\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}\right)}\\ \end{aligned} \]

1.3 联合概率分布

\[\begin{aligned} 联合分布函数 &\quad F(x,y)=\int_{-\infty}^x \int_{-\infty}^y f(x,y)\text dx\text dy\\ 边际分布函数 &\quad F_X(x)=\int_{-\infty}^x\int_{-\infty}^{+\infty} f(x,y)\text dx\text dy\\ 边际密度函数 &\quad f_X(x)=\int_{-\infty}^{+\infty} f(x,y) \text dy\\ 条件密度函数 &\quad f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)} \end{aligned} \]

1.4 随机变量函数的概率分布

\[\begin{aligned} 一元离散型 &\quad P(Y=y_j)=\sum_{g(x_i)=y_i} P(X=x_i)\\ 多元离散型 &\quad P(Z=z_k)=\sum_{g(x_i,y_j)=z_k} P(X=x_i,Y=y_j)\\ 一元连续型 &\quad F_Y(y)=P(Y\leq y)=P(g(x)\leq y)=\int_{g(x)\leq y} f_X(x) \text dx \quad f_Y(y)=F'_Y(y)\\ 多元连续型 &\quad F_Z(z)=P(Z\leq z)=P(g(x,y)\leq z)=\iint_{g(x,y)\leq z} f(x,y)\text dx\text dy \quad f_Z(z)=F'_Z(z) \end{aligned} \]

1.5 正态分布

\[\begin{aligned} 标准正态分布 &\quad X\sim N(0,1) \Rightarrow \Phi(a)=P(X\leq a)\\ 一般正态分布 &\quad X\sim N(\mu,\sigma^2) \Rightarrow \dfrac{X-\mu}{\sigma}\sim N(0,1),\Phi\left(\dfrac{a-\mu}{\sigma}\right)=P(X\leq a)\\ 二维边际性质 &\quad (X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) \Rightarrow X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\\ &\quad aX+ bY\sim N(a\mu_1+b\mu_2,a^2\sigma_1^2+b^2\sigma_2^2+2ab\text{Cov}(X,Y)) \end{aligned} \]

1.6 数学期望

\[\begin{aligned} 一元离散型 &\quad E(X)=\sum_k x_kp_k\\ 多元离散型 &\quad E(Z)=\sum_i\sum_j g(x_i,y_j)p_{ij}\\ 一元连续型 &\quad E(X)=\int_{-\infty}^{+\infty} xf(x)\text dx\\ 多元连续型 &\quad E(Z)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} g(x,y)f(x,y) \text dx\text dy\\ 线性性质 &\quad E(aX+bY)=aE(X)+bE(Y) \end{aligned} \]

1.7 方差与相关系数

\[\begin{aligned} 方差 &\quad D(X)=E(X-E(X))^2=E(X^2)-E^2(X)\\ &\quad D(aX+bY)=a^2D(X)+b^2D(Y)+2ab\text{Cov}(X,Y)\\ 协方差 &\quad \text{Cov}(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY)-E(X)E(Y)\\ &\quad\text{Cov}(X_1+X_2,Y)=\text{Cov}(X_1,Y)+\text{Cov}(X_2,Y)\\ 相关系数 &\quad\rho_{xy}=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}=\frac{\text{Cov}(X,Y)}{\sigma_1\sigma_2} \end{aligned} \]

1.8 大数定律与中心极限定理

\[\begin{aligned} &\text{契比雪夫不等式}\\ &\quad\quad\quad\quad\quad\quad\quad\quad P(|X-\mu|< k)\geq 1-\frac{\sigma^2}{k^2}\\ &n\text{个相互独立的随机变量的算术平均值,在}n\text{无限增加时趋近一个期望值}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty} P\left(\left|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^nE(X_i)\right|\geq \varepsilon\right)=0\\ &n\text{重独立重复实验,事件发生频率趋近概率}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\left|\frac{n_A}{n}-p\right|\geq \varepsilon\right)=0\\ &\text{独立同分布的随机变量序列的样本均值的极限分布是正态分布}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\frac{\sum_{i=1}^nX_i-n\mu}{\sqrt{n}\sigma}\leq x\right)=\Phi(x)\\ &\text{二项分布的极限分布是正态分布}\\ &\quad\quad\quad\quad\quad\quad\quad\quad\lim_{n\rightarrow\infty}P\left(\frac{X-np}{\sqrt{np(1-p)}}\leq x\right)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x \text e^{-\frac{t^2}{2}}\text dt=\Phi(x) \end{aligned} \]

1.9 \(\chi^2\) 分布

\[\begin{aligned} &X_i\sim N(0,1)\Rightarrow\chi^2=X_1^2+X_2^2+\cdots+X_n^2\\ &X\sim\chi^2(n), Y\sim\chi^2(m)\Rightarrow X+Y\sim\chi^2(n+m)\\ &X\sim\chi^2(n)\Rightarrow E\left(\chi^2(n)\right)=n, D\left(\chi^2(n)\right)=2n \end{aligned} \]

1.10 \(t\) 分布

\[\begin{aligned} &X\sim N(0,1),Y\sim\chi^2(n)\Rightarrow t=\frac{X}{\sqrt{\frac{Y}{n}}}\\ &\lim_{n\rightarrow\infty}f(x)=\frac{1}{\sqrt{2\pi}}\text e^{-\frac{x^2}{2}} \end{aligned} \]

1.11 \(F\) 分布

\[\begin{aligned} &X\sim\chi^2(n),Y\sim\chi^2(m)\Rightarrow F=\frac{\frac{X}{n}}{\frac{Y}{m}}\\ &X\sim F(n,m)\Rightarrow \frac{1}{X}\sim F(m,n)\\ &t\sim t(n)\Rightarrow t^2\sim F(1,n) \end{aligned} \]

1.12 正态总体的抽样分布

\[\begin{aligned} 单正态总体 &\quad \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)\\ &\quad \frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1)\\ &\quad \frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}\sim t(n-1)\\ 双正态总体 &\quad \frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}}}\sim N(0,1)\\ &\quad \frac{S_1^2}{S_2^2}\cdot\frac{\sigma_2^2}{\sigma_1^2}\sim F(n-1,m-1)\\ &\sigma_1=\sigma_2,S_\omega=\sqrt{\dfrac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\Rightarrow\dfrac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{S_\omega\sqrt{\frac{1}{n}+\frac{1}{m}}}\sim t(n+m-2) \end{aligned} \]

1.13 点估计

\[\begin{aligned} 矩估计法 &\quad E(X^i)=A_i=\frac{1}{n}\sum_{j=1}^n x_j^i\\ 最大似然法 &\quad L(\hat{\theta})=\text{max}L(\theta)=\text{max}\prod_{i=1}^n p(x_i,\theta)\\ 无偏性 &\quad E(\hat{\theta})=\theta\\ 有效性 &\quad D(\hat{\theta}_1)<D(\hat{\theta}_2)\\ 一致性 &\quad \lim_{n\rightarrow\infty} P(|\hat{\theta}_n-\theta|<\varepsilon)=1 \end{aligned} \]

1.14 分位点

\[\begin{aligned} 区间估计 &\quad P\left(Y<Y_\alpha\right)=1-\alpha\\ &\quad P\left(Y>Y_{1-\alpha}\right)=1-\alpha\\ &\quad P\left(Y_{1-\frac{\alpha}{2}}<Y<Y_{\frac{\alpha}{2}}\right)=1-\alpha\\ 假设检验 &\quad P\left(Y>Y_\alpha \right)=\alpha\\ &\quad P\left(Y<Y_{1-\alpha} \right)=\alpha\\ &\quad P\left(Y<Y_{1-\frac{\alpha}{2}} \vee Y>Y_{\frac{\alpha}{2}} \right)=\alpha \end{aligned} \]

2 练习

\(\text{Qn1}\quad\) 设二维随机变量 \((X,Y)\) 的联合密度函数为:

\[f(x,y)=\begin{cases} \dfrac{1}{4}(1+xy)\quad |x|<1,|y|<1\\ 0\quad 其他 \end{cases} \]

证明:\(X\)\(Y\) 不独立,\(X^2\)\(Y^2\) 独立。

\(\text{Sol}\quad\) 显然

\[\begin{aligned} &f(x)=\int_{-1}^1\dfrac{1}{4}(1+xy)\text dy=\dfrac12\quad f(y)=f(x)=\dfrac12\\ &f(x)\cdot f(y)\neq f(x,y) \end{aligned} \]

\(U=X^2,V=Y^2\)

\[\begin{aligned} F(u,v)=&P(U\leq u,V\leq v)\\ =&P(X^2<u,Y^2<v)\\ =&\int_{-\sqrt{u}}^{\sqrt{u}}\int_{-\sqrt{v}}^{\sqrt{v}}\dfrac{1}{4}(1+xy)\text dx\text dy\\ =&\sqrt{uv} \end{aligned} \]

\[\begin{aligned} &F(u)=F(u,1)=\sqrt{u}\quad F(v)=F(1,v)=\sqrt{v}\\ &F(u,v)=F(u)\cdot F(v) \end{aligned} \]

证毕。

\(\text{Qn2}\quad\) 设随机变量 \(X\)\(Y\) 独立,其中 \(X\) 的概率分布为 \(X\sim\left(\begin{matrix}1&2\\0.3&0.7\end{matrix}\right)\), 而 \(Y\) 的概率密度为 \(f(y)\), 求随机变量 \(Z=Y-X^2\) 的概率密度。

\(\text{Sol}\quad\)

\[\begin{aligned} F_Z(z)=&P(Z\leq z)\\ =&P(Y-X^2\leq z)\\ =&\sum_{i=1}^2 P(Y\leq z+x^2|X=i)P(X=i)\\ =&\dfrac{3}{10}\int_{-\infty}^{z+1} f(y)\text dy+\dfrac{7}{10} \int_{-\infty}^{z+4} f(y)\text dy\\ f_Z(z)=&F_Z'(z)\\ =&\dfrac{3}{10}f(z+1)+\dfrac{7}{10}f(z+4) \end{aligned} \]

\(\text{Qn3}\quad\) 已知 \((X,Y)\) 的联合分布列为

\[P(X=n,Y=m)=\dfrac{(p\lambda)^m (q\lambda)^{n-m}}{m!(n-m)!}\text e^{-\lambda} \]

其中 \(\lambda>0,p+q=1,n=0,1,2,\cdots,m=0,1,2,\cdots,n\),求 \(Z=X-Y\) 的分布列,并证明 \(Y\)\(Z\) 相互独立。

\(\text{Sol}\quad\)

\[\begin{aligned} P(Z=k)=&P(X-Y=k)\\ =&\sum_{i=0}^\infty P(X=k+i,Y=i)\\ =&\sum_{i=0}^\infty \dfrac{(p\lambda)^i(q\lambda)^k}{i!k!}\text e^{-\lambda}\\ =&\dfrac{(q\lambda)^k}{k!}\text e^{-q\lambda} \end{aligned} \]

\[\begin{aligned} P(Y=m)=&\sum_{j=m}^\infty P(X=j,Y=m)\\ =&\sum_{j=m}^\infty \dfrac{(p\lambda)^m(q\lambda)^{j-m}}{m!(j-m)!}\text e^{-\lambda}\\ =&\dfrac{(p\lambda)^m}{m!}\text e^{-p\lambda} \end{aligned} \]

判断独立性

\[\begin{aligned} &P(Z=k)P(Y=m)=\dfrac{p^mq^k}{m!k!}\lambda^{k+m}\text e^{-\lambda}\\ &P(Z=k,Y=m)=P(X=k+m,Y=m)=\dfrac{p^mq^k}{m!k!}\lambda^{k+m}\text e^{-\lambda}\\ \end{aligned} \]

\(\text{Qn4}\quad\)\(X\sim N(0,\sigma^2),Y\sim N(0,\sigma^2)\) 且相互独立,求 \(Z=\displaystyle\sqrt{X^2+Y^2}\) 的分布。

\(\text{Sol}\quad\) 考虑

\[\begin{aligned} &f_X(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{x^2}{2\sigma^2}}\\ &f(x,y)=\dfrac{1}{2\pi\sigma^2}\text e^{-\frac{x^2+y^2}{2\sigma^2}} \end{aligned} \]

那么

\[\begin{aligned} F_Z(z)=&\iint\limits_{\rho(z)} f(x,y) \text dx\text dy \\ =& \int_0^{2\pi}\text d \theta \int_0^z \dfrac{r}{2\pi\sigma^2} \text e^{-\frac{r^2}{2\sigma^2}}\text dr \\ =& 1-\text e^{-\frac{z^2}{2\sigma^2}} \end{aligned} \]

顺带提一下雅可比行列式忘了怎么办吧. 考虑到 \(\text dx\text dy\) 是面积微元的意思, 而面积微元的定义是 \(\text dx\wedge\text dy\). 用外积展开就好了.

\(\text{Qn5}\quad\) 从区间 \([0,1]\) 上任取 \(n\) 个点,求最大点与最小点之间距离的数学期望。

\(\text{Sol}\quad\)\(X_1,X_2,\cdots,X_n\)\(n\) 个点,令 \(Y=\text{max}(X_1,X_2,\cdots,X_n),Z=\text{min}(X_1,X_2,\cdots,X_n)\)

\[\begin{aligned} &F_{\text{max}}(x)=\prod_i P(X_i<x)=x^n\\ &f_{\text{max}}(x)=nx^{n-1}\\ &F_{\text{min}}(x)=\prod_i P(X_i>x)=1-(1-x)^n\\ &f_{\text{min}}(x)=n(1-x)^{n-1} \end{aligned} \]

因此

\[E(Y)=\int_0^1 nx^n \text dx=\frac{n}{n+1},\quad E(Z)=\int_0^1 nx(1-x)^{n-1}\text dx=\frac{1}{n+1} \]

\[E(Y-Z)=E(Y)-E(Z)=\frac{n-1}{n+1} \]

\(\text{Qn6}\quad\)\((X,Y)\sim N(1,1,2^2,3^2,0.5)\),求 \(E(\text{max}(X,Y))\)

\(\text{Sol}\quad\) 小技巧 \(\text{max}(X,Y)=\dfrac{1}{2}(X+Y+|X-Y|)\)

其中

\[\begin{aligned} E(X+Y)=&E(X)+E(Y)=2\\ E(X-Y)=&E(X)-E(Y)=0,\quad D(X-Y)=D(X)+D(Y)-2\text{Cov}(X,Y)=7\\ E|X-Y|=&\int_{-\infty}^{+\infty} |t|\frac{1}{\sqrt{14\pi}}\text e^{-\frac{t^2}{14}}\text dt\\ =&\frac{2}{\sqrt{14\pi}}\int_0^{+\infty}t\text e^{-\frac{t^2}{14}}\text dt\\ =&\sqrt{\frac{14}{\pi}} \end{aligned} \]

因此

\[E(\text{max}(X,Y))=1+\sqrt{\frac{7}{2\pi}} \]

\(\text{Qn7}\quad\)\(n\) 个编号为 \(1,2,\cdots,n\) 的球随机放入编号为 \(1,2,\cdots,n\)\(n\) 个盒子中,一个盒子只能装一个球,如果第 \(i\) 号球正好放入了第 \(i\) 号盒子,称为一个配对。求配对数的期望与方差。

\(\text{Sol}\quad\)

\[X_i=\begin{cases} 1,\quad 第 i 个盒子配对\\ 0,\quad 第 i 个盒子没配对\\ \end{cases}\quad,\quad i=1,2,\cdots,n \]

\(X=\displaystyle\sum_{i=1}^n X_i\) 表示配对数,且 \(E(X_i)=\dfrac{1}{n},D(X_i)=\dfrac{n-1}{n^2}\)

因此

\[\begin{aligned} E(X)=&\sum_{i=1}^n E(X_i)=n\frac{1}{n}=1\\ D(X)=&\sum_{i=1}^n D(X_i)+\sum_{i\neq j}\text{Cov}(X_i,X_j)\\ =&n\frac{n-1}{n^2}+\sum_{i\neq j}E(X_iX_j)-E(X_i)E(X_j)\\ =&\frac{n-1}{n}+2\text C^2_n\left(\frac{1}{n(n-1)}-\frac{1}{n^2}\right)\\ =&1 \end{aligned} \]

\(\text{Qn8}\quad\)\(X_1,X_2,\cdots,X_n,X_{n+1}\) 是正态总体 \(X\sim N(\mu,\sigma^2)\) 的样本,记

\[\bar{X}_n=\frac{1}{n}\sum_{i=1}^n X_i,\quad S_n^2=\frac{1}{n}\sum_{i=1}^n (X_i-\bar{X}_n)^2 \]

试证明统计量 \(U=\sqrt{\dfrac{n-1}{n+1}}\dfrac{X_{n+1}-\bar{X}_n}{S_n}\) 服从 \(t(n-1)\) 分布.

\(\text{Sol}\quad\) 考虑 \(\displaystyle{\frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1)}\),原式转化为

\[\frac{\sqrt{\frac{n}{n+1}}\frac{X_{n+1}-\bar{X}_n}{\sigma}}{\sqrt{\frac{\chi^2(n-1)}{n-1}}} \]

\[\begin{aligned} \sqrt{\frac{n}{n+1}}\frac{X_{n+1}-\bar{X}_n}{\sigma}=&\sqrt{\frac{n}{n+1}}\frac{N(\mu,\sigma^2)-N(\mu,\frac{\sigma^2}{n})}{\sigma}\\ =&\sqrt{\frac{n}{n+1}}\frac{N(0,\frac{n+1}{n}\sigma^2)}{\sigma}\\ =&\frac{N(0,\frac{n+1}{n}\sigma^2)}{\frac{\sigma}{\sqrt{\frac{n+1}{n}}}} \end{aligned} \]

因此原式服从 \(t(n-1)\) 分布.

\(\text{Qn9}\quad\) 设总体 \(X\sim N(\mu_1,\sigma^2)\) 与总体 \(Y\sim N(\mu_2,\sigma^2)\) 相互独立, \(X_1,X_2,\cdots,X_n\)\(Y_1,Y_2,\cdots,Y_m\) 分别为 \(X\)\(Y\) 的样本,\(\alpha,\beta\) 为常数,证明

\[T=\frac{\alpha(\bar{X}-\mu_1)+\beta(\bar{Y}-\mu_2)}{\sqrt{\frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\sqrt{\frac{\alpha^2}{n}+\frac{\beta^2}{m}}} \]

服从 \(t(n+m-2)\) 分布.

\(\text{Sol}\quad\) 先考虑

\[\begin{aligned} S_\omega=&\sqrt{\frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}\\ =&\sigma\sqrt{\frac{\frac{(n-1)S_1^2}{\sigma^2}+\frac{(m-1)S_2^2}{\sigma^2}}{n+m-2}}\\ =&\sigma\sqrt{\frac{\chi^2(n+m-2)}{n+m-2}} \end{aligned} \]

接下来

\[\alpha(\bar{X}-\mu_1)+\beta(\bar{Y}-\mu_2)=N(\alpha\mu_1+\beta\mu_2,\alpha^2\frac{\sigma^2}{n}+\beta^2\frac{\sigma^2}{m})-(\alpha\mu_1+\beta\mu_2) \]

标准化得证。

\(\text{Qn10}\quad\) 设总体为 \(X\), 总体均值 \(E(X)=\mu\) 和总体方差 \(D(X)=\sigma^2\) 存在. \(X_1,X_2,\cdots,X_n\) 为来自总体 \(X\) 的一个样本,求 \(\mu\)\(\sigma^2\) 的矩估计量。

\(\text{Sol}\quad\) 矩估计:

\[\begin{cases} E(X)=\bar{X}\\ E(X^2)=D(X)+(E(X))^2=A_2 \end{cases} \]

\[\begin{cases} \mu=\bar{X}\\ \sigma^2+\mu^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n X_i^2 \end{cases} \]

解得

\[\begin{cases} \hat{\mu}=\bar{X}\\ \hat{\sigma}^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (X_i-\bar{X})^2 \end{cases} \]

\(\text{Qn11}\quad\) 设总体 \(X\sim N(\mu,\sigma^2)\), \(X_1,X_2,\cdots,X_n\) 为来自总体的一个样本,求未知参数 \(\mu\)\(\sigma^2\) 的最大似然估计量.

\(\text{Sol}\quad\) 概率密度函数为

\[f(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]

似然函数为

\[L(\mu,\sigma^2)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}=(2\pi\sigma^2)^{-\frac{n}{2}}\text e^{-\frac{1}{2\sigma^2}\sum_{i=1}^n (x_i-\mu)^2} \]

取对数后关于 \(\mu\), \(\sigma^2\) 求偏导

\[\begin{cases} \dfrac{\partial \ln L(\mu,\sigma^2)}{\partial \mu}=\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n (x_i-\mu)=0\\ \dfrac{\partial \ln L(\mu,\sigma^2)}{\partial \sigma^2}=-\dfrac{n}{2\sigma^2}+\dfrac{1}{2\sigma^4}\displaystyle\sum_{i=1}^n (x_i-\mu)^2=0 \end{cases} \]

解得

\[\begin{cases} \hat{\mu}=\bar{X}\\ \hat{\sigma}^2=\dfrac{1}{n}\displaystyle\sum_{i=1}^n (X_i-\bar{X})^2 \end{cases} \]

最大似然法解得的结果和矩估计法不总是相同.

\(\text{Qn12}\quad\) 设某车间生产的滚珠的直径 \(X\sim N(\mu,\sigma^2)\), 现从某日生产的滚珠中抽取 \(9\) 个,测得样本方差为 \(s^2=0.25^2\), 在 \(0.95\) 置信度下求总体方差的 \(\sigma^2\) 的置信区间.

\(\text{Sol}\quad\) 先判定为单总体, 使用

\[\frac{n-1}{\sigma^2}s^2\sim \chi^2(n-1) \]

根据分位点的恒等式

\[\begin{aligned} P\left(\chi^2_{1-\frac{\alpha}{2}}(n-1)\leq \frac{n-1}{\sigma^2}s^2\leq \chi^2_{\frac{\alpha}{2}}(n-1) \right)=1-\alpha \end{aligned} \]

解得

\[\frac{(n-1)s^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}\leq \sigma^2 \leq \frac{(n-1)s^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)} \]

代入数据得置信区间 \([0.03,0.23]\).

\(\text{Qn13}\quad\) 设某车间生产的滚珠的直径 \(X\sim N(\mu,\sigma^2)\), 现从某日生产的滚珠中抽取 \(9\) 个, 测得样本方差为 \(s^2=0.25^2\), 在显著性水平 \(0.05\) 下是否可以认为总体方差的 \(\sigma^2=0.36^2\)?

\(\text{Sol}\quad\) 先判定为双侧检验, 原假设 \(H_0:\sigma^2=0.36^2\), 备择假设 \(H_1:\sigma^2\neq 0.36^2\)

使用统计量

\[\chi^2=\frac{n-1}{\sigma^2}S^2\sim \chi^2(n-1) \]

\[P\left(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1) \vee \chi^2> \chi^2_{\frac{\alpha}{2}}(n-1) \right)=\alpha \]

拒绝域为 \(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\)\(\chi^2> \chi^2_{\frac{\alpha}{2}}(n-1)\)
代入数据得 \(\chi^2\) 没有落在拒绝域中, 应接受原假设.

\(\text{Qn14}\quad\) 推导

\[F_{\alpha}(m,n)=\frac{1}{F_{1-\alpha}(n,m)} \]

\(\text{Sol}\quad\) 根据定义

\[\begin{aligned} &X\sim F(m,n)\quad\quad Y\sim F(n,m)\\ &x=F_{\alpha}(m,n)\quad\quad y=F_{1-\alpha}(n,m)\\ &P(X>x)=\alpha\quad\quad P(Y\leq y)=\alpha \end{aligned} \]

考虑

\[\begin{aligned} &X=\frac{1}{Y}\\ &P(X>x)=P(Y\leq y) \end{aligned} \]

因此

\[F_{\alpha}(m,n)=\frac{1}{F_{1-\alpha}(n,m)} \]

\(\text{Qn15}\quad\) 推导泊松分布的分布列是二项分布的极限.

\(\text{Sol}\quad\) 目标是证明

\[\begin{aligned} \lim_{n\rightarrow\infty}np=\lambda\quad\Rightarrow\quad\lim_{n\rightarrow\infty}C^k_n p^k(1-p)^{n-k}=\frac{\lambda^k}{k!}\text e^{-\lambda} \end{aligned} \]

考虑展开

\[\begin{aligned} C^k_n p^k(1-p)^{n-k}\rightarrow& \frac{n!}{k!(n-k)!}\cdot\frac{\lambda^k}{n^k}\cdot\left(1-\frac{\lambda}{n}\right)^{n-k}\\ \rightarrow& \frac{n!}{(n-k)!(n-\lambda)^k}\cdot\frac{\lambda^k}{k!}\text e^{-\lambda}\\ \rightarrow& \frac{\lambda^k}{k!}\text e^{-\lambda} \end{aligned} \]

\(\text{Qn16}\quad\) 推导正态分布标准化方法.

\(\text{Sol}\quad\) 目标是证明

\[\begin{cases} \varphi(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\\ t=\dfrac{x-\mu}{\sigma} \end{cases}\quad\Rightarrow\quad{f(t)=\dfrac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}}} \]

考虑分布函数

\[\begin{aligned} F(t)=&P(T\leq t)\\ =&P(X\leq \sigma t+\mu)\\ =&\int_{-\infty}^{\sigma t+\mu}\varphi(x)\text dx\\ =&\int_{-\infty}^{\sigma t+\mu}\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(x-\mu)^2}{2\sigma^2}}\text dx\\ =&\int_{-\infty}^t \frac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}}\text dt\\ \end{aligned} \]

因此

\[f(t)=\frac{1}{\sqrt{2\pi}}\text e^{-\frac{t^2}{2}} \]

\(\text{Qn17}\quad\) 推导方差的计算公式.

\(\text{Sol}\quad\)

\[\begin{aligned} D(X)=&E((X-E(X))^2)\\ =&E((X-\sum_i x_ip_i)^2)\\ =&\sum_j(x_j-\sum_i x_ip_i)^2p_j\\ =&\sum_j x_j^2p_j-2\sum_jx_jp_j\sum_ix_ip_i+\sum_jp_j(\sum_i x_ip_i)^2\\ =&E(X^2)-2E^2(X)+E(E^2(X))\\ =&E(X^2)-E^2(X) \end{aligned} \]

特殊地, 若 \(p_i=\dfrac{1}{n}\), 则 \(\displaystyle{D(X)=\frac{1}{n}\sum_{i=1}^n x_i^2-\bar{X}^2}\).

\(\text{Qn18}\quad\) 计算各种分布的期望和方差.

\(\text{Sol}\quad\) 0-1 分布:

\[E(X)=p,\quad D(X)=E(X^2)-E^2(X)=p-p^2 \]

二项分布:

\[\begin{aligned} E(X)=&\sum_{k=1}^n kC_n^k p^k(1-p)^{n-k}\\ =&n\sum_{k=1}^n C^{k-1}_{n-1} p^k (1-p)^{n-k}\\ =&np\sum_{k=1}^n C^{k-1}_{n-1} p^{k-1}(1-p)^{n-k}\\ =&np(p+1-p)^{n-1}\\ =&np\\ D(X)=&E(X^2)-E^2(X)\\ =&\sum_{i=1}^n k^2C^k_n p^k (1-p)^{n-k}-n^2p^2\\ =&np\sum_{k=1}^n C^{k-1}_{n-1} p^{k-1}(1-p)^{n-k}+n(n-1)p^2\sum_{k=2}^n C^{k-2}_{n-2}p^{k-2}(1-p)^{n-k}-n^2p^2\\ =&np+n(n-1)p^2-n^2p^2\\ =&np(1-p) \end{aligned} \]

泊松分布:

\[\begin{aligned} E(X)=&\sum_{i=1}^{\infty} i\frac{\lambda^{i}}{i!}\text e^{-\lambda}\\ =&\lambda \text e^{-\lambda}\sum_{i=0}^{\infty} \frac{\lambda^{i}}{i!}\\ =&\lambda\\ D(X)=&E(X^2)-E^2(X)\\ =&\lambda\text e^{-\lambda} \sum_{i=1}^\infty i\frac{\lambda^{i-1}}{(i-1)!}-\lambda^2\\ =&\lambda(\lambda+1)\text e^{-\lambda}\sum_{i=0}^\infty \frac{\lambda^i}{i!}-\lambda^2\\ =&\lambda^2+\lambda-\lambda^2\\ =&\lambda \end{aligned} \]

几何分布:

\[\begin{aligned} E(X)=&\sum_{k=1}^\infty kp(1-p)^{k-1}\\ =&-p\frac{\text d}{\text dp}\sum_{k=0}^\infty (1-p)^k\\ =&-p\frac{\text d}{\text dp}\frac{1}{p}\\ =&\frac{1}{p}\\ D(X)=&E(X^2)-E^2(X)\\ =&\sum_{k=1}^\infty k^2 p(1-p)^{k-1}-\frac{1}{p^2}\\ =&p\frac{\text d}{\text dp}\left((1-p)\frac{\text d}{\text dp}\sum_{k=1}^\infty (1-p)^k\right)-\frac{1}{p^2}\\ =&-\frac{1}{p}+\frac{2}{p^2}-\frac{1}{p^2}\\ =&\frac{1-p}{p^2} \end{aligned} \]

均匀分布:

\[\begin{aligned} E(X)=&\int_a^b \frac{1}{b-a}x\text dx\\ =&\frac{1}{b-a}\left(\frac{b^2}{2}-\frac{a^2}{2}\right)\\ =&\frac{a+b}{2}\\ D(X)=&E(X^2)-E^2(X)\\ =&\int_a^b \frac{1}{b-a} x^2\text dx-\frac{(a+b)^2}{4}\\ =&\frac{1}{3}(a^2+b^2+ab)-\frac{1}{4}(a+b)^2\\ =&\frac{(b-a)^2}{12} \end{aligned} \]

指数分布:

\[\begin{aligned} E(X)=&\lambda \int_0^{+\infty} x \text e^{-\lambda x}\text dx\\ =&\left(-x\text e^{-\lambda x}-\frac{\text e^{-\lambda x}}{\lambda}\right)\bigg|_0^{+\infty}\\ =&\frac{1}{\lambda}\\ D(X)=&E(X^2)-E^2(X)\\ =&\lambda\int_0^{+\infty}x^2\text e^{-\lambda x}\text dx-\frac{1}{\lambda^2}\\ =&\frac{2}{\lambda^2}-\frac{1}{\lambda^2}\\ =&\frac{1}{\lambda^2} \end{aligned} \]

\(\text{Qn19}\quad\) 证明独立的正态分布的和仍然服从正态分布.

\(\text{Sol}\quad\) 先说明一个引理:

\[P(X+Y=z)=\sum P(X=x,Y=z-x)=\int_{-\infty}^{+\infty} f(x,z-x)\text dx \]

这告诉我们变量的和分布等同于变量的卷积.

下面开始证明:
\(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2), Z=aX+bY, \sigma=\sqrt{\sigma_1^2+\sigma_2^2}\)

\[\begin{aligned} f(z)=&\int_{-\infty}^{+\infty} f(x,z-x)\text dx\\ =&\int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)\text dx\\ =&\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma_1}\text e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\cdot \frac{1}{\sqrt{2\pi}\sigma_2}\text e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}\text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{\sigma_2^2(x-\mu_1)^2+\sigma_1^2(z-x-\mu_2)^2}{2\sigma_1^2\sigma_2^2}} \text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{(\sigma_1^2+\sigma_2^2)x^2+2((\mu_2-z)\sigma_1^2-\mu_1\sigma_2^2)x+(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{2\sigma_1^2\sigma_2^2}}\text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{x^2+\frac{2((\mu_2-z)\sigma_1^2-\mu_1\sigma_2^2)x}{\sigma^2}+\frac{(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{\sigma^2}}{\frac{2\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\ =&\frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty} \text e^{-\frac{\left(x-\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2+\frac{(z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2}{\sigma^2}-\left(\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2}{\frac{2\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{\sigma^2((z^2+\mu_2^2-2z\mu_2)\sigma_1^2+\mu_1^2\sigma_2^2)-((z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2)^2}{2\sigma^2\sigma_1^2\sigma_2^2}} \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\frac{\sigma_1\sigma_2}{\sigma}} \text e^{-\frac{\left(x-\frac{(z-\mu_2)\sigma_1^2+\mu_1\sigma_2^2}{\sigma^2}\right)^2}{2\frac{\sigma_1^2\sigma_2^2}{\sigma^2}}}\text dx\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{\sigma_1^2\sigma_2^2z^2-2\sigma_1^2\sigma_2^2(\mu_1+\mu_2)z+\sigma_1^2\sigma_2^2(\mu_1^2+\mu_2^2)+2\mu_1\mu_2\sigma_1^2\sigma_2^2}{2\sigma^2\sigma_1^2\sigma_2^2}}\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{z^2-2(\mu_1+\mu_2)z+(\mu_1+\mu_2)^2}{2\sigma^2}}\\ =&\frac{1}{\sqrt{2\pi}\sigma}\text e^{-\frac{(z-(\mu_1+\mu_2))^2}{2\sigma^2}} \end{aligned} \]

证毕.

\(\text{Qn20}\quad\) 证明样本均值 \(\bar{X}\) 和样本方差 \(S^2\) 分别是 \(\mu\)\(\sigma^2\) 的无偏估计量.

\(\text{Sol}\quad\)

\[\begin{aligned} E(\bar{X})=&E\left(\frac{1}{n}\sum_{i=1}^n X_i\right)\\ =&\frac{1}{n}\sum_{i=1}^n E(X_i)\\ =&\frac{1}{n}\cdot n\mu\\ =&\mu\\ E(S^2)=&E\left(\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2\right)\\ =&\frac{1}{n-1}E\left(\sum_{i=1}^n X_i^2-n\bar{X}^2\right)\\ =&\frac{1}{n-1}\left(\sum_{i=1}^n E(X_i^2)-nE(\bar{X}^2)\right)\\ =&\frac{1}{n-1}\left(\sum_{i=1}^n\left(E^2(X_i)+D(X_i)\right)- n\left(E^2(\bar{X})+D(\bar{X})\right) \right)\\ =&\frac{1}{n-1}\left(n(\mu^2+\sigma^2)-n\left(\mu^2+\frac{\sigma^2}{n}\right)\right)\\ =&\sigma^2 \end{aligned} \]

3 理解

  • 大写字母代表随机变量, 小写字母代表随机变量的值.

  • 全概率公式基于样本空间的划分计算总概率, 由原因推结果; 贝叶斯公式基于总概率反推原先划分的概率, 由结果推原因.

  • 独立事件的条件概率只需要将条件代入即可, 不用将积事件除以条件事件.

  • 分布函数 (CDF, Cumulative Distribution Function) 是不超过某个值的概率总和, 离散的分布列 (PMF, Probability Mass Function) 或连续的密度函数 (PDF, Probability Density Function) 是某个值的概率. 分布函数一定单调不减趋于 1.

  • 相关性指的是两个变量具有线性关系的程度, 独立性指的是一个变量的取值对另一个变量没有影响. 如果两变量独立, 那么相关系数一定为 0. 只有任意阶原点矩的相关性均为 0, 两变量才独立.

  • 期望等同于均值, 一个随机变量取到期望的概率最大. 方差用来描述随机变量的离散程度, 方差越小数据越集中.

  • 协方差是描述两个随机变量的线性相关方向的指标, 它的值与变量取值有关, 因此其大小无意义; 相关系数是描述两个随机变量的线性相关方向和程度的指标, 它的值是标准化后的协方差, 因此其大小可以衡量程度.

  • 在能够计算理论值的前提下, 期望和方差就像高中学过的那样计算; 在不能够得知样本全貌的情况下, 我们只能计算样本均值和样本方差, 然后通过它们预计理论上期望和方差的值.

  • 点估计用于从样本数据计算出总体参数的单一值; 区间估计用于从样本数据计算出总体参数范围; 假设检验用于从样本数据对总体参数进行推断,它可以用来检验总体参数的假设值是否成立; 它们思想的本质都是用测量的数据趋近理论的数据.

4 真题

\(\text{Qn1}\quad\) 判断对错:
(1) 三个事件 \(A,B,C\) 两两独立, 那么 \(A,B,C\) 相互独立.
(2) 随机变量分为离散型随机变量和连续型随机变量.
(3) 伯努利大数定律表明只要重复试验的次数充分大, 那么事件发生的频率就是概率.
(4) 若事件 \(A\) 与事件 \(B\) 相互独立, \(C\)\(B\) 的子集, 则 \(A\)\(C\) 也相互独立.

\(\text{Sol}\quad\) 全错.
(1) 对于 \(n\) 个事件, 如果对于任意 \(2\) 个, 任意 \(3\) 个, \(\cdots\), 任意 \(n\) 个事件的积事件的概率, 都等于各事件概率的积, 那么称这些事件相互独立.
(2) 随机变量可以又不离散又不连续, 比如分段的.
(3) 体会一下 "收敛于" 概率和 "就是" 概率的区别.
(4) \(A\)\(C\) 可以没有任何交集, 因此不一定独立.

\(\text{Qn2}\quad\) 已知 \(P(A)=0.1, P(B)=0.5, A\subset B\), 求 \(P(A\cup \bar{B}|\bar{A})\).

\(\text{Sol}\quad\)

\[\begin{aligned} P(A\cup \bar{B}|\bar{A})=&\frac{P(\bar{A}\cap\bar{B})}{P(\bar{A})}\\ =&\frac{P(\overline{A\cup B})}{P(\bar{A})}\\ =&\frac{1-P(B)}{1-P(A)}\\ =&\frac{5}{9} \end{aligned} \]

\(\text{Qn3}\quad\)\(X_1,X_2,\cdots,X_10\) 是来自总体 \(X\) 的一组样本, 样本一阶矩和二阶矩分别是 \(2.6\)\(12.9\), 计算样本方差.

\(\text{Sol}\quad\) 考虑

\[\begin{cases} E(X)=A_1\\ D(X)+E^2(X)=A_2\\ S^2=\dfrac{n}{n-1}D(X) \end{cases} \]

联立解得 \(S^2=6.82\).

\(\text{Qn4}\quad\) 将一个骰子连续重复掷 \(4\) 次, 以 \(X\) 表示 \(4\) 次掷出的点数之和, 则 \(P(10<X<18)\geq?\)

\(\text{Sol}\quad\)\(X_k\) 表示第 \(k\) 次的点数, 则它们独立同分布.

\[E(X_k)=\frac{7}{2}\quad D(X_k)=E(X_k^2)-E^2(X_k)=\frac{1}{6}(1^2+2^2+\cdots+6^2)-\left(\frac{7}{2}\right)^2=\frac{35}{12} \]

\(X=\displaystyle\sum_{k=1}^4 X_k\)

\[E(X)=4E(X_k)=14\quad D(X)=D(\sum_{k=1}^4 X_k)=4D(X_k)=\frac{35}{3} \]

由契比雪夫不等式

\[P(10<X<18)=P(|X-14|<4)\geq1-\frac{\frac{35}{3}}{4^2}=\frac{13}{48} \]

\(\text{Qn5}\quad\) 已知联合密度函数 \(f(x,y)=\text e^{-x}\), \(0<y<x\), 计算条件概率 \(P(Y>2|X=3)\).

\(\text{Sol}\quad\) 根据定义, 首先计算 \(f_{Y|X}(y|x)\)

\[\begin{aligned} f_{Y|X}(y|x)=&\frac{f(x,y)}{f_X(x)}\\ =&\frac{f(x,y)}{\int_{-\infty}^{+\infty} f(x,y)\text dy}\\ =&\frac{\text e^{-x}}{x\text e^{-x}}\\ =&\frac{1}{x} \end{aligned} \]

后代入 \(X=3\)

\[\begin{aligned} P(Y>2|X=3)=&1-P(Y\leq 2|X=3)\\ =&1-\int_{-\infty}^2 f_{Y|X}(y|x) \text dy\\ =&1-\int_{-\infty}^2 \frac{1}{x} \text dy\\ =&\frac{1}{3} \end{aligned} \]

\(\text{Qn6}\quad\)\((X,Y)\) 的联合密度函数为 \(\displaystyle{f(x,y)=\frac{1}{2\pi}\text e^{-\frac{x^2+y^2}{2}}(1+\sin x\sin y)}\), 计算: (1) \(f_X(x),f_Y(y)\), 并判断 \(X,Y\) 独立性; (2) \(f_{Y|X}(y|x)\), \(P(Y<0|X=0)\).

\(\text{Sol}\quad\) (1) \(X\)\(Y\) 是对称的

\[\begin{aligned} f_X(x)=&\int_{-\infty}^{+\infty} f(x,y)\text dy\\ =&\frac{1}{2\pi}\int_{-\infty}^{+\infty} \text e^{-\frac{x^2+y^2}{2}}(1+\sin x\sin y) \text dy\\ =&\frac{1}{2\pi}\text e^{-\frac{x^2}{2}}\left(\int_{-\infty}^{+\infty}\text e^{-\frac{y^2}{2}}+\sin x\int_{-\infty}^{+\infty}\text e^{-\frac{y^2}{2}}\sin y\text dy\right)\\ =&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{x^2}{2}}\\ f_Y(y)=&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}} \end{aligned} \]

\(f_X(x)f_Y(y)\neq f(x,y)\)\(X\)\(Y\) 不独立.

(2)

\[\begin{aligned} f_{Y|X}(y|x)=&\frac{f(x,y)}{f_X(x)}\\ =&\frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}}(1+\sin x\sin y) \end{aligned} \]

代入 \(X=0\), 考虑正态分布的性质

\[P(Y<0|X=0)=\int_{-\infty}^0 \frac{1}{\sqrt{2\pi}}\text e^{-\frac{y^2}{2}}\text dy=\frac{1}{2} \]

\(\text{Qn7}\quad\) 已知二维随机变量 \((X,Y)\) 的联合分布函数为 \(F(x,y)=A(B+\arctan x)(C+\arctan y)\)
(1) 求常数 \(A,B,C\)
(2) 判断 \(X\)\(Y\) 是否独立
(3) 求 \(f_{X|Y}(x|y)\)

\(\text{Sol}\quad\) (1) 考虑 \(F(+\infty,+\infty)=1,F(-\infty,y)=F(x,-\infty)=0\)
解得 \(A=\dfrac{1}{\pi^2},B=\dfrac{\pi}{2},C=\dfrac{\pi}{2}\)

(2)

\[\begin{aligned} F_X(x)=&F(x,+\infty)=\frac{1}{\pi}(\frac{\pi}{2}+\arctan x)\\ F_Y(y)=&F(+\infty,y)=\frac{1}{\pi}(\frac{\pi}{2}+\arctan y)\\ F(x,y)=&F_X(x)F_Y(y) \end{aligned} \]

因此相互独立.

(3)

\[\begin{aligned} f_{X|Y}(x|y)=&\frac{f(x,y)}{f_Y(y)}\\ =&f_X(x)\\ =&\frac{1}{\pi}\frac{1}{1+x^2} \end{aligned} \]

\(\text{Qn8}\quad\) 随机变量 \(X\) 的概率密度 \(f(x)=\begin{cases}2x,\quad 0<x<1\\0,\quad \text{其他}\end{cases}\), 对 \(X\) 独立重复试验 \(162\) 次, 设观察到的值小于 \(\dfrac{1}{3}\) 的次数为 \(Y\), 求 \(P(Y>22)\) 的近似值.

\(\text{Sol}\quad\) 先计算二项分布的 \(p\)

\[\begin{aligned} p=&P(X<\frac{1}{3})\\ =&F(\frac{1}{3})\\ =&\int_0^{\frac{1}{3}} 2x\text dx\\ =&\frac{1}{9} \end{aligned} \]

接下来计算二项分布的期望和方差

\[\begin{aligned} E(X)=&np=18\\ D(X)=&np(1-p)=16 \end{aligned} \]

由中心极限定理, 二项分布趋近于正态分布 \(N(18,16)\)

\[\begin{aligned} P(Y>22)=&P\left(\frac{Y-18}{4}>1\right)\\ =&1-\Phi(1)\\ =&0.1587 \end{aligned} \]

\(\text{Qn9}\quad\) 设总体 \(X\) 的概率密度为 \(f(x)=\begin{cases}\theta c^{\theta} x^{-(\theta+1)},\quad x>c\\0,\quad x\leq c\end{cases}\), 其中 \(c>0\) 为已知参数, \(\theta>1\) 为未知参数, \(X_1,X_2,\cdots,X_n\) 为来自 \(X\) 的一个样本, \(x_1,x_2,\cdots,x_n\) 为相应的样本值, 求 \(\theta\) 的矩估计量与最大似然估计量.

\(\text{Sol}\quad\) 矩估计:

\[\begin{aligned} E(X)=\frac{1}{n}\sum_{i=1}^n x_i=\int_c^{+\infty} \theta c^{\theta}x^{-\theta}\text dx=\frac{c\theta}{\theta-1} \end{aligned} \]

解得

\[\hat{\theta}=\frac{\sum_{i=1}^n x_i}{\sum_{i=1}^n x_i-cn} \]

最大似然法:

\[\begin{aligned} L(\theta)=&\prod_{i=1}^n \theta c^{\theta} x_i^{-(\theta+1)}\\ =&(\theta c^\theta)^n \left(\prod_{i=1}^n x_i\right)^{-(\theta+1)}\\ \ln L(\theta)=&n\ln\theta+\left(n\ln c-\sum_{i=1}^n \ln(x_i)\right)\theta-\sum_{i=1}^n \ln(x_i)\\ \frac{\text d}{\text d\theta}\ln L(\theta)=&\frac{n}{\theta}+n\ln c-\sum_{i=1}^n \ln(x_i)=0 \end{aligned} \]

解得

\[\hat{\theta}=\frac{n}{\sum_{i=1}^n\ln(x_i)-n\ln c} \]

\(\text{Qn10}\quad\) 一位中学校长在报纸上看到这样一则报道: 中学生每周至少看 \(8\) 小时电视. 他认为他所在学校学生看电视时间明显小于 \(8\) 小时. 为此在该校随机调查了 \(100\) 名学生, 计算平均每周看电视的时间为 \(6.5\) 小时. 假设学生每周看电视的时间服从正态分布, 总体方差为 \(4\), 在显著性水平 \(0.05\) 的条件下, 是否可以认为这个校长的看法正确?

\(\text{Sol}\quad\) 原假设 \(H_0: \mu\geq 8\), 备择假设 \(H_1: \mu<8\)
考虑

\[z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1) \]

拒绝域

\[P(z<z_{1-\alpha})=\alpha \]

计算得

\[z=-7.5<-1.64=z_{0.95} \]

因此落在拒绝域中, 选择备择假设 \(H_1\)

关于怎样判定拒绝域的方向: 通常情况下和 \(H_1\) 的方向相同. 本题中, 由于 \(\mu\) 越大也就是 \(z\) 越小, 越容易落在拒绝域中, 因此判定为左侧检验, 拒绝域在左侧.

posted @ 2023-03-19 10:12  rainrzk  阅读(305)  评论(0)    收藏  举报