G
N
I
D
A
O
L

随机游走003 | 2022复旦大学432统计学真题训练

前言

复旦432今年的考研题着实有一定难度,除了涉及的内容丰富全面,统计部分的计算量也很大,因此熟记结论成为了是很重要的一环。题目是从网上找来的,用于练手。

真题

Question 1 古典概型(有放回抽样)

问:(20分)袋子里有红球 \(a\) 个,黄球 \(a\) 个,篮球 \(b\) 个。有放回抽取 \(3\) 个,\(A\) 事件:抽出球既有黄球又有红球,且红球比黄球先取出。

(1)事件 \(A\) 的概率;

(2)若没有取到篮球的概率和事件 \(A\) 概率相等,求 \(a/b\)

解:

(1)记抽出红球为事件 \(R\),抽出黄球为事件 \(Y\),抽出篮球为事件 \(B\),如事件 \(\{RYR\}\) 表示三次抽取分别依次抽到红球、黄球、红球。

① 若 \(a=0\),则 \(P(A)=0\)

② 若 \(a>0,b=0\),则\(P(A)=P(\{RYR\})+P(\{RYY\})+P(\{RRY\})=3\times(\frac{a}{2a})^3=\frac{3}{8}\)

③ 若 \(a>0,b>0\),则

\[\begin{align*} P(A)&=P(\{RYR\})+P(\{RYY\})+P(\{RRY\})+P(\{RYB\})+P(\{RBY\})+P(\{BRY\})\\&=3\times\frac{a^3}{(2a+b)^3}+3\times\frac{a^2b}{(2a+b)^3}\\ &=\frac{3a^2(a+b)}{(2a+b)^3} \end{align*} \]

(2) 记事件 \(B\) 为没有取到篮球(默认 \(b>0\)),则 \(P(B)=(\frac{2a}{2a+b})^3\),由\(P(A)=P(B)\)\(\frac{a}{b}=\frac{3}{5}\)

Question 2 离散随机变量方差含参问题

问:(10分)设随机变量 \(X\) 的分布列为:\(P(X=a)=P(X=b)=P(X=a+1)=\frac{1}{3}\), 其中 \(a<b<a+1\),求方差取值范围。

解:

\[\begin{align*} E[X]&=\frac{1}{3}(a+b+a+1)=\frac{1}{3}(2a+b+1)\\ Var(X)&=E[X^2]-E^2[X]\\&=\frac{1}{3}\left[a^2+b^2+(a+1)^2\right]-\left[\frac{1}{3}(2a+b+1)\right]^2\\ &=\frac{2}{9}\left[(a-b)+\frac{1}{2}\right]^2+\frac{1}{6} \end{align*} \]

由于 \(-1<a-b<0\),故当 \(a-b=-1/2\) 时,有 \(\min(Var(X))=1/6\),且

\[Var(X)<\frac{2}{9}\left[0+\frac{1}{2}\right]^2+\frac{1}{6}=\frac{2}{9}, \]

故方差取值范围为 \(Var(X)\in[1/6,2/9)\)

Question 3 离散随机变量方差含参问题

问:(20分)设随机变量 \(X\) 只取 \(x\)\(x+a\) 两个值,且 \(a>0\),已知 \(Var(X)=1\),求 \(a\) 范围及 \(X\) 分布列。

解:

假设 \(P(X=x)=1-p,P(X=x+a)=p\),则

\[\begin{align*} E[X]&=(1-p)x+p(x+a)=x+ap,\\ Var(X)&=(1-p)(ap)^2+p(a(1-p))^2=a^2p(1-p)。 \end{align*} \]

由于 \(Var(X)=1\),得到

\[a=\sqrt{\frac{1}{p(1-p)}}。 \]

根据基本不等式,\(p(1-p)\leq\frac{1}{4}\),仅当 \(p=\frac{1}{2}\) 时取等号成立,故\(a\)的取值范围为

\[a\geq2。 \]

\(p\)\(a\) 表示为 \(p=\frac{1}{2}\pm\sqrt{\frac{1}{4}-\frac{1}{a^2}}\), 则 \(X\) 的分布列为

\[P(X=x)=\frac{1}{2}-\sqrt{\frac{1}{4}-\frac{1}{a^2}},P(X=x+a)=\frac{1}{2}+\sqrt{\frac{1}{4}-\frac{1}{a^2}}, \]

\[P(X=x)=\frac{1}{2}+\sqrt{\frac{1}{4}-\frac{1}{a^2}},P(X=x+a)=\frac{1}{2}-\sqrt{\frac{1}{4}-\frac{1}{a^2}}。 \]

Question 4 旋转变换

问:(20分)设二维随机变量 \((X,Y)\) 经过旋转变换后分布不变,即\((X,Y)\begin{pmatrix}\cos\alpha&\sin\alpha\\-\sin\alpha&\cos\alpha\end{pmatrix}\)\((X,Y)\) 同分布,对 \(\forall\alpha\) 成立,且 \(P(X=0,Y=0)=0\)

(1)求 \(P(0<Y<X)\)

(2)求 \(\frac{Y}{X}\) 的分布。

解:

(填空题做法)若 \((X,Y)\) 服从二元标准正态分布,即 \((X,Y)\sim N\left(\begin{bmatrix}0\\0\end{bmatrix} ,\begin{bmatrix}1&0\\0&1\end{bmatrix} \right)\),记 \(A=\begin{pmatrix}\cos\alpha&\sin\alpha\\-\sin\alpha&\cos\alpha\end{pmatrix}\)\(A\) 是正交矩阵,则容易验证\((X,Y)A\sim N\left(\begin{bmatrix}0\\0\end{bmatrix} ,\begin{bmatrix}1&0\\0&1\end{bmatrix} \right)\),对任意 \(\alpha\) 成立。

由独立性可知,\(P(XY>0)=P(XY<0)=\frac{1}{2}\),由对称性可知,

\[P(0<Y<X)=P(0<X<Y)=P(Y<X<0)=P(X<Y<0), \]

因此

\[P(0<Y<X)=\frac{1}{8}。 \]

而根据 \(t\) 分布的定义,由于 \(X,Y\) 相互独立且来自标准正态分布,因此 \(\frac{Y}{X}\) 服从标准柯西分布,即自由度为 \(1\)\(t\) 分布。

\(A=\begin{pmatrix}\cos\alpha&\sin\alpha\\-\sin\alpha&\cos\alpha\end{pmatrix}\),则 \(A\) 是正交矩阵且表示逆时针旋转 \(\alpha\) 角度。记 \(W=\frac{X}{\sqrt{X^2+Y^2}}, V=\frac{Y}{\sqrt{X^2+Y^2}}\)\(W^2+V^2=1\),二元随机变量\((W,V)\) (依概率\(1\)地)是单位圆周上的点。又由于\((X,Y)\) 对任意旋转变换保持分布不变,\((W,V)\) 对任意旋转变换也保持分布不变,故可知 \((W,V)\) 服从单位圆周上的均匀分布。记 \(\theta\) 为原点与 \((W,V)\) 连线与 \(x\) 轴正方向的夹角,则 \(\theta\sim U(-\frac{\pi}{2},-\frac{3\pi}{2})\),因此

\[P(0<Y<X)=P(0<W<V)=P(0<\theta<\frac{\pi}{4})=\frac{\frac{\pi}{4}}{2\pi}=\frac{1}{8}。 \]

\(\frac{Y}{X}=\frac{V}{W}=\tan\theta:=Z\in(-\infty,\infty)\)\(Z\) 的单调递增区间为 \(\theta\in(-\frac{\pi}{2},\frac{\pi}{2})\cup (\frac{\pi}{2},\frac{3\pi}{2})\) ,故 \(Z\) 的密度函数为

\[p_{Z}(z)=2p_\theta(z)\frac{d\theta}{dz}=\frac{1}{\pi}\frac{d\arctan z}{dz}=\frac{1}{\pi}\frac{1}{1+x^2}, \]

因此 \(Z\) 服从标准柯西分布,即 \(t(1)\) 分布。

Question 5 二元正态相关概率计算

问:(20分)设二维随机变量 \((X,Y)\) 服从正态分布,\(E(X)=E(Y)=0\)\(E(X^2)=E(Y^2)=1,E(XY)=\frac{1}{2}\),求 \((X,Y)\) 的联合密度函数和 \(P(X>0,Y>0)\)

解:

\[\begin{align*} cov(X,Y)&=E[XY]-E[X]E[Y]=\frac{1}{2}\\(X,Y)&\sim N\left(\begin{bmatrix}0\\0\end{bmatrix} ,\begin{bmatrix}1&\frac{1}{2}\\\frac{1}{2}&1\end{bmatrix} \right) \\ f(x,y)&=\frac{1}{\sqrt{3}\pi}\exp\left\{-\frac{2}{3}(x^2+y^2-xy)\right\},-\infty<x,y<\infty\\ P(X>0,Y>0)&=\int_0^\infty\int_0^\infty \frac{1}{\sqrt{3}\pi}\exp\left\{-\frac{2}{3}(x^2+y^2-xy)\right\}dxdy\\ &=\int_0^\frac{\pi}{2}\int_0^\infty\frac{1}{\sqrt{3}\pi}\exp\left\{-\frac{2}{3}r^2(1-\frac{1}{2}\sin2\theta)\right\}rdrd\theta\text{(极坐标变换)}\\ &=\frac{\sqrt{3}}{8\pi}\int_0^\pi\frac{1}{1-\frac{1}{2}\sin\theta}d\theta\\ &=\frac{\sqrt{3}}{8\pi}\int_0^\infty\frac{1}{1-\frac{t}{t^2+1}}\frac{2dt}{1+t^2}\text{(万能公式)}\\ &=\frac{\sqrt{3}}{4\pi}\int_0^\infty\frac{1}{(t-\frac{1}{2})^2+(\frac{\sqrt{3}}{2})^2}d(t-\frac{1}{2})\\ &=\frac{1}{2\pi}\arctan\left(\frac{2}{\sqrt{3}}(t-\frac{1}{2})\right)\bigg|_0^\infty\\ &=\frac{1}{2\pi}\left(\frac{\pi}{2}+\frac{\pi}{6}\right)=\frac{1}{3} \end{align*} \]

Question 6 大数定律(Markovian LLN)

问:(10分)随机变量序列 \(\{X_n\}\) 相互独立且方差存在,\(Y_n=\sum_{i=1}^n X_i\),问 \(\{\frac{Y_n}{n^2}\}\) 是否服从大数定律,若否,举反例。

解:验证马尔科夫条件。

\[\begin{align*} \frac{1}{m^2}Var\left(\sum_{n=1}^m\frac{Y_n}{n^2}\right)&=\frac{1}{m^2}Var\left(\sum_{n=1}^m\frac{Y_n}{n^2}\right)\\ &=\frac{1}{m^2}Var\left(\sum_{n=1}^m\frac{\sum_{i=1}^nX_i}{n^2}\right)\\ &=\frac{1}{m^2}\sum_{n=1}^m\frac{1}{n^4}\sum_{i=1}^nVar(X_i)\\ &\leq\frac{1}{m^2}\sum_{n=1}^m\frac{\sigma^2_n}{n^3}\text{(记 $\sup_{1\leq i\leq n} Var(X_i)=\sigma_n^2<\infty$ )}\\ &\leq\frac{1}{m^2}\sum_{n=1}^m\sigma^2_n\\ &\leq\frac{1}{m}\max_{1\leq n\leq m}\{\sigma_n^2\}\rightarrow0,m\rightarrow\infty。 \end{align*} \]

根据马尔科夫大数定律,\(\{\frac{Y_n}{n^2}\}\) 服从大数定律。

Question 7 分布函数以及伽马分布性质

问:(10分)\(X_i\stackrel{i.i.d.}\sim N(\mu,\sigma^2),i=1,2,\ldots,n\),求\(-2\sum_{i=1}^n\ln F(X_i)\) 的分布。

解:

连续随机变量的分布函数服从均与分布,即 \(F(X_i)\stackrel{i.i.d.}{\sim}U(0,1)\)。于是

\[-\ln F(X_i)\stackrel{d}{=}-\ln(1-F(X_i))\stackrel{i.i.d.}{\sim} \exp(1), \]

因为若 \(Z\sim\exp(1)\),则其分布函数 \(F(Z)=1-e^{-Z}:=U\sim U(0,1)\),故 \(-\ln(1-U)\stackrel{d}{=}Z\sim\exp(1)\)

因此,由于 \(\exp(1)\sim Ga(1,1)\),根据伽伽马分布的性质,有

\[-2\sum_{i=1}^n\ln F(X_i)\sim Ga(n,\frac{1}{2})\sim \chi^2(2n)。 \]

Question 8 次序统计量的联合分布及贝塔分布性质

问:(10分)\(X_1,X_2,\ldots,X_6\stackrel{i.i.d.}{\sim} U(0,1)\),求 \(Var(2X_{(2)}+3X_{(3)})\)

解:

\[Var(2X_{(2)}+3X_{(3)})=4Var(X_{(2)})+9Var(X_{(3)})+12Cov(X_{(2)},X_{(3)}) \]

根据独立同分布均匀分布样本次序统计量的性质,有

\(X_{(2)}\sim Be(2,5),X_{(3)}\sim Be(3,4)\),于是 \(E[X_{(2)}]=\frac{2}{2+5}=\frac{2}{7},Var(X_{(2)})=\frac{2\times5}{(2+5)^2\times(2+5+1)}=\frac{5}{196}\)\(E[X_{(3)}]=\frac{3}{3+4}=\frac{3}{7},Var(X_{(3)})=\frac{3\times4}{(3+4)^2\times(3+4+1)}=\frac{6}{196}\)。另外,\(X_{(2)}\)\(X_{(3)}\) 的联合密度为

\[f(x,y)={1\choose6}x{1\choose5}{1\choose4}(1-y)^3=120x(1-y)^3, \]

\[E[X_{(2)}X_{(3)}]=\int_0^1\int_0^y xy\cdot120x(1-y)^3dxdy=40\int_0^1y^4(1-y)^3dy=40\times\frac{\Gamma(5)\Gamma(4)}{\Gamma(9)}=\frac{1}{7},\\Cov(X_{(2)},X_{(3)})=E[X_{(2)}X_{(3)}]-E[X_{(2)}]E[X_{(3)}]=\frac{1}{7}-\frac{2}{7}\times\frac{3}{7}=\frac{1}{49},\\Var(2X_{(2)}+3X_{(3)})=4\times\frac{5}{196}+9\times\frac{6}{196}+12\times\frac{1}{49}=\frac{61}{98}。 \]

Question 9 统计量的无偏性及有效性

问:(10分)\(X_i\stackrel{i.i.d.}{\sim} U(0,\theta),i=1,\ldots,n\)\(aX_{(1)},bX_{(3)}\)\(\theta\) 的无偏估计,求 \(a,b\) 并比较有效性。

解:根据独立同分布均匀分布样本次序统计量的性质,有

\[\frac{X_{(1)}}{\theta}\sim Be(1,n),\,\,\frac{X_{(3)}}{\theta}\sim Be(3,n-2), \]

\[E[aX_{(1)}]=E\left[a\theta\frac{X_{(1)}}{\theta}\right]=\frac{a\theta}{n+1}=\theta\Longrightarrow a=n+1,\\ E[bX_{(3)}]=E\left[b\theta\frac{X_{(3)}}{\theta}\right]=\frac{3b\theta}{n+1}=\theta\Longrightarrow b=\frac{n+1}{3}, \]

\[Var(aX_{(1)})=\frac{a^2}{\theta^2}Var\left(\frac{X_{(1)}}{\theta}\right)=\frac{a^2}{\theta^2}\frac{n}{(n+1)^2(n+1+1)}=\frac{n}{\theta^2(n+2)},\\ Var(bX_{(3)})=\frac{b^2}{\theta^2}Var\left(\frac{X_{(3)}}{\theta}\right)=\frac{b^2}{\theta^2}\frac{3(n-2)}{(n+1)^2(n+1+1)}=\frac{(n-2)}{3\theta^2(n+2)}, \]

\[Var(bX_{(3)})<Var(aX_{(1)}), \]

\(bX_{(3)}\) 更有效。

Question 10 贝叶斯估计 (正态-正态模型求后验分布)

问:(10分)\(X_1,X_2,\ldots,X_n\stackrel{i.i.d.}{\sim}N(\mu,16)\),其中先验分布 \(\mu\sim N(a,b^2)(b>0)\),求\(\mu\) 的后验分布。

解:

参数 \(\mu\) 的先验分布为

\[\pi(\mu)=(2\pi b^2)^{-1/2}\exp\left\{-\frac{1}{2 b^2}(\mu-a)^2\right\}, \]

样本 \(\mathbf{X}\) 的条件分布为

\[p(\mathbf{X}|\mu)=(32\pi)^{-n/2}\exp\left\{-\frac{1}{32}\sum_{i=1}^n(x-\mu)^2\right\}, \]

\(\mathbf{X}\)\(\mu\) 的联合密度为

\[h(\mathbf{X},\mu)=p(\mathbf{X}|\mu)\pi(\mu)\propto\exp\left\{-\frac{(\mu-B/A)}{2/A}-\frac{1}{2}(C-B^2/A)\right\}, \]

其中

\[A=\frac{n}{16}+\frac{1}{b^2},\quad B=\frac{n \bar{x}}{16}+\frac{a}{b^2},\quad C=\frac{\sum_{i=1}^n x_i^2}{16}+\frac{a^2}{b^2}, \]

则样本 \(\mathbf{X}\) 的边际分布为

\[m(\mathbf{X})=\int_{-\infty}^\infty h(\mathbf{X},\mu)d\mu\propto(2\pi /A)^{1/2}\exp \left\{-\frac{1}{2}(C-B^2/A)\right\}, \]

\(\mathbf{X}\) 的后验分布为

\[\pi(\mu|\mathbf{X})=\frac{h(\mathbf{X,\mu})}{m(\mathbf{X})}=(2\pi/A)^{1/2}\exp\left\{-\frac{1}{2/A}(\mu-B/A)^2\right\} \]

\(\mu|\mathbf{X}\sim N(B/A,1/A)\)

\[\mu|\mathbf{X}\sim N\left(\frac{n\bar{x}b^2+16a}{nb^2+16},\frac{16b^2}{nb^2+16}\right)。 \]

Question 11 假设检验两类错误

问:(10分)\(X_i\stackrel{i.i.d.}{\sim} U(0,\theta)\),假设 \(H_0:\theta\leq1,H_1:\theta>1,W=\{X_{(n)}\geq c\}\)

(1)\(\alpha=0.05\), 求 \(c\) ;

(2) 若 \(\theta=1.5\),要使 \(\beta\leq0.1\),在(1)的条件下,\(n\) 至少为多少。

解:

(1)样本有 \(\alpha\) 概率落入拒绝域,则

\[P(W|H_0)=P(X_{(n)}\geq c|\theta=1)=1-P(X_{(n)}<c|\theta=1)=1-\prod_{1\leq i\leq n} P(X_i<c|\theta=1)=1-c^n=\alpha, \]

由于 \(\theta=1\),解得 \(c=(1-\alpha)^{1/n}=0.95^{1/n}\)

(2)第二类错误概率:

\[\beta=P(\bar{W}|H_1)=P(X_{n}<c|\theta=1.5)=\prod_{1\leq i\leq n}P(X_i<c|\theta=1.5)=\left(\frac{c}{1.5}\right)^n, \]

在(1)的条件下,使 \(\beta\leq 0.1\),则 \(n\geq\frac{\ln9.5}{\ln 1.5}\)\(n\) 至少为 \(6\)

知识点

  1. 基本不等式
    \(\frac{a+b}{2}\geq\sqrt{ab}(a>0,b>0)\),等号当且仅当 \(a=b\) 时成立。

  2. 旋转变换
    \(A=\begin{pmatrix}\cos\alpha&\sin\alpha\\-\sin\alpha&\cos\alpha\end{pmatrix}\) 是正交旋转变换矩阵。圆周上的二元均匀分布随机变量对任意关于圆心的旋转变换保持分布不变。

  3. 极坐标变换
    \(x=r\cos\theta,y=r\sin\theta\),则 Jocobia 行列式 \(|J|=r\)。极坐标变换常用计算于计算与 \(e^{-x^2+y^2}\) 有关的积分。

  4. 万能公式
    计算三角函数积分时常用。令\(\tan\frac{\theta}{2}=t\),则 \(\sin\theta=\frac{2t}{1+t^2},\cos\theta=\frac{1-t^2}{1+t^2},d\theta=\frac{2dt}{1+t^2}\),配合有理分式积分方法,通常积分结果与 \(\ln\)\(\arctan\) 有关。

  5. 常见的大数定律

  6. 伽马分布性质

  7. 贝塔分布性质

  8. 次序统计量

  9. 贝叶斯估计

参考资料

  1. 真题解析 | 2022复旦大学432统计学真题及详解
posted @ 2022-01-19 16:51  Yesir97  阅读(722)  评论(0)    收藏  举报