统计作业1

\(Y\) 有一个连续分布函数 \(F\)。对于任意的 \(\eta\),证明 \(X = |Y - \eta|\) 的分布为:

\[G(x) = F(\eta + x) - F(\eta - x), \quad x > 0 \]

因此,给出 \(F\) 的绝对中位数偏差的定义,用 \(F^{-1}\)\(G^{-1}\) 来表示。如果 \(Y\) 的密度关于原点对称,证明:

\[G(x) = 2 F(x) - 1 \]

从而找出拉普拉斯密度(2.5)的绝对中位数偏差。


\(X_1, \ldots, X_n\)\(Y_1, \ldots, Y_n\) 是来自指数密度函数

\[\lambda e^{-\lambda x}, x > 0 \]

\[\lambda^{-1} e^{-y/\lambda}, y > 0 \]

的独立随机样本,其中 \(\lambda > 0\)
如果 \(\overline{X}\)\(\overline{Y}\) 是样本平均值,证明当 \(n \rightarrow \infty\) 时,

\[\overline{X} \overline{Y} \xrightarrow{P} 1 \]


\(R\) 是一个二项式变量,概率为 \(\pi\),分母为 \(m\)
其均值和方差分别为

\[m\pi \]

\[m\pi(1-\pi) \]

\(R\) 的经验逻辑变换为

\[h(R) = \log\left(\frac{R + \frac{1}{2}}{m - R + \frac{1}{2}}\right) \]

证明对于大的 \(m\)

\[h(R) \dot{\sim} N\left\{\log\left(\frac{\pi}{1-\pi}\right),\frac{1}{m\pi(1-\pi)}\right\} \]

\[\mathrm{E}\left[\log\left\{\frac{R}{m-R}\right\}\right] \]

的确切值。实践中 \(\frac{1}{2}\) 是否必要?


证明一个二项式随机变量 \(R\),其分母为 \(m\),概率为 \(\pi\),具有累积生成函数

\[K(t) = m\log\left(1-\pi+\pi e^{t}\right) \]

找出当 \(m\rightarrow\infty\)\(\pi\to0\) 时,使得 \(m\pi\to\lambda>0\)\(K(t)\) 的极限。
证明

\[\operatorname{Pr}(R=r) \rightarrow \frac{\lambda^r}{r!} e^{-\lambda}, \]

从而建立 \(R\) 在分布上收敛到泊松随机变量。这产生了二项分布的泊松近似,有时称为小数定律。在 \(\mathrm{S}\) 语言中进行数值检查,尝试

y <- 0:10; lambda <- 1; m <- 10; p <- lambda/m
round(cbind(y, pbinom(y, size=m, prob=p), ppois(y, lambda)), digits=3)

使用不同的 \(m\)\(\lambda\) 值。


\(Y_1, \ldots, Y_n\) 是来自均值为 \(\mu\) 和方差为 \(\sigma^2\) 的分布的随机样本。求

\[T = \frac{1}{2 n(n-1)}\sum_{j\neq k}\left(Y_{j}-Y_{k}\right)^2 \]

的均值,并通过将 \(Y_{j}-Y_{k} = Y_{j}-\overline{Y}-\left(Y_{k}-\overline{Y}\right)\) 展开,证明 \(T = S^2\)

posted @ 2024-09-21 15:16  某宇_My  阅读(44)  评论(0)    收藏  举报
/*粒子线条,鼠标移动会以鼠标为中心吸附的特效*/