数学一|概统|八、假设检验
考试要求:
- 理解显著性检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误;
- 掌握单个及两个正态总体的均值和方差的假设检验;
1.1 假设检验
假设检验和置信区间都需要构造枢轴变量。在求解置信区间时,枢轴变量有一个未知量 \(\mu\) 或 \(\sigma^2\) 需要求解,关注的是概率为 \(1-\alpha\) 的大概率事件;而假设检验时,枢轴变量中的 \(\mu\) 或 \(\sigma^2\) 会带入 \(H_0\) 假设的数值中,关注的是概率为 \(\alpha\) 的小概率事件。
假设检验的思想类似于反证法:如果条件 \(A\) 成立导出一个矛盾的或不可能成立的结论 \(B\),那么 \(A\) 就是错误的。假设检验依据的是小概率原理——“一个小概率事件在一次实验中不太可能发生”,如果假设(\(H_0\))导致一个小概率事件发生了,那么我们就拒绝该假设(\(H_0\))。这一小概率在假设检验中称为检验的显著性水平,通常用 \(\alpha\) 进行表示。
1.1.1 假设检验过程
-
提出原假设 \(H_0 \text{ (null hypothesis)}\) 和备选假设 \(H_A \text{ (alternative hypothesis)}\);
备选假设可以是单侧的也可以是双侧的。备选假设是你想要证明的论点,往往与原假设相反。备选假设有时也记为 \(H_1\)。
-
构造一个含待检参数 \(\theta\)(不含其它未知参数)且分布已知的枢轴量 \(u(X_1,X_2,\ldots,X_n:\theta)\) 并确定其分布;
-
对于给定的显著性水平 \(\alpha\),由上述枢轴量及其分布,结合 \(H_0\),确定拒绝域 \(W\),使得
\[P\{(X_1,X_2,\ldots,X_n)\in W|H_0\}\leqslant \alpha \] -
根据样本值 \((x_1,x_2,\dots,x_n)\) 是否落在 \(W\) 中做出是否拒绝 \(H_0\) 的统计决断;如果 \((x_1,x_2,\dots,x_n)\in W\),则拒绝 \(H_0\),否则不能拒绝 \(H_0\)。
1.1.2 假设检验的两类错误
在假设检验中,我们通过样本来检验假设的准确性。而抽样具有随机性,并且有时样本容量过小,或者其他原因,都会导致最终的推断可能出现错误。统计推断是具有误差的,比如天气预报。
决策 | 总体中 \(H_0\) 为真 | 总体中 \(H_0\) 为假 |
---|---|---|
接受 \(H_0\) | 正确决策 \((1-\alpha)\) | “存伪” (第二类错误) \(\beta\) |
拒绝 \(H_0\) | “弃真” (第一类错误) \(\alpha\) |
正确决策 \((1-\alpha)\) |
当原假设 \(H_0\) 成立时,拒绝原假设的概率至多为显著性检验水平 \(\alpha\),这表明犯第一类错误的概率至多为 \(\alpha\)。
1.2 单个正态总体的均值和方差的假设检验
对于单个正态总体的的均值和方差的假设检验,大致可分为以下六组情况:
第 \(\text{(1)}\) 中情况为双侧假设检验问题;其余两种都为单侧假设检验问题。上述三种对均值的假设检验,每种又可分为方差已知和方差未知;对于方差的假设检验,每种又可分为均值已知和均值未知,所以,不能死记硬背,要通过理解一种假设检验的多种情况来推其余两种假设检验的情况。
1.2.1 方差 \(\sigma^2\) 已知,检验 \(\mu\)
-
提出假设 \(H_0:\mu = \mu_0\leftrightarrow H_1:\mu\neq\mu_0\);
-
构造枢轴量 \(U =\frac{\overline{X} - \mu}{\sigma_0/\sqrt{n}} \sim N(0,1)\)。构造相应的统计量 \(U_0 =\frac{\overline{X} - \mu_0}{\sigma_0/\sqrt{n}}\);
-
当 \(H_0\) 成立,\(U_0\sim N(0,1)\),统计量 \(U_0\) 不应偏大或偏小,所以拒绝域可取
\[\begin{align} &W = \{(x_1,x_2,\ldots,x_n):|u_0|>u_\frac{\alpha}{2}\}\nonumber\\[1.5ex] &P(|U_0|>u_{\frac\alpha2}) = \alpha\nonumber\\[1.5ex] &W: (-\infty,\mu_0-u_{\frac\alpha2}\frac{\sigma_0}{\sqrt{n}})\cup(\mu_0+u_{\frac\alpha2}\frac{\sigma_0}{\sqrt{n}},+\infty)\nonumber \end{align} \]在假设 \(H_0\) 成立的条件下,\(|U_0|\) 的取值应与 \(0\) 差距不大,即 \(|U_0|\) 取较大值为小概率事件,此时要否定 \(H_0\)。
-
提出假设 \(H_0:\mu \leqslant \mu_0\leftrightarrow H_1:\mu > \mu_0\);
-
构造分布已知的枢轴量,由枢轴量得出估计量。当假设 \(H_0\) 成立,有
\[U_0 = \frac{\overline{X} - \mu_0}{\sigma_0/\sqrt{n}}\leqslant \frac{\overline{X} - \mu}{\sigma_0/\sqrt{n}} = U\sim N(0,1) \]当 \(H_0\) 成立时,统计量 \(U_0\) 有偏小的倾向,而当 \(H_1\) 成立时,\(U_0\) 有偏大的趋势,故小概率事件可取 \(U_0\) 偏大。
-
当 \(H_0\) 成立时,\(U_0\) 不应过大,所以拒绝域可取为
\[\begin{align} &W = \{(x_1,x_2,\ldots,x_n):u_0>u_\alpha\}\nonumber\\[1.5ex] &P(U_0>u_\alpha) \leqslant P(U>u_\alpha)= \alpha\nonumber\\[1.5ex] &W: (\mu_0+u_\alpha\frac{\sigma_0}{\sqrt{n}},+\infty)\nonumber \end{align} \]
同理可得,假设为 \(H_0:\mu \geqslant \mu_0\leftrightarrow H_1:\mu < \mu_0\) 时,有下式成立,
1.2.2 方差 \(\sigma^2\) 未知,检验 \(\mu\)
-
提出假设 \(H_0:\mu \geqslant \mu_0\leftrightarrow H_1:\mu < \mu_0\);
-
假设 \(H_0\) 成立,有
\[T_0 = \frac{\overline{X} - \mu_0}{S/\sqrt{n}}\geqslant \frac{\overline{X} - \mu}{S/\sqrt{n}} = T\sim t(n-1) \]当 \(H_0\) 成立时,统计量 \(T_0\) 有偏大的倾向,而当 \(H_1\) 成立时,\(U_0\) 有偏小的趋势,故小概率事件可取 \(U_0\) 偏小。
-
对于给定 \(\alpha\),小概率事件发生概率为 \(P\left(T_0<-t_{\alpha}(n-1)\right) \leqslant P\left(T<-t_{\alpha}(n-1)\right) = \alpha\),查表可得 \(-t_{\alpha}(n-1)\);
-
由样本数据求出统计量 \(T_0\) 的值,然后下结论:
- 如果 \(T_0 < -t_{\alpha}(n-1)\),则拒绝 \(H_0\);
- 如果 \(T_0 \geqslant -t_{\alpha}(n-1)\),则接受 \(H_0\);
1.2.3 均值 \(\mu\) 已知,检验 \(\sigma^2\)
-
提出假设 \(H_0:\sigma^2 = \sigma^2_0\leftrightarrow H_1:\sigma^2\neq\sigma^2_0\);
-
假设 \(H_0\) 成立,构造枢轴量 \(\chi^2 =\frac{\sum_{i=1}^n(X_i-\mu)^2}{\sigma^2_0} \sim \chi^2(n)\);
在假设 \(H_0\) 成立的条件下,当样本量区域无穷时,\(\chi^2\) 趋向于 \(1\),故当 \(\chi^2\) 很大或很小时,都可拒绝 \(H_0\)。
-
对于给定 \(\alpha\),小概率事件发生概率为 \(P\left(\chi^2>\chi^2_{\frac{\alpha}{2}}(n)\right) = P\left(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n)\right) = \frac\alpha2\),查表可得 \(\chi^2_{\frac{\alpha}{2}}(n)\) 与 \(\chi^2_{1-\frac{\alpha}{2}}(n)\);
-
由样本数据求出统计量 \(\chi^2\) 的值,然后下结论:
- 如果 \(\chi^2 > \chi^2_{\frac{\alpha}{2}}(n)\) 或 \(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n)\),则拒绝 \(H_0\);
- 如果 \(\chi^2_{\frac{\alpha}{2}}(n) < \chi^2 <\chi^2_{1-\frac{\alpha}{2}}(n)\),则接受 \(H_0\);
- 如果 \(\chi^2 = \chi^2_{\frac{\alpha}{2}}(n)\) 或 \(\chi^2=\chi^2_{1-\frac{\alpha}{2}}(n)\),慎重处理,再抽样,再检验;
1.2.3 均值 \(\mu\) 未知,检验 \(\sigma^2\)
-
提出假设 \(H_0:\sigma^2 = \sigma^2_0\leftrightarrow H_1:\sigma^2\neq\sigma^2_0\);
-
假设 \(H_0\) 成立,构造枢轴量 \(\chi^2 =\frac{(n-1)S^2}{\sigma^2_0} \sim \chi^2(n-1)\);
-
对于给定 \(\alpha\),小概率事件发生概率为 \(P\left(\chi^2>\chi^2_{\frac{\alpha}{2}}(n-1)\right) = P\left(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\right) = \frac\alpha2\),查表可得 \(\chi^2_{\frac{\alpha}{2}}(n-1)\) 与 \(\chi^2_{1-\frac{\alpha}{2}}(n-1)\);
-
由样本数据求出统计量 \(\chi^2\) 的值,然后下结论:
- 如果 \(\chi^2 > \chi^2_{\frac{\alpha}{2}}(n-1)\) 或 \(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\),则拒绝 \(H_0\);
- 如果 \(\chi^2_{\frac{\alpha}{2}}(n-1) < \chi^2 <\chi^2_{1-\frac{\alpha}{2}}(n-1)\),则接受 \(H_0\);
- 如果 \(\chi^2 = \chi^2_{\frac{\alpha}{2}}(n-1)\) 或 \(\chi^2=\chi^2_{1-\frac{\alpha}{2}}(n-1)\),慎重处理,再抽样,再检验;
1.3 两个正态总体的均值和方差的假设检验
设 \(X\sim N(\mu_1, \sigma_1^2),\,\,Y\sim N(\mu_2, \sigma_2^2)\),且 \(X\) 与 \(Y\) 相互独立,\((X_1,\ldots,X_{n_1}),\,\,(Y_1,\ldots,Y_{n_2})\) 分别是取自总体 \(X\) 与 \(Y\) 的容量分别为 \(n_1,\,\,n_2\) 的样本,我们将两个总体的比较转化为均值和方差的差异性检验。
1.3.1 均值的差异性检验
令 \(\mu = \mu_1-\mu_2\) 可将上述假设转换为 \(\mu\) 的假设检验问题:
当 \(\sigma_1^2\) 与 \(\sigma_2^2\) 均已知时,枢轴量为:
构造相应的统计量(此时 \(\mu_0 = 0\))
则上述关于 \(\mu\) 的假设检验问题的拒绝域分别为:
\(\sigma_1^2=\sigma_2^2=\sigma^2\) ,\(\sigma^2\) 未知时,枢轴量为:
其中 \(S^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}\) 为样本方差 \(S_1^2\) 与 \(S_2^2\) 的加权平均,它恰好是 \(\sigma^2\) 的无偏估计。
构造相应的统计量(此时 \(\mu_0 = 0\))
则上述关于 \(\mu\) 的假设检验问题的拒绝域分别为:
参考资料
- https://www.cnblogs.com/feixianxing/p/overview-of-hypothesis-testing.html
- 《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社