数学一|概统|八、假设检验

考试要求:

  • 理解显著性检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误;
  • 掌握单个及两个正态总体的均值和方差的假设检验;

1.1 假设检验

假设检验和置信区间都需要构造枢轴变量。在求解置信区间时,枢轴变量有一个未知量 \(\mu\)\(\sigma^2\) 需要求解,关注的是概率为 \(1-\alpha\) 的大概率事件;而假设检验时,枢轴变量中的 \(\mu\)\(\sigma^2\) 会带入 \(H_0\) 假设的数值中,关注的是概率为 \(\alpha\) 的小概率事件。

假设检验的思想类似于反证法:如果条件 \(A\) 成立导出一个矛盾的或不可能成立的结论 \(B\),那么 \(A\) 就是错误的。假设检验依据的是小概率原理——“一个小概率事件在一次实验中不太可能发生”,如果假设(\(H_0\))导致一个小概率事件发生了,那么我们就拒绝该假设(\(H_0\))。这一小概率在假设检验中称为检验的显著性水平,通常用 \(\alpha\) 进行表示。

1.1.1 假设检验过程

  1. 提出原假设 \(H_0 \text{ (null hypothesis)}\) 和备选假设 \(H_A \text{ (alternative hypothesis)}\)

    备选假设可以是单侧的也可以是双侧的。备选假设是你想要证明的论点,往往与原假设相反。备选假设有时也记为 \(H_1\)

  2. 构造一个含待检参数 \(\theta\)(不含其它未知参数)且分布已知的枢轴量 \(u(X_1,X_2,\ldots,X_n:\theta)\) 并确定其分布;

  3. 对于给定的显著性水平 \(\alpha\),由上述枢轴量及其分布,结合 \(H_0\),确定拒绝域 \(W\),使得

    \[P\{(X_1,X_2,\ldots,X_n)\in W|H_0\}\leqslant \alpha \]

  4. 根据样本值 \((x_1,x_2,\dots,x_n)\) 是否落在 \(W\) 中做出是否拒绝 \(H_0\) 的统计决断;如果 \((x_1,x_2,\dots,x_n)\in W\),则拒绝 \(H_0\),否则不能拒绝 \(H_0\)

1.1.2 假设检验的两类错误

在假设检验中,我们通过样本来检验假设的准确性。而抽样具有随机性,并且有时样本容量过小,或者其他原因,都会导致最终的推断可能出现错误。统计推断是具有误差的,比如天气预报。

决策 总体中 \(H_0\) 为真 总体中 \(H_0\) 为假
接受 \(H_0\) 正确决策 \((1-\alpha)\) “存伪”
(第二类错误)
\(\beta\)
拒绝 \(H_0\) “弃真”
(第一类错误)
\(\alpha\)
正确决策 \((1-\alpha)\)

当原假设 \(H_0\) 成立时,拒绝原假设的概率至多为显著性检验水平 \(\alpha\),这表明犯第一类错误的概率至多为 \(\alpha\)

1.2 单个正态总体的均值和方差的假设检验

对于单个正态总体的的均值和方差的假设检验,大致可分为以下六组情况:

\[\begin{align} & H_0:\mu = \mu_0\leftrightarrow H_1:\mu\neq\mu_0\quad H_0:\sigma^2=\sigma_0^2\leftrightarrow H_1:\sigma^2\neq\sigma_0^2\\[1.5ex] & H_0:\mu \leqslant \mu_0\leftrightarrow H_1:\mu>\mu_0\quad H_0:\sigma^2\leqslant\sigma_0^2\leftrightarrow H_1:\sigma^2>\sigma_0^2\\[1.5ex] & H_0:\mu \geqslant \mu_0\leftrightarrow H_1:\mu<\mu_0\quad H_0:\sigma^2\geqslant\sigma_0^2\leftrightarrow H_1:\sigma^2<\sigma_0^2\\[1.5ex] \end{align} \]

\(\text{(1)}\) 中情况为双侧假设检验问题;其余两种都为单侧假设检验问题。上述三种对均值的假设检验,每种又可分为方差已知和方差未知;对于方差的假设检验,每种又可分为均值已知和均值未知,所以,不能死记硬背,要通过理解一种假设检验的多种情况来推其余两种假设检验的情况。

1.2.1 方差 \(\sigma^2\) 已知,检验 \(\mu\)

  1. 提出假设 \(H_0:\mu = \mu_0\leftrightarrow H_1:\mu\neq\mu_0\)

  2. 构造枢轴量 \(U =\frac{\overline{X} - \mu}{\sigma_0/\sqrt{n}} \sim N(0,1)\)。构造相应的统计量 \(U_0 =\frac{\overline{X} - \mu_0}{\sigma_0/\sqrt{n}}\)

  3. \(H_0\) 成立,\(U_0\sim N(0,1)\),统计量 \(U_0\) 不应偏大或偏小,所以拒绝域可取

    \[\begin{align} &W = \{(x_1,x_2,\ldots,x_n):|u_0|>u_\frac{\alpha}{2}\}\nonumber\\[1.5ex] &P(|U_0|>u_{\frac\alpha2}) = \alpha\nonumber\\[1.5ex] &W: (-\infty,\mu_0-u_{\frac\alpha2}\frac{\sigma_0}{\sqrt{n}})\cup(\mu_0+u_{\frac\alpha2}\frac{\sigma_0}{\sqrt{n}},+\infty)\nonumber \end{align} \]

    在假设 \(H_0\) 成立的条件下,\(|U_0|\) 的取值应与 \(0\) 差距不大,即 \(|U_0|\) 取较大值为小概率事件,此时要否定 \(H_0\)


  1. 提出假设 \(H_0:\mu \leqslant \mu_0\leftrightarrow H_1:\mu > \mu_0\)

  2. 构造分布已知的枢轴量,由枢轴量得出估计量。当假设 \(H_0\) 成立,有

    \[U_0 = \frac{\overline{X} - \mu_0}{\sigma_0/\sqrt{n}}\leqslant \frac{\overline{X} - \mu}{\sigma_0/\sqrt{n}} = U\sim N(0,1) \]

    \(H_0\) 成立时,统计量 \(U_0\) 有偏小的倾向,而当 \(H_1\) 成立时,\(U_0\) 有偏大的趋势,故小概率事件可取 \(U_0\) 偏大。

  3. \(H_0\) 成立时,\(U_0\) 不应过大,所以拒绝域可取为

    \[\begin{align} &W = \{(x_1,x_2,\ldots,x_n):u_0>u_\alpha\}\nonumber\\[1.5ex] &P(U_0>u_\alpha) \leqslant P(U>u_\alpha)= \alpha\nonumber\\[1.5ex] &W: (\mu_0+u_\alpha\frac{\sigma_0}{\sqrt{n}},+\infty)\nonumber \end{align} \]


同理可得,假设为 \(H_0:\mu \geqslant \mu_0\leftrightarrow H_1:\mu < \mu_0\) 时,有下式成立,

\[\begin{align} &W = \{(x_1,x_2,\ldots,x_n):u_0<-u_\alpha\}\nonumber\\[1.5ex] &P(U_0<-u_\alpha) \leqslant P(U<-u_\alpha)= \alpha\nonumber\\[1.5ex] &W: (-\infty,\mu_0-u_\alpha\frac{\sigma_0}{\sqrt{n}})\nonumber \end{align} \]

1.2.2 方差 \(\sigma^2\) 未知,检验 \(\mu\)

  1. 提出假设 \(H_0:\mu \geqslant \mu_0\leftrightarrow H_1:\mu < \mu_0\)

  2. 假设 \(H_0\) 成立,有

    \[T_0 = \frac{\overline{X} - \mu_0}{S/\sqrt{n}}\geqslant \frac{\overline{X} - \mu}{S/\sqrt{n}} = T\sim t(n-1) \]

    \(H_0\) 成立时,统计量 \(T_0\) 有偏大的倾向,而当 \(H_1\) 成立时,\(U_0\) 有偏小的趋势,故小概率事件可取 \(U_0\) 偏小。

  3. 对于给定 \(\alpha\),小概率事件发生概率为 \(P\left(T_0<-t_{\alpha}(n-1)\right) \leqslant P\left(T<-t_{\alpha}(n-1)\right) = \alpha\),查表可得 \(-t_{\alpha}(n-1)\)

  4. 由样本数据求出统计量 \(T_0\) 的值,然后下结论:

    • 如果 \(T_0 < -t_{\alpha}(n-1)\),则拒绝 \(H_0\)
    • 如果 \(T_0 \geqslant -t_{\alpha}(n-1)\),则接受 \(H_0\)

1.2.3 均值 \(\mu\) 已知,检验 \(\sigma^2\)

  1. 提出假设 \(H_0:\sigma^2 = \sigma^2_0\leftrightarrow H_1:\sigma^2\neq\sigma^2_0\)

  2. 假设 \(H_0\) 成立,构造枢轴量 \(\chi^2 =\frac{\sum_{i=1}^n(X_i-\mu)^2}{\sigma^2_0} \sim \chi^2(n)\)

    在假设 \(H_0\) 成立的条件下,当样本量区域无穷时,\(\chi^2\) 趋向于 \(1\),故当 \(\chi^2\) 很大或很小时,都可拒绝 \(H_0\)

  3. 对于给定 \(\alpha\),小概率事件发生概率为 \(P\left(\chi^2>\chi^2_{\frac{\alpha}{2}}(n)\right) = P\left(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n)\right) = \frac\alpha2\),查表可得 \(\chi^2_{\frac{\alpha}{2}}(n)\)\(\chi^2_{1-\frac{\alpha}{2}}(n)\)

  4. 由样本数据求出统计量 \(\chi^2\) 的值,然后下结论:

    • 如果 \(\chi^2 > \chi^2_{\frac{\alpha}{2}}(n)\)\(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n)\),则拒绝 \(H_0\)
    • 如果 \(\chi^2_{\frac{\alpha}{2}}(n) < \chi^2 <\chi^2_{1-\frac{\alpha}{2}}(n)\),则接受 \(H_0\)
    • 如果 \(\chi^2 = \chi^2_{\frac{\alpha}{2}}(n)\)\(\chi^2=\chi^2_{1-\frac{\alpha}{2}}(n)\),慎重处理,再抽样,再检验;

1.2.3 均值 \(\mu\) 未知,检验 \(\sigma^2\)

  1. 提出假设 \(H_0:\sigma^2 = \sigma^2_0\leftrightarrow H_1:\sigma^2\neq\sigma^2_0\)

  2. 假设 \(H_0\) 成立,构造枢轴量 \(\chi^2 =\frac{(n-1)S^2}{\sigma^2_0} \sim \chi^2(n-1)\)

  3. 对于给定 \(\alpha\),小概率事件发生概率为 \(P\left(\chi^2>\chi^2_{\frac{\alpha}{2}}(n-1)\right) = P\left(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\right) = \frac\alpha2\),查表可得 \(\chi^2_{\frac{\alpha}{2}}(n-1)\)\(\chi^2_{1-\frac{\alpha}{2}}(n-1)\)

  4. 由样本数据求出统计量 \(\chi^2\) 的值,然后下结论:

    • 如果 \(\chi^2 > \chi^2_{\frac{\alpha}{2}}(n-1)\)\(\chi^2<\chi^2_{1-\frac{\alpha}{2}}(n-1)\),则拒绝 \(H_0\)
    • 如果 \(\chi^2_{\frac{\alpha}{2}}(n-1) < \chi^2 <\chi^2_{1-\frac{\alpha}{2}}(n-1)\),则接受 \(H_0\)
    • 如果 \(\chi^2 = \chi^2_{\frac{\alpha}{2}}(n-1)\)\(\chi^2=\chi^2_{1-\frac{\alpha}{2}}(n-1)\),慎重处理,再抽样,再检验;

1.3 两个正态总体的均值和方差的假设检验

\(X\sim N(\mu_1, \sigma_1^2),\,\,Y\sim N(\mu_2, \sigma_2^2)\),且 \(X\)\(Y\) 相互独立,\((X_1,\ldots,X_{n_1}),\,\,(Y_1,\ldots,Y_{n_2})\) 分别是取自总体 \(X\)\(Y\) 的容量分别为 \(n_1,\,\,n_2\) 的样本,我们将两个总体的比较转化为均值和方差的差异性检验。

1.3.1 均值的差异性检验

\[\begin{align} & H_0:\mu_1 = \mu_2\leftrightarrow H_1:\mu_1\neq\mu_2\nonumber\\[1.5ex] & H_0:\mu_1 \leqslant \mu_2\leftrightarrow H_1:\mu_1>\mu_2\nonumber\\[1.5ex] & H_0:\mu_1 \geqslant \mu_2\leftrightarrow H_1:\mu_1<\mu_2\nonumber\\[1.5ex] \end{align} \]

\(\mu = \mu_1-\mu_2\) 可将上述假设转换为 \(\mu\) 的假设检验问题:

\[\begin{align} & H_0:\mu = 0\leftrightarrow H_1:\mu\neq 0\nonumber\\[1.5ex] & H_0:\mu \leqslant 0\leftrightarrow H_1:\mu> 0\nonumber\\[1.5ex] & H_0:\mu \geqslant 0\leftrightarrow H_1:\mu< 0\nonumber\\[1.5ex] \end{align} \]

\(\sigma_1^2\)\(\sigma_2^2\) 均已知时,枢轴量为:

\[U = \frac{(\overline{X} - \overline{Y}) - \mu}{\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}} \sim N(0,1) \]

构造相应的统计量(此时 \(\mu_0 = 0\)

\[U_0 = \frac{(\overline{X} - \overline{Y})}{\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}} \sim N(0,1) \]

则上述关于 \(\mu\) 的假设检验问题的拒绝域分别为:

\[\begin{align} &W = \left\{(x_1,\ldots,x_{n_1}; y_1,\ldots,y_{n_2}):|u_0|>u_{\frac{\alpha}{2}} \right\}\nonumber\\[1.5ex] &W = \left\{(x_1,\ldots,x_{n_1}; y_1,\ldots,y_{n_2}):u_0>u_{\alpha} \right\}\nonumber\\[1.5ex] &W = \left\{(x_1,\ldots,x_{n_1}; y_1,\ldots,y_{n_2}):u_0<-u_{\alpha} \right\}\nonumber\\[1.5ex] \end{align} \]

\(\sigma_1^2=\sigma_2^2=\sigma^2\)\(\sigma^2\) 未知时,枢轴量为:

\[U = \frac{(\overline{X} - \overline{Y}) - \mu}{S\sqrt{1/n_1+1/n_2}} \sim t(n_1+n_2-2) \]

其中 \(S^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}\) 为样本方差 \(S_1^2\)\(S_2^2\) 的加权平均,它恰好是 \(\sigma^2\) 的无偏估计。

构造相应的统计量(此时 \(\mu_0 = 0\)

\[T_0 = \frac{(\overline{X} - \overline{Y})}{S\sqrt{1/n_1+1/n_2}} \]

则上述关于 \(\mu\) 的假设检验问题的拒绝域分别为:

\[\begin{align} &W = \left\{(x_1,\ldots,x_{n_1}; y_1,\ldots,y_{n_2}):|t_0|>t_{\frac{\alpha}{2}}(n_1+n_2-2) \right\}\nonumber\\[1.5ex] &W = \left\{(x_1,\ldots,x_{n_1}; y_1,\ldots,y_{n_2}):t_0>t_{\alpha}(n_1+n_2-2) \right\}\nonumber\\[1.5ex] &W = \left\{(x_1,\ldots,x_{n_1}; y_1,\ldots,y_{n_2}):t_0<-t_{\alpha}(n_1+n_2-2) \right\}\nonumber\\[1.5ex] \end{align} \]

参考资料

posted @ 2024-06-10 16:35  TimeLimitExceeded  阅读(148)  评论(0)    收藏  举报