2025-08-25 ?

【t 统计量】

考虑随机变量 X 的 \(n\) 个观测值 \(\{X_1\dots X_n\}\),有均值 \(\overline{X}\) 方差 \(\sigma\),原假设这个 \(X\) 的均值是 \(\mu\)

t 统计量定义是 \(\dfrac{\overline X - \mu}{\sigma/\sqrt{n}}\)

也就是说,“我们观察到的样本均值与假设的总体均值之间的差异,是否大到不能用随机抽样误差来解释?”

【t 检验】

t 检验。衡量两组数据的均值是否有显著差异。或者说,差异是不是由于采样偏差带来的。

最基础的:有两组数据,样本量均值方差分别是 \((n_1,\mu_1,\sigma_1),(n_2,\mu_2,\sigma_2)\),这时候 t 值就是 \(\dfrac{|\mu_1-\mu_2|}{\sqrt{\frac{\sigma_1^2}{n_1} - \frac{\sigma_2^2}{n_2}}}\)

这个表达式上下分别代表,组间差异和组内采样误差。

究竟数值多大算显著,可以去查表。这里严谨来说,应当是,数值 \(>x\) 就有 \(y \times 100\%\) 的可信度。这里的可信度用术语来说就是 \(p\) 值。也就是说 t 值和 p 值的对应关系可以去查表。

【番外:基础应用】

这时候似乎可以通过 t 统计量来衡量,做完线性回归之后,某个回归系数是否非 0。其公式就是 \(\dfrac{\hat{\bold\beta} - \bold0}{\bold {SE}(\hat\beta)}\)\(\beta\) 是向量,这个表达式可以直接算出来所有系数的 t 统计量值,SE 是标准误,计算流程已知)

posted @ 2025-08-25 20:00  没学完四大礼包不改名  阅读(32)  评论(0)    收藏  举报