2025-08-25 ?
【t 统计量】
考虑随机变量 X 的 \(n\) 个观测值 \(\{X_1\dots X_n\}\),有均值 \(\overline{X}\) 方差 \(\sigma\),原假设这个 \(X\) 的均值是 \(\mu\)
t 统计量定义是 \(\dfrac{\overline X - \mu}{\sigma/\sqrt{n}}\)
也就是说,“我们观察到的样本均值与假设的总体均值之间的差异,是否大到不能用随机抽样误差来解释?”
【t 检验】
t 检验。衡量两组数据的均值是否有显著差异。或者说,差异是不是由于采样偏差带来的。
最基础的:有两组数据,样本量均值方差分别是 \((n_1,\mu_1,\sigma_1),(n_2,\mu_2,\sigma_2)\),这时候 t 值就是 \(\dfrac{|\mu_1-\mu_2|}{\sqrt{\frac{\sigma_1^2}{n_1} - \frac{\sigma_2^2}{n_2}}}\)
这个表达式上下分别代表,组间差异和组内采样误差。
究竟数值多大算显著,可以去查表。这里严谨来说,应当是,数值 \(>x\) 就有 \(y \times 100\%\) 的可信度。这里的可信度用术语来说就是 \(p\) 值。也就是说 t 值和 p 值的对应关系可以去查表。
【番外:基础应用】
这时候似乎可以通过 t 统计量来衡量,做完线性回归之后,某个回归系数是否非 0。其公式就是 \(\dfrac{\hat{\bold\beta} - \bold0}{\bold {SE}(\hat\beta)}\)(\(\beta\) 是向量,这个表达式可以直接算出来所有系数的 t 统计量值,SE 是标准误,计算流程已知)

浙公网安备 33010602011771号