（十二）知识点总结

自变量和因变量

自变量 (independent variable)：由研究者主动操纵，而引起的因变量发生变化的因素或条件

因变量 (dependent variable)：会随着另一个（或者另几个）因素（或条件）的变化而变化的值

什么是假设检验（hypothesis test）？

用来验证一个实验样本和已知的总体样本之间差别的检验方法。

假设检验涉及到的概念：

　　1.α level。常用的 α level 包括：0.05（5%）；0.01（1%）；0.001（0.1%）。作用是协助划定分布的临界区域。

　　2.零假设（null hypothesis）。H0

　　3.对立假设（alternative hypothesis）。 Ha，简单理解就是零假设取反。

统计测试类型主要包括：
1. Z 检验
2. t 检验
  1. 单样本 t 检验 dependent t test
  2. 双样本 t 检验 independent t test
  3. 配对 t 检验 paired t test
对于已知总体均值和标准偏差时，使用 Z 检验
只已知样本时，使用 t 检验
1. 当总体标准差未知时，使用单样本 t 检验估计总体均值，并将其与目标值或参考值进行比较。
2. 需要分析两个独立组的均值是否存在差异或者计算两个总体均值差异范围时，使用双样本 t 检验
3. 确定两个配对样本之差的均值不等于 0（或目标值）或者计算可能包含差异总体均值的值的范围。
根据假设，还可以分为：
- 单尾正向检验
- 单尾负向检验
- 双尾检验（对于双尾检验，需要将 α level 表示的概率除2）

包括三种度量：

均值 - mean 数值的平均值公式如下： $\frac{\sum_{i=1}^{n}x_{i}}{n}$
中位数 - median：处于数据集正中间的数值。如果有俩个，那么去这两个数值的平均数。如下：
- 单数的数据集：中位数处于 n/2 的位置
- 偶数的数据集：中位数为 $\frac{x_{n/2}+x_{(n+1)/2}}{2}$
众数 - mode 出现频率最高的数字