数据分析--方差分析
一、检查因变量是否符合正态分布
1.非参数检验法
- 常见的正态性检验有Kolmogorov-Smirnov检验(即柯尔莫戈洛夫-斯米诺夫检验,简称K-S检验)和Shapiro-Wilk检验(即夏皮-威尔克检验,简称S-W检验)
- K-S检验适用于大样本数据,S-W检验适用于小样本数据(<50)
- 当检验结果的p值小于0.05,则认为数据不满足正态性。
- 多分类(n)因素,p>0.05/n,成正态分布
2.图形法
- 直方图
- 正态Q-Q图 (观察Q-Q图上的点能否分布在一条直线上,分布在一条直线上则说明近似或服从正态分布)
- 正态P-P图 (观察P-P图上的点能否分布在理论分布的直线上,若基本分布在直线上则说明近似或服从正态分布)
引用链接:https://zhuanlan.zhihu.com/p/442790720
二、检查是否存在单因素离群值
1.离群值的处理
- 保留离群值:
1)对因变量进行数据转换
2)将离群值纳入分析,并坚信其对结果不会产生实质影响
- 剔除离群值.
三、方差分析
1.方差分析的种类
- 单因素方差分析(One-Way ANOVA) 例如:性别 语文成绩
- 双因素方差分析(Two-way ANOVA) 例如:性别 身高 语文成绩
- 三因素方差分析(Three-way ANOVA) 例如:性别 身高 家庭收入 语文成绩
- 单因素重复测量方差分析 例如:性别 语文成绩1 语文成绩2 语文成绩3
- 两因素重复测量方差分析 例如:性别 身高 语文成绩1 语文成绩2 语文成绩3
- 三因素重复测量方差分析 例如:性别 身高 家庭收入 语文成绩1 语文成绩2 语文成绩3
- 单因素多元方差分析(One-way MANOVA) 性别 身高 成绩
2.方差分析的结果
- p>0.05,差异不显著
- p<0.05,差异显著
四、方差和协方差矩阵
- 协方差:Cov(X,Y)=Cov(Y,X)=E[(X−E[X])(Y-E[Y])]
- 方差:Var(X) = Cov(X,X)=E[(X−E[X])2]
五、方差齐性检验
- p>0.05,差异齐
- p<0.05,差异不齐
浙公网安备 33010602011771号