数据分析--方差分析

一、检查因变量是否符合正态分布

1.非参数检验法

  • 常见的正态性检验有Kolmogorov-Smirnov检验(即柯尔莫戈洛夫-斯米诺夫检验,简称K-S检验)和Shapiro-Wilk检验(即夏皮-威尔克检验,简称S-W检验)
  • K-S检验适用于大样本数据,S-W检验适用于小样本数据(<50)
  • 当检验结果的p值小于0.05,则认为数据不满足正态性。
  • 多分类(n)因素,p>0.05/n,成正态分布

2.图形法

  • 直方图
  • 正态Q-Q图 (观察Q-Q图上的点能否分布在一条直线上,分布在一条直线上则说明近似或服从正态分布)
  • 正态P-P图 (观察P-P图上的点能否分布在理论分布的直线上,若基本分布在直线上则说明近似或服从正态分布)

引用链接:https://zhuanlan.zhihu.com/p/442790720

二、检查是否存在单因素离群值

1.离群值的处理

  •  保留离群值:

           1)对因变量进行数据转换

            2)将离群值纳入分析,并坚信其对结果不会产生实质影响

  • 剔除离群值.

三、方差分析

1.方差分析的种类

  • 单因素方差分析(One-Way ANOVA) 例如:性别 语文成绩
  • 双因素方差分析(Two-way ANOVA)   例如:性别  身高 语文成绩 
  • 三因素方差分析(Three-way ANOVA) 例如:性别  身高 家庭收入 语文成绩 
  • 单因素重复测量方差分析 例如:性别 语文成绩1 语文成绩2 语文成绩3
  • 两因素重复测量方差分析  例如:性别  身高 语文成绩1 语文成绩2 语文成绩3 
  • 三因素重复测量方差分析  例如:性别  身高 家庭收入 语文成绩1 语文成绩2 语文成绩3 
  • 单因素多元方差分析(One-way MANOVA) 性别 身高 成绩

2.方差分析的结果

  • p>0.05,差异不显著
  • p<0.05,差异显著

四、方差和协方差矩阵

  • 协方差:Cov(X,Y)=Cov(Y,X)=E[(XE[X])(Y-E[Y])]
  • 方差:Var(X) = Cov(X,X)=E[(XE[X])2] 

五、方差齐性检验

  • p>0.05,差异齐
  • p<0.05,差异不齐
posted @ 2022-09-20 16:01  五百块  阅读(510)  评论(0)    收藏  举报