基础:
前提:
1.数据是连续的
年龄、体重、血压、温度
2.检验数据是否正太分布
符合正态分布-->皮尔逊
不符合--->斯皮尔曼
疑问:
1. 多变量进行相关性分析,是不是每个参数都是连续型的?
皮尔逊是,斯皮尔曼不是
2.多变量进行相关性分析,是不是都要单独判断每个变量是否符合正太分布?
如果每个变量都是正态分布的,那么使用皮尔逊相关系数是合适的。但如果一个或多个变量不遵循正态分布,你可能需要使用非参数方法,如斯皮尔曼等
操作
谁和谁之间有相关性,就把谁放在右边

结果:

看对角线的上面或者下面,看一个就行
判断:
先看Sig(显著性也叫P值),p<0.05,说明二者是有相关性的
再看相关系数,.469**,说明相关性是中等吧,
但是不能判断因果关系,A的增加影响的B。还是B增加影响了A
浙公网安备 33010602011771号