数学建模-相关系数
皮尔逊相关系数和斯皮尔曼相关系数
相同点
都用来计算两个变量直接的线性关系。
不同点
1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有pearson相关系数高。
2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。
3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。
使用前置
皮尔逊相关系数
当两个变量的标准差都不为零时,相关系数才有定义,皮尔逊相关系数适用于:
(1)、两个变量之间是线性关系,都是连续数据。
(2)、两个变量的总体是正态分布,或接近正态的单峰分布。
(3)、两个变量的观测值是成对的,每对观测值之间相互独立。
斯皮尔逊相关系数
斯皮尔曼等级相关系数对数据条件的要求没有皮尔逊相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关系数来进行研究。
肯德尔相关系数
与皮尔逊相关系数要求相同
实操案例
皮尔逊相关系数
#计算可以用data.corr()函数计算
pccs = df.corr()
print(pccs)
斯皮尔逊相关系数
pccs = df.corr("spearman")
print(pccs)
肯德尔相关系数
pccs=df.corr('kendall')
print(pccs)

浙公网安备 33010602011771号