数学建模-相关系数

皮尔逊相关系数和斯皮尔曼相关系数

相同点

都用来计算两个变量直接的线性关系。

不同点

1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有pearson相关系数高。
2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。
3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。

使用前置

皮尔逊相关系数

当两个变量的标准差都不为零时,相关系数才有定义,皮尔逊相关系数适用于:

(1)、两个变量之间是线性关系,都是连续数据。

(2)、两个变量的总体是正态分布,或接近正态的单峰分布。

(3)、两个变量的观测值是成对的,每对观测值之间相互独立。

斯皮尔逊相关系数

斯皮尔曼等级相关系数对数据条件的要求没有皮尔逊相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关系数来进行研究。

肯德尔相关系数

与皮尔逊相关系数要求相同

实操案例

皮尔逊相关系数

#计算可以用data.corr()函数计算
pccs = df.corr()
print(pccs)

斯皮尔逊相关系数

pccs = df.corr("spearman")
print(pccs)

肯德尔相关系数

pccs=df.corr('kendall')
print(pccs)
posted @ 2022-06-07 16:10  玥瑕  阅读(277)  评论(0)    收藏  举报