数学建模-相关系数

皮尔逊相关系数和斯皮尔曼相关系数

相同点

都用来计算两个变量直接的线性关系。

不同点

1.连续数据，正态分布，线性关系，用pearson相关系数是最恰当，当然用spearman相关系数也可以，效率没有pearson相关系数高。
2.上述任一条件不满足，就用spearman相关系数，不能用pearson相关系数。
3.两个定序测量数据之间也用spearman相关系数，不能用pearson相关系数。

使用前置

皮尔逊相关系数

当两个变量的标准差都不为零时，相关系数才有定义，皮尔逊相关系数适用于：

(1)、两个变量之间是线性关系，都是连续数据。

(2)、两个变量的总体是正态分布，或接近正态的单峰分布。

(3)、两个变量的观测值是成对的，每对观测值之间相互独立。

斯皮尔逊相关系数

斯皮尔曼等级相关系数对数据条件的要求没有皮尔逊相关系数严格，只要两个变量的观测值是成对的等级评定资料，或者是由连续变量观测资料转化得到的等级资料，不论两个变量的总体分布形态、样本容量的大小如何，都可以用斯皮尔曼等级相关系数来进行研究。

肯德尔相关系数

与皮尔逊相关系数要求相同

实操案例

皮尔逊相关系数

#计算可以用data.corr()函数计算
pccs = df.corr()
print(pccs)

斯皮尔逊相关系数

pccs = df.corr("spearman")
print(pccs)

肯德尔相关系数

pccs=df.corr('kendall')
print(pccs)

posted @ 2022-06-07 16:10 玥瑕阅读(297) 评论(0) 收藏举报

刷新页面返回顶部

玥瑕

数学建模-相关系数

皮尔逊相关系数和斯皮尔曼相关系数

相同点

不同点

使用前置

皮尔逊相关系数

斯皮尔逊相关系数

肯德尔相关系数

实操案例

皮尔逊相关系数

斯皮尔逊相关系数

肯德尔相关系数

公告