相关系数
001、
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
研究变量之间线性相关程度的量。
a <- c(2, 4, 5, 9, 15) b <- c(6, 8, 10, 30, 40) cor(a, b) ## 研究变量a和b之间线性相关程度的量。

002、计算公式
简单讲:两个变量的协方差,再除以两个变量的方差的乘积的平方根。

程序验证:
a <- c(2, 4, 5, 9, 15) b <- c(6, 8, 10, 30, 40) cor(a, b) ## 直接计算相关系数 cov(a, b)/sqrt(var(a) * var(b)) ## 协方差除以两个变量的方差的乘积的平方根(标准差的乘积)

为什么协方差除以方差乘积的平方根就能表示两个变量之间的线性相关呢?

浙公网安备 33010602011771号