R语言与数据分析练习:计算特征间的Pearson相似系数

R语言与数据分析练习:计算特征间的Pearson相似系数

Pearson相关系数

Pearson相关系数(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。

Pearson相关系数简介

如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。

其计算公式为:

在这里插入图片描述

题目:

计算表中特征间的Pearson相似系数

数据如下:

在这里插入图片描述

实现代码:

# 切换当前目录
setwd("D:/bigdata/R语言与数据分析/data04")

# 读取数据
datafile <- read.csv("./data.csv")

# 计算pearson相关系数 保留2位小数
dataPearson <- round(cor(datafile,method = c("pearson")) , 2)

# 将数据写入新建的csv文件中 保存
write.csv(dataPearson,"./dataPearson.csv")

运行结果:

在这里插入图片描述

posted on 2021-03-23 20:25  JohnZhuang  阅读(406)  评论(0)    收藏  举报

导航