11.10tips+R语言7章+土培数据分析

ctrl+alt+delete:启动任务管理器，结束软件进程。

vars<-c("mpg","hp","wt")

head(mtcars[vars])

描述性统计分析

summary()函数提供了最小值、最大值、四分位数和数值型变量的均值，以及因子向量和逻

辑型向量的频数统计。

summary(mtcars[vars])

mystats<-function(x,na.omit=FALSE){if(na.omit)

x<-x[!is.na(x)]

m<-mean(x)

n<-length(x)

s<-sd(x)

skew<-sum((x-m)^3/s^3)/n

kurt<-sum((x-m)^4/s^4)/n-3

return(c(n=n,mean=m,stdev=s,skew=skew,kurtosis=kurt))}

sapply(mtcars[vars],mystats)

通过Hmisc包中的describe()函数计算描述性统计量

library(Hmisc)

describe(mtcars[vars])

通过pastecs包中的stat.desc()函数计算描述性统计量

library(pastecs)

stat.desc(mtcars[vars])

describe:它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。

library(psych)

describe(mtcars[vars])

使用aggregate()分组获取描述性统计量

aggregate(mtcars[vars],by=list(am=mtcars$am),mean)

aggregate(mtcars[vars],by=list(am=mtcars$am),sd)

使用by（）分组计算描述性统计量

dstats<-function(x)(c(mean=mean(x),sd=sd(x)))

by(mtcars[vars],mtcars$am,dstats)

library(doBy)

summaryBy(mpg+hp+wt~am,data=mtcars,FUN=mystats)

R提供了多种检验类别型变量独立性的方法。三种检验分别为卡方独立性检验、Fisher精确检验和Cochran-Mantel–Haenszel检验

R可以计算多种相关系数，包括Pearson相关系数、Spearman相关系数、Kendall相关系数、偏相关系数、多分格（polychoric）相关系数和多系列（polyserial）相关系数。

Pearson积差相关系数衡量了两个定量变量之间的线性相关程度。Spearman等级相关系数则衡量分级定序变量之间的相关程度。Kendall’s Tau相关系数也是一种非参数的等级相关度量。

cor()函数可以计算这三种相关系数，而cov()函数可用来计算协方差。两个函数的参数有很多，其中与相关系数的计算有关的参数可以简化为：

cor(x,use=,method=)

states<-state.x77[,1:6]

cov(states)

cor(states)

cor(states,method="spearman")

a<-read.csv("土培11.csv")

summary(a)

library(Hmisc)

describe(a)

library(pastecs)

stat.desc(a)

11.10tips+R语言7章+土培数据分析

公告