随笔分类 - R语言
摘要:什么是R语言编程? R语言是一种用于统计分析和为此目的创建图形的编程语言。不是数据类型,它具有用于计算的数据对象。它用于数据挖掘,回归分析,概率估计等领域,使用其中可用的许多软件包。R语言中的不同数据对象是什么?它们是R语言中的6个数据对象。它们是向量,列表,数组,矩阵,数据框和表。什么使R语言中的
阅读全文
摘要:回归分析是一个广泛使用的统计工具,用于建立两个变量之间的关系模型。 这些变量之一称为预测变量,其值通过实验收集。 另一个变量称为响应变量,其值来自预测变量。 在线性回归中,这两个变量通过一个等式相关联,其中这两个变量的指数(幂)是1。数学上,当绘制为图形时,线性关系表示直线。任何变量的指数不等于1的
阅读全文
摘要:dnorm,pnorm,qnorm,rnorm的表达式: 其中x和q是由数值型变量构成的向量,p是由概率构成的向量,n是随机产生的个数 mean是要计算正态分布的均值,缺省值为0,sd是计算正态分布的标准差, 缺省值为1 其中dnorm返回值是正态分布的概率密度函数 其中pnorm返回的是正态分布的
阅读全文
摘要:直方图: 核密度函数: 练习题目1: 绘制出15位同学体重的直方图和核密度估计图,并与正态分布的概率密度函数作对比 代码如下: > w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5,+ 66.6, 64.0, 57.0, 69.0, 56.9
阅读全文
摘要:与直方图相比,茎叶图更能细致的看出数据分布情况! 代码: > x<-c(25, 45, 50, 54, 55, 61, 64, 68, 72, 75, 75,+ 78, 79, 81, 83, 84, 84, 84, 85, 86, 86, 86,+ 87, 89, 89, 89, 90, 91,
阅读全文
摘要:无论是直方图还是经验分布图,要从比较上鉴别样本是否处近似于某种类型的分布是困难的 QQ图可以帮我们鉴别样本的分布是否近似于某种类型的分布 R语言,代码如下: > qqnorm(w);qqline(w)> w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7,
阅读全文
摘要:箱形图是数据集中数据分布情况的衡量标准。它将数据集分为三个四分位数。盒形图表示数据集中的最小值,最大值,中值,第一四分位数和第四四分位数。 通过为每个数据集绘制箱形图, 比较数据集中的数据分布也很有用。 R中的盒形图通过使用boxplot()函数来创建。 基本公式为: > A <- c(79.98,
阅读全文