随笔分类 -  R语言

摘要:R表达式中常用的符号 残差(Residuals) 残差是真实值与预测值之间的差,五个分位的值越小模型越精确 系数项与截距项(Coefficients & Intercept)和P值指标 残差标准误(Residual standard error) 残差的标准误差,越小越好 R方判定系数 模型拟合的质 阅读全文
posted @ 2020-05-24 19:05 旭东东 阅读(10726) 评论(0) 推荐(1)
摘要:一、函数名称 1.函数命令与功能相关 2.可以是字母数字组合,但必须是字母开头 二、函数声明 利用function函数来声明 myfun < function(选项参数){ 函数体 } 设计计算偏度与峰度函数 偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数 阅读全文
posted @ 2020-05-23 10:33 旭东东 阅读(7126) 评论(0) 推荐(0)
摘要:基础绘图函数 一、plot() 函数 1.绘制散点图(两个数值向量) 2.绘制直方图(数值向量转化为因子) 3.绘制箱线图(一个因子向量,一个数值向量) 4.绘制散列图(一个数值向量,一个因子向量) 5.绘制脊柱图(两个因子向量) ggplot2包 ggplot2包集成在tidyverse包内,使用 阅读全文
posted @ 2020-05-23 09:24 旭东东 阅读(1258) 评论(0) 推荐(0)
摘要:一、独立性检验 根据频数信息判断两类因子彼此相关或相互独立的假设检验。 p value p value就是Probability的值,它是一个通过计算得到的概率值,也就是在原假设为真时, 得到最大的或者超出所得到的检验统计量值的概率。 一般将p值定位到0.05,当 p 0.05,接受原假设。 1.卡 阅读全文
posted @ 2020-05-21 17:14 旭东东 阅读(2199) 评论(0) 推荐(1)
摘要:一、数学统计函数 概率论是统计学的基础,R有许多用于处理概率,概率分布以及随机变量的函数。R对每一个概率分布都有一个简称,这个名称用于识别与分布相联系的函数。这部分涉及到很多统计学基础的理论知识,比如随机试验,样本空间,对立与互斥,随机事件与必然事件,概率密度,概率分布等。 1.四种基本函数 后缀 阅读全文
posted @ 2020-05-16 19:19 旭东东 阅读(3847) 评论(0) 推荐(1)
摘要:一、reshape2包 数据:氮肥和磷肥的用量对植物生长的影响 将上图数据做成txt文件 1.melt() 函数,将宽数据转换为长数据 转换NP数据集 2.dcast() 函数,将长数据转换为宽数据 二、tidyr包 处理整洁的数据: 每一列代表一个变量 每一行代表一个观测 一个观测值对应的一个变量 阅读全文
posted @ 2020-05-13 22:17 旭东东 阅读(937) 评论(0) 推荐(0)
摘要:一、基本转换 读取Excel数据 methods(is) 函数可以查看所有 is 的方法。用于判断数据 methods(as) 函数可以查看所有的转换方法。 二、对大数据集,取数据子集 1.读数据 两种写法 2.随机抽样函数 sample() 对向量抽样 对数据框抽样,取子集 3.删除特定数据 原数 阅读全文
posted @ 2020-05-11 23:29 旭东东 阅读(4218) 评论(0) 推荐(0)
摘要:一、手动键入数据 1.将纸质数据通过列的方式键入数据 2.用edit()方法输入数据 fix()方法键入数据关闭视图窗口可直接保存 二、读入文件 1.读入本地文件 read.table("文件名+后缀 或 文件的绝对路径") head() 函数 默认输出文件前六行,或者head(x,n=10) 默认 阅读全文
posted @ 2020-05-10 22:50 旭东东 阅读(2820) 评论(0) 推荐(0)
摘要:一、数据框 1.数据框是一种表格式的数据结构。数据框旨在模拟数据集,与其他统计软件SAS或者SPSS中的数据集的概念一致。数据集通常是由数据构成的一个矩形数组,行表示观测,列表是变量。 2.数据框实际上是一个列表。列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同的长度,所以数据框是矩形 阅读全文
posted @ 2020-03-17 16:51 旭东东 阅读(502) 评论(0) 推荐(0)
摘要:一、R语言的数据结构 1.R中的数据类型 数值型、字符串型、逻辑型、Boolean型、日期型 对象:object,它是可以赋值给变量的任何事物,包括常量、数据结构、函数、图形。对象都拥有某种模式,描述了此现象是如何储存的,以及某个类。 二、向量 1.向量,vector,是构成其他数据结构的基础。用于 阅读全文
posted @ 2020-03-14 23:32 旭东东 阅读(2184) 评论(0) 推荐(1)
摘要:一、RStudio 基本操作 getwd() 显示当前工作目录 setwd(dir = "地址") 修改当前工作目录 list.files() 或 dir() 查看当前工作目录下的文件 x install.packages("vcd") 导入 vcd 包 require(vcd) 载入该包 help 阅读全文
posted @ 2020-03-12 16:56 旭东东 阅读(1715) 评论(0) 推荐(1)