随笔分类 - R语言
R语言学习笔记
摘要:1 自助法 所谓自助法,即从初始样本重复随机替换抽样,生成一个或一系列待检验统计量的经验分布。 无需假设一个特定的理论分布,便可生成统计量的置信区间,并能检验统计假设。倘若你假设均值的样本分布不是正态分布,该怎么办呢?可使用自助法。 (1) 从样本中随机选择10个观测,抽样后再放回。有些观测可能会被
阅读全文
摘要:1 马赛克图 我们已经学习了许多可视化定量或连续型变量间关系的方法。但如果变量是类别型的呢?若只观察单个类别型变量,可以使用柱状图或者饼图;但若有两个以上的类别型变量,该怎么办呢?一种办法是绘制马赛克图(mosaic plot)。在马赛克图中,嵌套矩形面积正比于单元格频率,其中该频率即多维列联表中的
阅读全文
摘要:1 相关图 相关系数矩阵是多元统计分析的一个基本方面。哪些被考察的变量与其他变量相关性很强, 而哪些并不强?相关变量是否以某种特定的方式聚集在一起?相关图作为一种相对现代的方法,可以通过对相关系数矩阵的可视化来回答这些问题。 1.1 例1:以mtcars数据框中的变量相关性为例,它含有11个变量,对
阅读全文
摘要:折线图 如果将散点图上的点从左往右连接起来,就会得到一个折线图,以基础安装中的Orange数据集为例,它包含五种橘树的树龄和年轮数据,现要考察第一种橘树的生长情况: opar <- par(no.readonly=TRUE) #设置初始化参数 par(mfrow=c(1,2)) #把画布分成2部分
阅读全文
摘要:1 散点图 散点图可用来描述两个连续型变量间的关系。R中创建散点图的基础函数是plot(x, y),其中,x和y是数值型向量,代表着图形中的(x, y)点。下面展示了一个例子。 attach(mtcars) plot(wt, mpg, main="Basic Scatter plot of MPG
阅读全文
摘要:功效分析 功效分析针对的是假设检验,比如:比例检验、t检验、卡方检验、平衡单因素ANOVA、相关性分析,以及线性模型分析等。 1 用pwr包做功效分析 问题描述:假设想评价使用手机对驾驶员反应时间的影响,则零假设为H0:U1-U2=0,其中U1是驾驶员使用手机时的反应时间均值,U2是驾驶员不使用手机
阅读全文
摘要:1 绘图 1.1 条形图 barplot() (针对离散型变量) library(vcd) dat<-Arthritis counts<-table(dat$Improved) #table求数据框中间取值的频数 (1)简单条形图(一个变量,一维) barplot(counts,main="Simp
阅读全文
摘要:1 控制流 1.1 重复和循环 方式一:for() for (i in 1:10) print("hello") 方式二:while() while(i>0){ print("hello") i<-i-1 } 1.2 条件执行 方式一:if-else结构 if (is.character(roste
阅读全文
摘要:1 数据处理案例 (1)数据输入 student<-c("John Davis","Angla williams","Bullwink Moose", "David Jones","Janice Markhammer","cheryl Cushing", "Revenen Ytzrhak","Gre
阅读全文
摘要:1 高级数据管理 1.1 数值和字符处理函数 (1)数学函数 绝对值函数:abs() 取整函数:floor(),取不大于这个数的整数 取对数函数:log(),log10() 四舍五入函数:round() (2)统计函数 均值函数:mean() 方差函数:var() 标准差函数:sd() 分位数函数:
阅读全文
摘要:1 基本数据管理 1.1一个示例 (1)定义向量,造数据框 manage<-c(1,2,3,4,5) date<-c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09") country<-c("US","US","UK","UK","UK") g
阅读全文
摘要:1 图形的图例 输入数据: dose<-c(20,30,40,50,60) drugA<-c(16,20,27,40,60) drugB<-c(15,18,25,31,41) par(lwd=2,cex=1,font.lab=2) #全局图形设置,lwd是设置线条的宽度(粗细),cex设置字体的大小
阅读全文
摘要:1 图形标题的修改 输入数据: dose<-c(20,30,40,50,60) drugA<-c(16,20,27,40,60) drugB<-c(15,18,25,31,41) plot(dose,drugA,type="b",col="red",lty=2,pch=2,lwd=2,main="C
阅读全文
摘要:1 使用图形 1.1 交互式绘图 使用的是内置数据集:mtcars 画出散点图:plot(mtcars$mpg,mtcars$wt) 给图形加标题:title("车辆耗油与重量之间的关系") 加回归线:abline(lm(mpg~wt,data=mtcars)) (为什么我的没有回归线呢??) 1.
阅读全文
摘要:一、定义:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类 二、距离:欧几里得度量(euclidean metric)也称欧氏距离 绝对值距离(manhattan) Lance距离(canberra) 定性变量距离(binary) 闵可夫斯基距离(minkowski) 三、使用函数
阅读全文
摘要:错误一:选择了未定义的列(Undefined columns are selected) 改正方法:把目标列转换成因子类型(as.factor) 使用代码如下: 或者: 错误二:太多(36119)的重量(too many (36119) weights) 改正方法:修改参数 MaxNWts 大于上述
阅读全文
摘要:1 数据的输入 1.1 键盘输入 首先新建一张空表: dat<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0)) 使用edit修改表,弹出数据编辑器: dat<-edit(dat) 填入数据之后,查看表: dat 12.
阅读全文
摘要:1 向量 1.1 定义向量 向量使用c来赋值,向量中不能混合不同类型的数据 x<-c(2,3,7,6,8) # 数值型num y<-("one","two","three") #字符型chr z<-c(TRUE,TRUE,FALSE) #逻辑型logi 查看变量的类型:class(x) 1.2 访问
阅读全文
摘要:一、R的安装 1.进入R的官网,https://cran.r-project.org/ 2.下载对应的版 Downloaad R for Windows > base > Download R 3.0.5 3.下载完成之后就可以进行安装了,点击下一步就可以了,但是R默认32位和64位是在一起的,安装
阅读全文