Learning R笔记(一)
基本操作
- 帮助文档:?函数。演示:demo(函数)。参数列表:formals(函数),返回为成对列表pairlist。
- 用all.equal函数检查浮点数是否相等,容忍度默认为1.5e-8,如果相等返回TRUE,不相等返回差值。将其嵌入isTRUE函数则返回TRUE或者FALSE
- 使用<<-对全局变量赋值,或者使用assign函数,参数:“变量名”,值,如果全局赋值加上globalenv()参数。assign函数高级用法,需少用。
- 一般直接输入变量名就会输出结果,是为隐式调用print函数,从linux终端运行等需要加上print函数。
- 特殊数字:Inf,-Inf,NaN,NA。NaN(not a number),NA(not available)代表缺失值。is.finite函数检查特殊数字,正常数字返回TRUE,is.infinite函数相反。is.nan函数检查NaN,is.na函数检查NA,NaN。
- 三种逻辑:TRUE,FALSE,NA。any和all函数检查逻辑向量
- NULL是个特殊值,表示空的变量。NULL没有长度,用is.null来测试,把某个元素设置为NULL为删除,它因此采用list(NULL)来设置。
- head函数可显示前几行(默认为6行),head('',n)显示前n行。
- 工作目录:查看getwd(),更改setwd("path")。绝对路径的书写用/书写,windows下可以用\\,为了在各个系统下保持一致,尽量用/间隔
- 清除工作区的变量
#清除所有变量
rm(list=ls())
#清除单个变量
rm(data)
#清除多个变量
rm(list=c('data1','data2'))
- str函数能显示对象的结构,对数据框和嵌套列表很有用
> str(a) 'data.frame': 13 obs. of 3 variables: $ class: Factor w/ 7 levels "浜岀彮","涓夌彮",..: 7 6 5 4 3 1 1 1 1 2 ... $ name : Factor w/ 10 levels "","122","闄堜附鐏\xb5,115",..: 1 2 1 1 2 8 7 6 5 4 ... $ score: int NA NA NA NA NA 119 96 NA NA NA ...
- attributes函数能显示当前对象的所有属性列表
> attributes(a) $names [1] "class" "name" "score" $class [1] "data.frame" $row.names [1] 1 2 3 4 5 6 7 8 9 10 11 12 13
生成数据
- vector函数构建一个指定类型和长度的矢量,结果可以为0,FALSE,空字符串
> vector('numeric',5)#numeric(5)
[1] 0 0 0 0 0
> vector('logical',5)#logical(5)
[1] FALSE FALSE FALSE FALSE FALSE
> vector('character',5)#character(5)
[1] "" "" "" "" ""
> vector('list',2)
[[1]]
NULL
[[2]]
NULL
- summary数据汇总:最小值,1/4值,中指,3/4值,最大值。对数据框使用summary函数,相当于对每一列使用summary函数。
- letters包含a到z的小写值,LETTERS对应大写字母。
> letters[4] [1] "d" > letters[1:4] [1] "a" "b" "c" "d" > letters[] [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" [13] "m" "n" "o" "p" "q" "r" "s" "t" "u" "v" "w" "x" [25] "y" "z"
- month.name包含月份的名字,month.abb是月份的缩写。同letters用法一样
- 常用随机数函数:runif均匀分布,rnorm正态分布
#runif(n,min,max),默认产生0-1之间的随机数 > runif(3) [1] 0.3308360 0.5573855 0.9720616 > runif(3,min=1,max=9) [1] 8.946071 4.915268 5.763918 #rnom可指定参数mean:平均数,sd:标准差,默认mean=0,sd=1 > rnorm(5) [1] 0.55080064 -0.24792330 -0.09480838 0.65215600 [5] -0.96422061 > rnorm(5,mean=2,sd=0.3) [1] 2.373522 2.176204 1.948216 2.371155 2.070872
- sample函数为数据抽样,三个参数:数据,抽取个数,replace(TRUE是有放回的抽取,FALSE相反)
- seq函数产生序列:seq.int函数、seq_len函数、seq_along函数
#seq.int创建一个序列,与冒号有所不同,指定步长时也不一样 > 2:8 [1] 2 3 4 5 6 7 8 > seq.int(2:8) [1] 1 2 3 4 5 6 7 > seq.int(4,10,3)#指定步长3 [1] 4 7 10 #seq_len函数创建一个从1到它的输入值的序列,输入为0时创建一个空值 > seq_len(0) integer(0) > attributes(seq_len(0)) NULL #seq_along创建一个从1开始、长度为其输入值的序列 > seq_along(letters[1:10]) [1] 1 2 3 4 5 6 7 8 9 10
- rep函数:重复使用元素创建矢量
#整体重复三遍 > rep(1:5,3) [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 #每个元素重复三遍 > rep(1:5,each=3) [1] 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 #每个元素重复个数:1:5 > rep(1:5,times=1:5) [1] 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5 #重复矢量直到达到15的长度 > rep(1:5,length.out=15) [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
- 生成矩阵和数组array和matrix函数
#array创建数组,另个参数:值,维度dim
> array(1:12,dim=c(3,4))
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
#matrix创建矩阵,需要指定行数或者列数,默认输入的值按照列填充,或者指定参数byrow=TRUE按行填充
> matrix(1:12,nrow=3)
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
> matrix(1:12,nrow=3,byrow=TRUE)
[,1] [,2] [,3] [,4]
[1,] 1 2 3 4
[2,] 5 6 7 8
[3,] 9 10 11 12
向量,矩阵和数组
1.length函数
> length(1:5)
[1] 5
#缺失值NA也被计入长度
> length(c(TRUE,FALSE,NA))
[1] 3
#返回字符串的数目
> length(c('A','B','C'))
[1] 3
#若想返回每个字符串中字符的长度用nchar
> nchar(c('Axc','Bcdsfs','Cdsss'))
[1] 3 6 5
若用于矩阵和数组则返回所有维度的乘积
2.命名name
可以在创建数据时指定名称,也可以在事后命名。
#kiwi fruit用引号括起来了,因为其名称无效:有空格
#可以忽略其他元素命名
> c(apple=1,"kiwi fruit"=2,3)
apple kiwi fruit
1 2 3
> x <- 1:3
> names(x) <- c("apple","kiwi fruit",'')
> x
apple kiwi fruit
1 2 3
#names函数返回名称,若没有一个元素有名字则返回NULL
> names(x)
[1] "apple" "kiwi fruit" ""
> names(1:4)
NULL
#创建数组时命名,矩阵同样
> x <- array(1:6,dim=c(2,3),dimnames=list(c("one","tow"),c("ein","zwei","drei")))
> x
ein zwei drei
one 1 3 5
tow 2 4 6
#rownames、colnames和dimnames函数
> rownames(x)
[1] "one" "tow"
> colnames(x)
[1] "ein" "zwei" "drei"
> dimnames(x)
[[1]]
[1] "one" "tow"
[[2]]
[1] "ein" "zwei" "drei"
3.行、列和维度
dim函数对于数组和矩阵返回所有维度。nrow和ncol函数分别返回行和列。norm、ncol和dim用于向量时返回NULL。NROW和NCOL函数把向量看做列向量
4.合并矩阵
c函数拼接矩阵把他们转换成向量,cbind和rbind分别按col列和row行合并矩阵
> x <- matrix(1:12,nrow=3);x
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
> y <- matrix(13:24,nrow=3);y
[,1] [,2] [,3] [,4]
[1,] 13 16 19 22
[2,] 14 17 20 23
[3,] 15 18 21 24
> c(x,y)
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
[17] 17 18 19 20 21 22 23 24
> cbind(x,y)
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,] 1 4 7 10 13 16 19 22
[2,] 2 5 8 11 14 17 20 23
[3,] 3 6 9 12 15 18 21 24
> rbind(x,y)
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
[4,] 13 16 19 22
[5,] 14 17 20 23
[6,] 15 18 21 24
5.数学运算
除法/,转置t函数,点乘%*%和外乘%o%。solve矩阵求反
向量内乘
> 1:3%*%2:4
[,1]
[1,] 20
#向量外乘
> 1:3%o%2:4
[,1] [,2] [,3]
[1,] 2 3 4
[2,] 4 6 8
[3,] 6 9 12
> x<-matrix(1:6,nrow=2);x
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
> y<-matrix(1:6,nrow=3);y
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 3 6
#矩阵相乘
> x%*%y
[,1] [,2]
[1,] 22 49
[2,] 28 64
> x<-matrix(runif(9),nrow=3);x
[,1] [,2] [,3]
[1,] 0.6136448 0.05304645 0.7378249
[2,] 0.1922476 0.18177634 0.9545918
[3,] 0.9050422 0.65400112 0.2954112
#矩阵求逆
> solve(x)
[,1] [,2] [,3]
[1,] 1.6984882 -1.389698 0.2484943
[2,] -2.4026083 1.448092 1.3214365
[3,] 0.1154494 1.051693 -0.3016769
#矩阵转置
> t(x)
[,1] [,2] [,3]
[1,] 0.98387863 0.6292973 0.03753178
[2,] 0.09061386 0.5971163 0.10537436
[3,] 0.80727162 0.5403768 0.55767250
浙公网安备 33010602011771号