【R语言小小屋】:第一周学习材料
1. 创建数据集
1.1 学习目标
-
了解和创建不同对象类型的数据并可以任意选取里面的元素,包括向量、矩阵、数组、数据框、因子和列表。
-
用R语言读取不同文件格式下的数据(最重要是CVS表格下的数据读取)
1.2 学习总结
1.2.1 创建数据
(1)向量:执行组合功能的函数c()可用来创建向量,单个向量中的数据必须拥有相同的类型或模式(数值型、字符型或逻辑型)。
a<-c(1,2,5,3,6,-2,4)
(2)矩阵:可通过函数matrix()创建矩阵,默认情况按列填充(byrow),格式为:
mymatrix<-matrix(vector,nrow=number_of_rows,ncol=number_of_columns,byrow=logical_value,dimnames=list(char_vector_rownames,char_vector_colnames))
(3)数组:数组可通过array函数创建,格式如下:
myarray<-array(vector,dimensions, dimnames)
(4)数据框:数据框可通过函数data.frame()创建,格式为:
mydata<-data.frame(col1,col2,col3,...)
(5)因子:函数factor()以一个整数向量的形式存储类别值,整数的取值范围是[1...k](其中k是名义型变量中唯一值的个数),同时一个由字符串(原始值)组成的内部向量将映射到这些整数上。
status<-factor(status,ordered=TRUE),要表示有序型变量,需要为函数factor()指定参数ordered=TRUE。
status<-factor(status,order=TRUE,levels=c("Poor","Improved","Excellent"))
(6)列表:使用函数list()创建列表
1.2.2 数据调用
(1)提取列:
data[1:2] # 提取第一和第二列数据 data$id # 索引data的id列
(2)提取行:
data[1,] # 提取第一行样本
(3)提取指定位置元素
data[1,c(4,5)] # 提取第一行,4和5列位置的元素
(3)列表元素:
data[[1]] # 输出第一个成分
(1)文本:使用read.table()从带分隔符的文本文件中导入数据;
(2)Excel:
read.csv(file,header=TRUE,sep=",",quote="\"",dec=".",fill=TRUE,comment.char="",...) # csv文件 read.xlsx(file,n) # n表示sheet号,xlsx文件

浙公网安备 33010602011771号