【R语言小小屋】:第一周学习材料

1. 创建数据集

1.1 学习目标

  1. 了解和创建不同对象类型的数据并可以任意选取里面的元素,包括向量、矩阵、数组、数据框、因子和列表。

  1. 用R语言读取不同文件格式下的数据(最重要是CVS表格下的数据读取)

1.2 学习总结

1.2.1 创建数据

(1)向量:执行组合功能的函数c()可用来创建向量,单个向量中的数据必须拥有相同的类型或模式(数值型、字符型或逻辑型)。

a<-c(1,2,5,3,6,-2,4)

(2)矩阵:可通过函数matrix()创建矩阵,默认情况按列填充(byrow),格式为:

mymatrix<-matrix(vector,nrow=number_of_rows,ncol=number_of_columns,byrow=logical_value,dimnames=list(char_vector_rownames,char_vector_colnames))

(3)数组:数组可通过array函数创建,格式如下:

myarray<-array(vector,dimensions, dimnames)

(4)数据框:数据框可通过函数data.frame()创建,格式为:

mydata<-data.frame(col1,col2,col3,...)

(5)因子:函数factor()以一个整数向量的形式存储类别值,整数的取值范围是[1...k](其中k是名义型变量中唯一值的个数),同时一个由字符串(原始值)组成的内部向量将映射到这些整数上。

status<-factor(status,ordered=TRUE),要表示有序型变量,需要为函数factor()指定参数ordered=TRUE。
status<-factor(status,order=TRUE,levels=c("Poor","Improved","Excellent"))

(6)列表:使用函数list()创建列表

1.2.2 数据调用

(1)提取列:

data[1:2]  # 提取第一和第二列数据
data$id  # 索引data的id列

(2)提取行:

data[1,]  # 提取第一行样本

(3)提取指定位置元素

data[1,c(4,5)]  # 提取第一行,4和5列位置的元素

(3)列表元素:

data[[1]]  # 输出第一个成分

1.2.3 读取文件

(1)文本:使用read.table()从带分隔符的文本文件中导入数据;

(2)Excel:

read.csv(file,header=TRUE,sep=",",quote="\"",dec=".",fill=TRUE,comment.char="",...)  # csv文件
read.xlsx(file,n)  # n表示sheet号,xlsx文件

(3)R-Studio直接读取。

posted @ 2020-10-05 15:21  janck  阅读(173)  评论(0)    收藏  举报