R语言导入导出数据

导入数据

三种文件:逗号分隔文件(.csv文件)、制表符分隔文件(.tsv文件)、空格分隔文件(.txt文件)

读取一般文件:

read.table(file="文件名",header=”是否将第一行作为列名,第一行为列名为TRUE,否则为FALSE“,sep="分隔符,如逗号,  制表位\t  空格不用写sep",row.names="行名所在的列")

.csv:read.table(file,header=TRUE,sep=",",row.names="id")

   也可以使用read.csv(),此函数无需设置sep参数,方便一些

.tsv:read.table(file,header=TRUE,sep="\t",row.names="id")

.txt:read.table(file,header=TRUE,row.names="id")

 

读取以.gz结尾的压缩文件

一般在R中使用gzfile()方式读取压缩文件,也可以使用data.table包里的fread()函数,更为方便。

具体方法如下:

先安装并加载data.table包,使用fread()函数读取文件,参数和上面一样。

 

读取excel文件

需要先安装加载readxl包,该包有几个函数可用于读取excel文件,常用的有:read_excel(),read_xls,read_xlsx。各个函数的参数如下:

read_excel(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

read_xls(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

read_xlsx(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

sheet:excel文件中sheet参数,可以为一个字符串、sheet名称、整数,均表示sheet位置。默认为第一个sheet的数据。

range:sheet中单元格的范围,例如range=A1:Q17,也可以指定某一个sheet的位置,例如range="sheet1!A1:Q9"

col_names:第一行是否为列名,TRUE代表使用第一行作为列名,FALSE代表使用默认的名字,或使用字符串或字符串向量表示第一行的名称。

具体参数详情点击https://readxl.tidyverse.org/reference/read_excel.html

 

导出数据:

write.table()

使用readxl包来读取excel文件

posted @ 2022-01-05 11:23  宇宙有星星  阅读(982)  评论(0编辑  收藏  举报