由于自己总是记不清数据的导出是怎么搞的,所以特意写了这么一篇记载一下,不用到时候死命地找,却又找不到。主要参照《R语言》刘鹏 张燕总主编,清华大学出版社。
数据导入
键盘输入数据
函数edit()会自动调用一个允许手动输入数据的文本编辑器。
导入文本文件
使用read.table()从带分隔符的文本文件中导入数据,并保存为一个数据框。语法如下:
mydataframe <- read.table(file, header=FALSE, sep='delimiter', row.names='***')
| file | 文件名(包在''内,或使用一个字符型变量),在windows下不存在\,必须用/替换) |
| header | 一个逻辑值(FALESE OR TRUE),来反应这个文件的第一行是否包含变量名 |
| sep | 文件中的字段分离符,例如对用制表符分隔的文件使用sep='\t' |
| quote | 指定用于包围字符型数据的字符 |
| dec | 用来表示小数点的字符 |
| row.names | 保存着行名的向量,或文件中一个变量的序号或名字,缺省时行号取为1,2,3,... |
| col.names | 指定列名的字符型向量,缺省时是,V1,V2,V3,... |
| as.is | 控制是否将字符型变量转化为因子型变量(如果值为FALSE),或者仍将其保留为字符型(TRUE) |
| na.strings | 代表缺失数据的值(转化为NA) |
| nrows | 可以读取的最大行数(忽略负值) |
| skip | 在读取数据前跳过的行数 |
导入Excel数据
Excel是我们平时录取数据使用最多的软件,方法有2,我觉得方法2更好。
# 方法1
library(RODBC)
channel <- obdcConnectExcel("myfile.xls")
mydataframe <- sqlFetch(channel,"mysheet")
obdcClose(channel)
#方法2
library(xlsx)
workbook <- "c:/myworkbook.xlsx"
mydataframe <- read.xlsx(workbook, 1)
导入数据库文件
平时用的不多。
# 数据库账号密码
library(RODBC)
myconn <- odbcConnect("mydsn", uid="Rob", pwd="aardvark")
crimedat <- sqlFetch(myconn, Crime)
pundat <- sqlQuery(myconn, "select * from Punishment")
close(myconn)
数据导出
导出文本文件
把给定数据框保存为文本文件,以空格分隔数据列,不含行号,不含列名,字符串不带引号。
age <- c(22, 23)
name <- c('ken', 'john')
f <- data.frame(age, name)
write.table(f, file='f.csv', row.names= FALSE,
col.names= FALSE, quote= FALSE)
保存图片
一般较为常用的为:PNG,JPEG, PDF 格式
#保存为PNG格式: png(file="myplot.png", bg="transparent") #保存为JPEG格式: jpeg(file="myplot.jpeg") #保存为PDF格式: pdf(file="myplot.pdf")
本人的文档都是自我记录,以便日后查看。
浙公网安备 33010602011771号