随笔分类 -  R

摘要:http://zhan.renren.com/zxccshkbx?gid=3602888498030523562&from=post&checked=true 阅读全文
posted @ 2014-03-20 15:53 蒋蒋 阅读(492) 评论(0) 推荐(0)
摘要:cat("TITLE extra line", "2 3 5 7", "11 13 17", file="ex.data", sep="\n") 阅读全文
posted @ 2013-11-13 15:02 蒋蒋 阅读(546) 评论(0) 推荐(0)
摘要:gsub("([ab])", "\\1_\\1_", "abc and ABC")[1] "a_a_b_b_c a_a_nd ABC"分析:在后边查找a或b,查找到对每个字母后边加_ 阅读全文
posted @ 2013-11-13 14:47 蒋蒋 阅读(335) 评论(0) 推荐(0)
摘要:语法问题,类似于for函数使用时必须把"{"放在当前行,而不可以独占一行。R的特色。具体你的这个问题可以尝试x 0){print("abc")} else {print("def")}要注意的是:if后的“{“一定要在条件同一行,最后一个"}"在单独一行。x 0){print("abc")}else {print("def")}上边的代码会出错。 阅读全文
posted @ 2013-11-13 13:16 蒋蒋 阅读(3902) 评论(0) 推荐(0)
摘要:R 字符串处理1 #字符串连接:paste() #paste(..., sep = " ", collapse = NULL)> paste("a","b","c",sep=">")[1] "a>b>c"2 字符串分割:strsplit() #strsplit(x, split, extended = TRUE, fixed = FALSE, perl = FALSE)> strsplit("a>b>c",&quo 阅读全文
posted @ 2013-03-18 18:23 蒋蒋 阅读(7214) 评论(2) 推荐(1)
摘要:批量读取本地文件在批量读取文档时一般先将其存放在某一个目录下。先用dir()函数获取目录中的文件名,然后用paste()将路径合成,最后用循环或向量化方法处理文档。例如:doc.names <- dir("path") doc.path <- sapply(doc.names,function(names) paste(path,names,sep='/')) doc <- sapply(doc.path, function(doc) readLines(doc)) 阅读全文
posted @ 2013-03-18 17:04 蒋蒋 阅读(2008) 评论(0) 推荐(0)
摘要:R graph:如何自定义坐标轴刻度标示(tick label)这里要说的不是轴标。轴标用xlab或者ylab赋值。我要说的是轴上的刻度标志(tickmark)相对应的那些标识(labels)如何自定义。首先要在plot里面压制自动生成坐标轴;因为你想自定义,当然需要压制自动生成的了。例如用xaxt="n"就压制了x轴刻度标志以及刻度标识。其次使用axis()命令自定义刻度标识。重要参数有四个:side(在哪个轴上建立刻度标识),at(建立哪几个标识),tck(刻度标志tickmark长度,可以是负值),labels(列出要自定义的标识文字)。例如我想在X轴上建立自定义标识 阅读全文
posted @ 2013-03-18 14:20 蒋蒋 阅读(13537) 评论(0) 推荐(0)
摘要:> a <- matrix( c(5, 3, 4, 2, 2, 6, 8, 9, 7, 6, 12, 10, 11, 14, 13), 5)> a [,1] [,2] [,3][1,] 5 6 12[2,] 3 8 10[3,] 4 9 11[4,] 2 7 14[5,] 2 6 13按第一列升序:> a[order(a[,1]),] [,1] [,2] [,3][1,] 2 7 14[2,] 2 6 13[3,] 3 8 10[4,] 4 ... 阅读全文
posted @ 2013-03-18 13:24 蒋蒋 阅读(25136) 评论(0) 推荐(1)
摘要:Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由标准正态分布的分位数为横坐标,样本值为纵 坐标的散点图. 要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值. 用QQ图还可获得样本偏度和峰度的粗略信息. Q-Q图可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。P-P图和Q-Q图的用途完全相同,只是检验方法存在差异 由于P-P图和Q-Q图的用途完全相同,只是检验方法存在差异。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似... 阅读全文
posted @ 2013-01-08 17:05 蒋蒋 阅读(1354) 评论(0) 推荐(0)
摘要:摘自:吴喜之:《非参数统计》(第二版),中国统计出版社,2006年10月:P164-1651、ks.test() 例如零假设为N(15,0.2),则ks.test(x,"pnorm",15,0.2)。如果不是正态分布,还可以选"pexp", "pgamma"等。2、shapiro.test() 可以进行关于正态分布的Shapiro-Wilk检验。3、nortest包 lillie.test()可以实行更精确的Kolmogorov-Smirnov检验。 ad.test()进行Anderson-Darling正态性检验。 cvm.test 阅读全文
posted @ 2013-01-08 13:07 蒋蒋 阅读(22380) 评论(0) 推荐(0)
摘要:例:d <- data.frame(name=c("zhao","qian","sun","li"),weight=c(62,58,79,60),height=c(178,169,180,173))x <- d$namey1 <- d$weighty2 <- d$height用包plotrix#png("2y_1.png")library(plotrix)xpos <- 1:4twoord.plot(xpos,y1,xpos,y2,xlim=c(0,5),lylim 阅读全文
posted @ 2013-01-07 10:51 蒋蒋 阅读(924) 评论(0) 推荐(0)
摘要:slices <- c(10, 12, 4, 16, 8)lbls <- c("US", "UK", "Australia", "Germany", "France")pct <- round(slices/sum(slices)*100)lbls <- paste(lbls, pct) # add percents to labelslbls <- paste(lbls,"%",sep="") # ad % to label 阅读全文
posted @ 2013-01-07 10:51 蒋蒋 阅读(1787) 评论(0) 推荐(0)
摘要:> library(VennDiagram)载入需要的程辑包:grid> dg1<-read.table("clipboard",header=F)> dg2<-read.table("clipboard",header=F)> venn.diagram(list(dg_1_nip=dg1[,1],dg_2_nip=dg2[,1]),fill=c("red","blue"),"rice.tiff") 阅读全文
posted @ 2012-12-24 15:41 蒋蒋 阅读(310) 评论(0) 推荐(0)
摘要:1) 利用剪贴板一种简单不过的方法是打开Excel中电子表格, 选中需要的数据区域, 再复制到剪贴板中(使用CTRL+C). 然后在R中键入命令> mydata <- read.delim("clipboard")2) 使用程序包RODBC.要得到文件"c:\data\body.xls"中工作表1(sheet1)中的数据,设为Sex Weight HeightM 65 168M 70 172F 54 156F 58 163可以使用命令> library(RODBC)> z <- odbcConnectExcel(" 阅读全文
posted @ 2012-12-17 16:48 蒋蒋 阅读(2048) 评论(0) 推荐(0)
摘要:http://www.dataguru.cn/article-1766-1.html 阅读全文
posted @ 2012-12-14 12:30 蒋蒋 阅读(238) 评论(0) 推荐(0)
摘要:Combine R Objects by Rows or ColumnsPackage:baseTake a sequence of vector, matrix or data frames arguments and combine by columns or rows, respectively. These are generic functions with methods for other R classes.Usagecbind(..., deparse.level = 1)rbind(..., deparse.level = 1)> m<-cbind(1,1:7) 阅读全文
posted @ 2012-12-14 12:29 蒋蒋 阅读(2129) 评论(0) 推荐(0)
摘要:mean(trim)去掉最大值和最小值后的平均数(Trim mean)> s<-c(.25, 0.4, 1.00,2.00,3.00,4.00,5.00,8.00,12.00,50.00) > s [1] 0.25 0.40 1.00 2.00 3.00 4.00 5.00 8.00 12.00 50.00> mean(s,trim=1/10) [1] 4.425#####也就是去除s中的最大值最小值等价于> s<-c(.25,1.00,2.00,3.00,4.00,5.00,8.00,12.00) > mean(s) [1] 4.40625##### 阅读全文
posted @ 2012-12-14 12:26 蒋蒋 阅读(494) 评论(0) 推荐(0)
摘要:sort函数是对数列本身进行排序,(升)order函数是对数列元素排序后在原数列中的位置进行确定。> j=scan()1: 22: 43: 54: 65: 16: 3> sort(j)[1] 1 2 3 4 5 6> order(j)[1] 5 1 6 2 3 4关系:sort(j)=j [order(j)] ##右边意义:对j中的位置进行检索,返回真值 阅读全文
posted @ 2012-12-13 19:58 蒋蒋 阅读(2008) 评论(0) 推荐(0)
摘要:Adjust P-values for Multiple ComparisonsDescriptionGiven a set of p-values, returns p-values adjusted using one of several methods.Usagep.adjust(p, method = p.adjust.methods, n = length(p))p.adjust.methods# c("holm", "hochberg", "hommel", "bonferroni", "B 阅读全文
posted @ 2012-12-13 19:53 蒋蒋 阅读(1482) 评论(0) 推荐(0)