随笔分类 -  R练习

摘要:第一种 > mydata <- data.frame(x1 = c(2,2,6,4),x2 = c(3,4,2,8)) > mydata x1 x2 1 2 3 2 2 4 3 6 2 4 4 8 > mydata$sumx <- mydata$x1 + mydata$x2 > mydata x1 阅读全文
posted @ 2021-01-27 20:21 月光边境Eric 阅读(333) 评论(0) 推荐(0)
摘要:创建数据框,然后根据给定ID提取对应行的信息,特别是给定的ID比较多的时候,其实很简单! > patientID <- c("A","B","C","D") > age <- c(25,34,44,52) > DB <- c("T1","T2","T1","T1") > status <- c("P 阅读全文
posted @ 2021-01-26 15:40 月光边境Eric 阅读(1311) 评论(0) 推荐(0)
摘要:用逻辑值访问数据框或者别的,是循环访问嘛?特别是遇到那种下标出界的。。。 阅读全文
posted @ 2020-07-03 21:36 月光边境Eric 阅读(220) 评论(0) 推荐(0)
摘要:a = matrix(1:20, nrow = 4,dimnames = list(c("第1行", "第2行", "第3行", "第4行"), c("第1列", "第2列", "第3列", "第4列", "第5列"))) a a[c(1, 3), c(2, 4)] a[c(1, 3),] a[, 阅读全文
posted @ 2020-06-22 14:55 月光边境Eric 阅读(150) 评论(0) 推荐(0)
摘要:##这个可以跑if(T){ gset <- getGEO("GSE42872",destdir = ".",AnnotGPL = F,getGPL = F) save(gset,file ="GSE42872_eSet.Rdata") } ##也就说if(!file.exists(f))等同于if( 阅读全文
posted @ 2020-06-14 22:05 月光边境Eric 阅读(788) 评论(0) 推荐(0)
摘要:load(file = 'step1-output.Rdata') table(group_list) # 每次都要检测数据 dat[1:4,1:4] ## 下面是画PCA的必须操作,需要看说明书。 dat=t(dat)#画PCA图时要求是行名时样本名,列名时探针名,因此此时需要转换 dat=as. 阅读全文
posted @ 2020-06-10 11:33 月光边境Eric 阅读(303) 评论(0) 推荐(0)
摘要:f='GSE42872_eSet.Rdata' ##原文操作如此,是不是作者的习惯,先命名 # https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE42872 library(GEOquery) # 这个包需要注意两个配置,一般来说自动化的配置 阅读全文
posted @ 2020-05-31 22:45 月光边境Eric 阅读(2187) 评论(0) 推荐(0)
摘要:R中 %in% 的含义(from lzmcbody的回答): 每个元素都会被判断一次,返回逻辑值。 ls() 列出当前工作环境中所有变量--GEO数据step1用到的 > ls() [1] "a" "dat" "gpl" "group_list" "gset" "ids" [7] "pd" "pro 阅读全文
posted @ 2020-05-31 07:35 月光边境Eric 阅读(340) 评论(0) 推荐(0)
摘要:其实加载GEOquery包的时候就出现options()的这行代码 > library(GEOquery) 载入需要的程辑包:Biobase 载入需要的程辑包:BiocGenerics 载入需要的程辑包:parallel 载入程辑包:‘BiocGenerics’ The following obje 阅读全文
posted @ 2020-05-27 07:22 月光边境Eric 阅读(4724) 评论(0) 推荐(0)
摘要:所以打开读取GSE42872_series_matrix.txt.gz文件时,参数comment.char = "!"就表示!后面的注释文件不用读取。 > exprSet <- read.table("GSE42872_series_matrix.txt.gz",sep = "\t",fill = 阅读全文
posted @ 2020-05-26 18:43 月光边境Eric 阅读(404) 评论(0) 推荐(0)
摘要:p <- ggplot(data_m, aes(x=variable,y=ID)) + xlab("samples") + theme_bw() + theme(panel.grid.major = element_blank()) + theme(legend.key=element_blank( 阅读全文
posted @ 2020-05-25 08:59 月光边境Eric 阅读(135) 评论(0) 推荐(0)
摘要:> txt <- "ID;Zygote;2_cell;4_cell;8_cell + Gene_1;1;2;3;4 + Gene_2;6;5;4;5 + Gene_3;0.6;0.5;0.4;0.4" > txt [1] "ID;Zygote;2_cell;4_cell;8_cell\nGene_1 阅读全文
posted @ 2020-05-24 15:36 月光边境Eric 阅读(534) 评论(0) 推荐(0)
摘要:> data[1:3,] ##data[1:3,]与data[1:3]的不同,前者访问前三行,后者访问前三列,等同于data[,1:3] untrt_N61311 untrt_N052611 untrt_N080611 untrt_N061011 trt_N61311 FN1 245667.66 4 阅读全文
posted @ 2020-05-23 18:17 月光边境Eric 阅读(564) 评论(0) 推荐(0)
摘要:#加载R包 > library(psych)> library(reshape2)> library(ggplot2)> library(factoextra) ##提前把名为ehbio_salmon.DESeq2.normalized.symbol.txt的文件放在工作目录,以制表符分割的.txt 阅读全文
posted @ 2020-05-21 19:34 月光边境Eric 阅读(1107) 评论(0) 推荐(0)