摘要: 最近看到好几次群里有人问xlwt、wlrd的问题,怎么说呢,如果是office2007刚出来,大家用xlsx文件用不习惯,还可以理解,这都10年过去了喂,就算没有进化到office2016,还在用office2003的有点说不过去吧。有人可以用xlsx保存为xls啊!——故意多做几步操作,目的呢?为 阅读全文
posted @ 2020-06-10 20:39 皓翔 阅读(757) 评论(0) 推荐(0) 编辑
摘要: 在R语言进行数据分析时,经常需要找不同组间的相同和不同,以下几个函数可供使用 交集intersect两个向量的交集,集合可以是数字、字符串等 # 两个数值向量取交集intersect(x=1:4, y = 2:6)# [1] 2 3 4 # 两个字符向量取交集intersect(x=letters[ 阅读全文
posted @ 2020-06-10 20:18 皓翔 阅读(1456) 评论(0) 推荐(0) 编辑
摘要: 一个文件在上,一个文件在下cat file1 file2 > file3一个文件在左,一个文件在右paste file1 file2 > file3 阅读全文
posted @ 2020-04-03 04:51 皓翔 阅读(8573) 评论(0) 推荐(0) 编辑
摘要: shell中的cut和paste函数,可以从多个文本中提取特定的列,然后合并成为一个文件,方便下游分析中用R语言read.table()读取,进行分析作图。 cut -d 分隔符 -f 列索引 cut -d '.' -f 2-5,8 file.txt #将文件file.txt以分隔符.进行分割,并取 阅读全文
posted @ 2019-11-12 23:10 皓翔 阅读(781) 评论(0) 推荐(0) 编辑
摘要: library(reshape2) x<-data.frame(id=1:6, name=c("wang","zhang","li","chen","zhao","song"), shuxue=c(89,85,68,79,96,53), yuwen=c(77,68,86,87,92,63)) #根据 阅读全文
posted @ 2019-11-07 00:23 皓翔 阅读(876) 评论(0) 推荐(0) 编辑
摘要: 我们在对基因进行GSEA分析的时候,input要求有两列,第一列是基因ID或者基因name,中间是制表符分隔,第二列需要是log2FD排序或者log2FD*(-log10pvalue),并进行排序,这样分布在两端的基因是差异最显著的基因。根据经验,第二种算法得出来的基因通路富集计算结果更好。 阅读全文
posted @ 2019-10-28 22:53 皓翔 阅读(523) 评论(0) 推荐(0) 编辑
摘要: 浏览器访问网站报错的解决方案 Your Connection is not private NET::ERR_CERT_COMMON_NAME_INVALID 阅读全文
posted @ 2019-10-17 02:53 皓翔 阅读(6033) 评论(0) 推荐(0) 编辑
摘要: complete.cases() 可以去除data frame中的NA行,方便后续对文本的分析和处理,具体用法如下, #过滤第5列中有NA的行dat_rm_NA=dat[complete.cases(dat[,5]),] #过滤第1到5列中有NA的行dat_rm_NA=dat[complete.ca 阅读全文
posted @ 2019-10-10 01:22 皓翔 阅读(7208) 评论(0) 推荐(0) 编辑
摘要: 从今天开始,会写一些关于计算机程序和算法的一些总结,编程主要是关于python,R语言和shell相关的内容 阅读全文
posted @ 2019-10-10 00:31 皓翔 阅读(195) 评论(0) 推荐(0) 编辑