人类基因组在三大基因数据库中的不同版本

摘要: 在数据分析中,经常需要下载物种的参考基因组序列,这时有很多数据库可以选择,比如NCBI, Ensembl, UCSC这三个通用的数据库,或者该物种特有的数据库, 比如模式生物拟南芥等有专门的数据库。 在NCBI, Ensembl 和 UCSC中对于同一个物种,编号不统一,在这里整理一下它们之间的关系 阅读全文
posted @ 2016-02-14 17:49 庐州月光 阅读(10320) 评论(0) 推荐(1)

circso 对数据进行可视化

摘要: circos可以用来绘制圈图,能够对染色体上的数据进行可视化,首先需要一个染色体的文件 染色体的文件如下,每列之间空格分隔 chr - chr1 1 0 227556264 chr1 chr - chr2 2 0 192460366 chr2 chr - chr3 3 0 192294377 chr 阅读全文
posted @ 2016-01-29 15:50 庐州月光 阅读(1116) 评论(0) 推荐(0)

perl 面向对象编程

摘要: 今天看到一个perl面向对象编程的例子,充分体现了如何对数据进行封装;自己模仿写一个读取配置文件的例子, 配置文件的内容如下samtools_binary = /usr/bin/samtools用=分隔,保存了每个软件可执行文件的绝对路径;下面用perl 模块进行配置文件的读取, 模块名为confi... 阅读全文
posted @ 2016-01-20 16:36 庐州月光 阅读(374) 评论(0) 推荐(0)

R read.table函数的check.names参数

摘要: 今天用cummeRbund 对cuffdiff的结果进行可视化, 一直报错,之前跑的好好的,找了半天原因, 原来出现在read.table这个函数上;read.table有一个参数check.names , 其默认值为TRUE,它会自动将变量名转换成唯一的字符型向量其通过调用make.names函数... 阅读全文
posted @ 2016-01-19 10:43 庐州月光 阅读(5607) 评论(0) 推荐(0)

perl 实现ascall 码转换

摘要: 今天需要在perl中实现一个字母表, 总不能把26个字母一个一个写出来,于是查资料,可以利用ascii码转换把数字转换成对应的字母chr函数可以利用ascii编码把数字转换成对应的字母perl -e 'print map {chr} 65..91;' 阅读全文
posted @ 2016-01-15 16:52 庐州月光 阅读(381) 评论(0) 推荐(0)

perl 利用管道读取压缩文件内容

摘要: perl的文件句柄不仅支持普通文件, 还支持管道,今天需要统计一个fastq文件中的序列数和碱基数,而NGS的fastq文件一般都是gzip压缩的,所以需要读取压缩文件中的内容,代码如下:my ($fastq) = @ARGV:my ($reads, $bases) = cal_sequence_i... 阅读全文
posted @ 2016-01-15 16:09 庐州月光 阅读(946) 评论(0) 推荐(0)

perl 字符串比较操作符

摘要: perl 中数字和字符串的比较操作符是不一样的 ;其中 == 用于比较数字是否相等;eq 用于比较字符串是否相等;今天找程序里的bug,结果就是这个操作符用错,哎,赶紧记一下! 阅读全文
posted @ 2016-01-14 14:06 庐州月光 阅读(5100) 评论(0) 推荐(0)

perl chomp 函数的真正作用

摘要: 之前一直以为chomp函数只是去掉字符串末尾的\n, 但是今天写程序遇到一个bug,最后的原因就处在chomp上;读取fasta文件,内容如下:>1ATGCTAGCTACGTACGTACGTTTTTTTTT>2ACGATCGACGATCGTACGTACGTACGATT>3ATGCATGCTATACA... 阅读全文
posted @ 2016-01-13 14:04 庐州月光 阅读(13328) 评论(0) 推荐(0)

RSQLite 操作sqlite数据库

摘要: RSQLite 可以在R中方便的创建sqlite数据库,并进行检索, 这个R包依赖于DBI包github 上的地址:https://github.com/rstats-db/RSQLitegithub上的简介详细的介绍了如何用RSQLite 创建一个数据库并检索数据基本用法:library(RSQL... 阅读全文
posted @ 2016-01-10 16:38 庐州月光 阅读(2844) 评论(0) 推荐(0)

R 中的do.call 函数

摘要: do.call 函数是一个高阶函数, 其第一个参数为一个函数名,或者匿名函数,第二个参数是一个list 对象, 其实是参数列表比如读取文件test.txt, 内容为read.table(input, sep="\t")可以写作do.call(read.table, list(file="test.t... 阅读全文
posted @ 2016-01-08 17:52 庐州月光 阅读(1294) 评论(0) 推荐(0)