随笔分类 -  Bioinformatics software

摘要:最新版的rMATS v4.0相比上一版本性能有了很大提升,处理双端测序数据时,结果没问题。但是分析单端数据时,出来的结果文件只有header,没有其他内容。最开始以为是数据有问题,测试了几个其他数据,双端测序数据都有结果,单端测序数据都没有结果。Google一下,有很多人碰到同样问题。 作者回复正在 阅读全文
posted @ 2018-05-12 21:21 ZzzzHong 阅读(629) 评论(0) 推荐(0)
摘要:samtools在内存与core大量使用时容易出错:如 samtools sort: failed to create temporary file "TCGA-B0-5117-01A-01R-1420-07/hisat2_result/tmp.0000.bam": Cannot send afte 阅读全文
posted @ 2018-01-24 20:21 ZzzzHong 阅读(2129) 评论(0) 推荐(0)
摘要:rMATs是一款分析RNA可变剪切事件的软件,其最大特点是考虑了replicate,还针对配对样本(在医学方面很多都是tumor和normal配对)建立了统计模型,如此以来,得到的结果相对来说也更好。具体可参考文献《rMATS: Robust and flexible detection of di 阅读全文
posted @ 2018-01-04 22:59 ZzzzHong 阅读(4515) 评论(0) 推荐(0)
摘要:在分析转录组数据时,用bowtie2比对生成的bam文件,下一步call peak使用m6Aviewer,需要bam文件的index文件。所以我直接敲命令 报上面的错误。后来发现,samtools建索引时,bam或sam文件必须是排序好了的,而且必须使用samtools的默认排序方法,即坐标顺序排序 阅读全文
posted @ 2017-09-05 19:47 ZzzzHong 阅读(2621) 评论(0) 推荐(0)
摘要:转载自http://www.bio-info-trainee.com/1469.html(生信菜鸟团) 首先是NCBI对应UCSC,对应ENSEMBL数据库: GRCh36 (hg18): ENSEMBL release_52. GRCh37 (hg19): ENSEMBL release_59/6 阅读全文
posted @ 2017-09-04 14:51 ZzzzHong 阅读(2252) 评论(0) 推荐(0)
摘要:我的原始测序数据是双端测序,在用trim_galore软件去接头的这一步,使用的命令行是 相当然的以为软件会默认为双端测序,结果接下来一步用tophat软件mapping到参考基因组上的时候,发现mapping率只用10%,低的惊人。后来排除建库失败的可能,我去查看了trim_galore运行时的日 阅读全文
posted @ 2017-09-02 10:13 ZzzzHong 阅读(3178) 评论(0) 推荐(0)
摘要:RepeatMasker在运行时会先产生如下一个中间文件夹如RM_23346.WedAug301137422017,最后生成结果文件,例如.out,.masked,.tbl等 软件特性:软件运行很慢,而且很占内存(x100)。所以运行RepeatMasker时,要注意服务器的内存使用,内存超出会有c 阅读全文
posted @ 2017-08-30 16:42 ZzzzHong 阅读(1018) 评论(0) 推荐(0)