2013年2月28日

cufflinks

摘要: 在转录组高通量测序数据分析过程中,主要就是转录本的构建(拼接)及表达水平的衡量,其次还包括可变剪接之类的转录后修饰等研究分析。因此,做过RNA-seq转录组测序数据分析的童鞋们一定使用过或至少听说过Cufflinks这个软件。Cufflinks 利用TopHat比对的结果(alignments)来组装转录本,估计这些转录本的丰度,并且检测样本间的差异表达及可变剪接。这个软件其实是个套装,包括四个部分分别命名为:cufflinks、cuffcompare、cuffmerge及cuffdiff。TopHat-->Cufflinks-->cuffdiff转录组分析大致流程如下:第一步,m 阅读全文

posted @ 2013-02-28 14:39 EasonCheng 阅读(2433) 评论(0) 推荐(0) 编辑

TopHat

摘要: TopHat 是将 RNA-Seq 数据允许 gap 的 mapping 到 ref seq 上!是转录组分析的必备工具之一!此帖的内容涵盖了tophat的介绍,安装、使用、异常处理等,是tophat使用的完全手册!1,介绍转录组数据分析之tophat篇 http://seq.cn/1650-79TopHat是一个快速的寻找可变剪接的回贴工具。http://seq.cn/318-79适合打印:自己排版整理的PDF版Tophat Manual http://seq.cn/6365-792,安装部署二代测序数据分析流程系列贴(2)-- 安装tophat http://seq.cn/678-79to 阅读全文

posted @ 2013-02-28 14:35 EasonCheng 阅读(1346) 评论(0) 推荐(0) 编辑

RPKM

摘要: RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理事,因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表现量较高,而错估基因真正的表现量,所以Ali Mortazavi等人在2008年提出以RPKM在估计基因的表现量。RPKM是将map到基因的read数除以map到genome的所有read数(以million为单位)与RNA的长度(以KB为单位)。其公式为:其中,total exon reads / mapped reads 阅读全文

posted @ 2013-02-28 14:26 EasonCheng 阅读(9189) 评论(0) 推荐(0) 编辑

导航