摘要:在转录组高通量测序数据分析过程中,主要就是转录本的构建(拼接)及表达水平的衡量,其次还包括可变剪接之类的转录后修饰等研究分析。因此,做过RNA-seq转录组测序数据分析的童鞋们一定使用过或至少听说过Cufflinks这个软件。Cufflinks 利用TopHat比对的结果(alignments)来组装转录本,估计这些转录本的丰度,并且检测样本间的差异表达及可变剪接。这个软件其实是个套装,包括四个部分分别命名为:cufflinks、cuffcompare、cuffmerge及cuffdiff。TopHat-->Cufflinks-->cuffdiff转录组分析大致流程如下:第一步,m
阅读全文
摘要:TopHat 是将 RNA-Seq 数据允许 gap 的 mapping 到 ref seq 上!是转录组分析的必备工具之一!此帖的内容涵盖了tophat的介绍,安装、使用、异常处理等,是tophat使用的完全手册!1,介绍转录组数据分析之tophat篇 http://seq.cn/1650-79TopHat是一个快速的寻找可变剪接的回贴工具。http://seq.cn/318-79适合打印:自己排版整理的PDF版Tophat Manual http://seq.cn/6365-792,安装部署二代测序数据分析流程系列贴(2)-- 安装tophat http://seq.cn/678-79to
阅读全文
摘要:RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理事,因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表现量较高,而错估基因真正的表现量,所以Ali Mortazavi等人在2008年提出以RPKM在估计基因的表现量。RPKM是将map到基因的read数除以map到genome的所有read数(以million为单位)与RNA的长度(以KB为单位)。其公式为:其中,total exon reads / mapped reads
阅读全文
摘要:高通量测序技术,就是二代测序,已经成为现代生物学研究的一个较为常规的实验手段。这一技术的发展极大地推动了基因组学,表观基因组学以及翻译组学的研究。RNA-seq 通过测定稳定状态下的RNA样品的序列来对RNA样品进行研究,从而避免了许多之前研究手段的不足,比如象基因芯片或者 PCR 就需要背景知识。而且 RNA-seq 还可以触及以前无法研究的领域,比如复杂结构的转录体。RNA-seq可以应用于以下几个方面的研究,1. SNPs;2. novel transcripts;3. alternative splicing;4. RNA editing。但归根结底,RNA-seq最主要的分析还是筛选
阅读全文
摘要:什么是高通量测序?高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。什么是Sanger法测序(一代测序)Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次
阅读全文