07 2017 档案
摘要:1 Rle(Run Length Encoding,行程编码) 1.1 Rle类和Rle对象 序列或基因最终要定位到染色体上。序列往往数量非常巨大,但染色体数量很少,如果每条序列的染色体定位都显式标注,将会产生大量的重复信息,更糟糕的是它们要占用大量的内存。BioC的IRanges包为这些数据提供了
阅读全文
摘要:我们在做人类全基因组分析的时候,经常需要找出基因组中所有基因的转录起始位点(Transcription Start Site, TSS),利用R/Bioconductor很容易做到。 用到一个包 Homo.sapiens,其中包含了目前已知的所有基因的注释信息,当然还有其他的包也含有所有基因的注释信
阅读全文
摘要:GTF文件的全称是gene transfer format,主要是对染色体上的基因进行标注。怎么理解呢,其实所谓的基因名,基因座等,都只是后来人们给一段DNA序列起的名字而已,还原到细胞中就是细胞核里面的一条长长的染色体(DNA序列)。而这个GTF文件的主要功能,就是指出我们所谓的基因在染色体上的位
阅读全文
摘要:samtools是一个用于操作sam和bam文件(通常是短序列比对工具如bwa,bowtie2,hisat2,tophat2等等产生的,具体格式可以在消息框输入“SAM”查看)的工具合集,包含有许多命令。以下是常用命令的介绍。 1.View view命令的主要功能是:将sam文件与bam文件互换;然
阅读全文
摘要:使用cBio Cancer Genomics Portal综合分析癌症基因和临床资料 cBio Cancer Genomics Portal简介 cBio Cancer Genomics Portal所需设备 cBio Cancer Genomics Portal使用方法 cBio Cancer G
阅读全文

浙公网安备 33010602011771号