处理bam文件提取信息

一般来说,一个bam文件通常只包含一个样本的信息,最多需要进行染色体位置的处理, samtools也提供了简单的处理方式,比如要提取 chr1的reads, 只需要:

samtools view input.bam ch1

 这几天遇到了10x genomicsbam结果,发现单细胞的reads全包含在一个bam文件里,用barcode进行区分,因此可能就需要提取其中的信息,比如提起某一个细胞的reads,那么可以:

samtools view possorted_genome_bam.bam -h | sed -n "/^@\|TCTGAGAAGAAACCAT-1/p" | samtools view -b > result.bam

其实就是多了 sed 的处理过程 ,之所以加以记录,是因为在处理过程中 

samtools -h

 保留的header在将sam结果转化会bam格式是必须的,以防下次忘记.

posted @ 2019-08-19 20:05  PeRl`  阅读(2212)  评论(0编辑  收藏  举报