samtools的用法简介

1.SAM(sequence Alignment/mapping)数据格式是目前高通量测序中存放比对数据的标准格式,当然他可以用于存放未比对的数据

2.AMTools的主要功能如下:

  • view: BAM-SAM/SAM-BAM 转换和提取部分比对

  • sort: 比对排序

  • merge: 聚合多个排序比对

  • index: 索引排序比对

  • faidx: 建立FASTA索引,提取部分序列

  • tview: 文本格式查看序列

  • pileup: 产生基于位置的结果和 consensus/indel calling

3.最常用的三板斧就是格式转换,排序,索引

转换:samtools view -S SRR3589912.sam -b > SRR3589912.bam(-S是最新版的samtools为了兼容以前的版本写的)

排序:samtools sort SRR3589912.bam -o SRR3589912_sorted.bam

索引:samtools index SRR3589912_sorted.bam

从上述可以看出了,比对后的sam文件应该先进行格式的转换,接着是排序,最后根据排序的文件建立索引文件。

4.samtools的排序方式有两种(常用)

默认方式,按照染色体的位置进行排序

samtools sort test.bam default

参数-n则是根据read名进行排序。

samtools sort -n test.bam sort_left

5.samtools的view不就可以进行格式转换,还可以进行数据的提取

例:提取1号染色体上1234~123456区域的以对read

samtools view SRR3589957_sorted.bam chr1:1234-123456 | head

参考网址:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247484720&idx=1&sn=4bb3e3d2182ffe937d58dc135b4bbd24&chksm=9b48458bac3fcc9df23d7f84023eb371289d58a74a5237056c232cb23d6af6645516153d36e0&scene=21#wechat_redirect

 

posted @ 2017-08-29 09:57  遗世独立的愚公  阅读(5452)  评论(0编辑  收藏  举报