Bedtools genomecov 计算覆盖度

简单说明:

  • 从2.28.0版开始,bedtools使用htslib库支持CRAM格式
  • 除了BAM文件,bedtools默认所有的输入文件都以TAB键分割
  • 除非使用-sorted选项,bedtools默认不支持大于512M的染色体
  • 如果没有使用-sorted参数对染色体按编码顺序进行排序(e.g., sort -k1,1 -k2,2n ),则必须使用-g参数输入相同排序染色体
  • bedtools要求染色体命名方案在比较文件中是相同的(例如‘chr1’和‘1’不能同时存在)

1 genomecov

计算基因组水平上的reads覆盖度,可以以单个点位显示(-d),或者以bed格式显示(-bg)。

在运行之前,保证
(1) 输入的bed/vcf/gff 文件时,要对齐进行排序(sort -k1,1 -k2,2n), 且提供 -g genome 文件
(2) 输入ban文件时,使用ibam 参数,先对bam文件进行sort,可不加-g 参数

如下

bedtools genomecov -bga -pc -ibam F_T02.sorted.bam >F_T02.frag.cov
head F_T02.frag.cov
YYchr1	0	183326	0
YYchr1	183326	183590	1
YYchr1	183590	187919	0
YYchr1	187919	188138	1
YYchr1	188138	190127	0
YYchr1	190127	190272	1
YYchr1	190272	190354	0

# -bg: 以bed文件输入
# -bga: 如上一样,但同时输入覆盖度为0的区域

以上结果中,第一列染色体,2,3列,位置区域,第4列 coverage,该区域的定义如下所示

参考

欢迎交流

posted @ 2021-01-09 11:14  斩毛毛  阅读(1627)  评论(0编辑  收藏  举报