WGS数据分析中测序深度、比对深度、比对覆盖度的计算

 

001、测序深度 = 测序量 / 基因组的大小。

a、根据fastq计算测序的碱基数目

b、计算参考基因组的碱基数目

c、a的结果/b的结果 

 

002、比对深度 = 比对上所有位点深度之和/比对上的位点的数目。

测试:

(base) [b20223040323@admin1 test4]$ ls
SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth
(base) [b20223040323@admin1 test4]$ ls
SRR1770413.depth  SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ head -n 3 SRR1770413.depth
NC_000913.3     1       26
NC_000913.3     2       27
NC_000913.3     3       29
(base) [b20223040323@admin1 test4]$ awk '{sum += $3} END {print sum / NR}' SRR1770413.depth      ## 计算比对深度
57.2948

 

003、覆盖度 = 至少比对上1次的位点数目/基因组的大小。

(base) [b20223040323@admin1 test4]$ ls
SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth    ## 基础统计
(base) [b20223040323@admin1 test4]$ ls
SRR1770413.depth  SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ awk 'END {print NR/genome_size}' SRR1770413.depth        ## 计算覆盖度, genoem_size是参考基因组的碱基数目

 。

 

posted @ 2025-01-27 12:15  小鲨鱼2018  阅读(298)  评论(0)    收藏  举报