WGS数据分析中测序深度、比对深度、比对覆盖度的计算
001、测序深度 = 测序量 / 基因组的大小。
a、根据fastq计算测序的碱基数目
b、计算参考基因组的碱基数目
c、a的结果/b的结果
002、比对深度 = 比对上所有位点深度之和/比对上的位点的数目。
测试:
(base) [b20223040323@admin1 test4]$ ls SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth (base) [b20223040323@admin1 test4]$ ls SRR1770413.depth SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ head -n 3 SRR1770413.depth NC_000913.3 1 26 NC_000913.3 2 27 NC_000913.3 3 29 (base) [b20223040323@admin1 test4]$ awk '{sum += $3} END {print sum / NR}' SRR1770413.depth ## 计算比对深度 57.2948

003、覆盖度 = 至少比对上1次的位点数目/基因组的大小。
(base) [b20223040323@admin1 test4]$ ls SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth ## 基础统计 (base) [b20223040323@admin1 test4]$ ls SRR1770413.depth SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ awk 'END {print NR/genome_size}' SRR1770413.depth ## 计算覆盖度, genoem_size是参考基因组的碱基数目

。

浙公网安备 33010602011771号