VCF文件的常见FILTER汇总

This field contains the name(s) of any filter(s) that the variant fails to pass, or the value PASS if the variant passed all filters. If the FILTER value is ., then no filtering has been applied to the records. It is extremely important to apply appropriate filters before using a variant callset in downstream analysis. See our documentation on filtering variants for more information on this topic. 

也就是说,除了 PASS,其他都是未通过的原因。

  1. FAIL:所有 alleles 都是 failed,但原因不同
  2. PASS
  3. base_qual:突变位点碱基质量的中位数。SNV 是按突变位点算,InDel 按前一个碱基算(如,AG>A, A<AG,都是按 A 的质量计算)。

    https://gatk.broadinstitute.org/hc/en-us/articles/360040098332-BaseQuality

  4. clustered_events:相同的局部组装区域发生 co-occuring,200bp。https://www.jianshu.com/p/4e994a171555
  5. contamination:污染
  6. duplicate:因 dup 过表达
  7. fragment:支持突变的 reads 长度的中位数(非负,成对有效)
  8. germline: 证明是 germline,而不是 somatic
  9. haplotype:同一单倍型上已经被过滤的 var,本 var 在它附近
  10. low_allele_frac:等位基因分数低于阈值
  11. map_qual
  12. multiallelic:有太多 alt alleles 通过了 tumor LOD
  13. n_ratio:N 含量过高
  14. normal_artifact:artifact 是非自然的异象,可能是由于实验or数据处理等因素引起的,而不是真实的生物学现象导致的
  15. orientation:方向偏差伪影。主要是在文库制备时,由核酸中发生化学变化引起的。如,G A 配对现象。

    https://gatk.broadinstitute.org/hc/en-us/community/posts/360075017111-strand-bias-and-orientation-bias

  16. panel_of_narmals:PON 中的黑名单
  17. position:突变到 read 末尾的距离的中位数
  18. possible_numt:深度过低,可能是NuMT
  19. slippage:(滑动)缩小的短串联重复区域
  20. strand_bias:等位基因的证据仅来自一个 read 方向
  21. strict_strand:证据不是双向的
  22. weak_evidence:突变不符合可能性阈值

 

posted @ 2023-09-25 13:29  Shinamy  阅读(138)  评论(0编辑  收藏  举报