VCF文件的常见FILTER汇总
This field contains the name(s) of any filter(s) that the variant fails to pass, or the value
PASS
if the variant passed all filters. If the FILTER value is.
, then no filtering has been applied to the records. It is extremely important to apply appropriate filters before using a variant callset in downstream analysis. See our documentation on filtering variants for more information on this topic.
也就是说,除了 PASS,其他都是未通过的原因。
- FAIL:所有 alleles 都是 failed,但原因不同
- PASS
- base_qual:突变位点碱基质量的中位数。SNV 是按突变位点算,InDel 按前一个碱基算(如,AG>A, A<AG,都是按 A 的质量计算)。
https://gatk.broadinstitute.org/hc/en-us/articles/360040098332-BaseQuality
- clustered_events:相同的局部组装区域发生 co-occuring,200bp。https://www.jianshu.com/p/4e994a171555
- contamination:污染
- duplicate:因 dup 过表达
- fragment:支持突变的 reads 长度的中位数(非负,成对有效)
- germline: 证明是 germline,而不是 somatic
- haplotype:同一单倍型上已经被过滤的 var,本 var 在它附近
- low_allele_frac:等位基因分数低于阈值
- map_qual
- multiallelic:有太多 alt alleles 通过了 tumor LOD
- n_ratio:N 含量过高
- normal_artifact:artifact 是非自然的异象,可能是由于实验or数据处理等因素引起的,而不是真实的生物学现象导致的
- orientation:方向偏差伪影。主要是在文库制备时,由核酸中发生化学变化引起的。如,G A 配对现象。
- panel_of_narmals:PON 中的黑名单
- position:突变到 read 末尾的距离的中位数
- possible_numt:深度过低,可能是NuMT
- slippage:(滑动)缩小的短串联重复区域
- strand_bias:等位基因的证据仅来自一个 read 方向
- strict_strand:证据不是双向的
- weak_evidence:突变不符合可能性阈值