【3】肿瘤基因组数据分析方法概述

肿瘤基因组分析

  • 肿瘤进化过程
    image.png
  • 基本概念:germline/somatic/driver/passenger mutation
  • 二次打击学说:生殖突变+体细胞突变
  • 主要基于体细胞突变研究
  • 发展趋势:小样本WES——大样本多组学;液体活检,免疫疗法,人工智能,微生物

肿瘤标准分析

  • 肿瘤研究整体流程
    image.png
  • 测序策略:WGS,WES,WXS(目标区域捕获)
  • 突变类型:点突变,Indel(<50bp),CNV(增加/缺失),SV,病毒插入整合
  • 原癌基因和抑癌基因的不同突变模式:oncogene(功能性/激活性突变,热点突变),tumor suppressor gene(截短型/失活型突变,突变分散)
  • 成对分析模式
    标准分析流程
  • 不同突变分析工具在体细胞突变差异较大,
    从多款软件中取2个以上检出位点,降低假阳性
  • 主流软件:BWA MEM+GATK Haplotypecaller
  • Rawdata——cleandata:SOAPnuke(去接头,低质量>50%base,N>10%),看cleanbases数据量及比例,Q20,Q30,GC%
  • cleandata——bam:
    image.png
    去重PCR,碱基质量重校正BQSR消除上下文(上下游各1bp)环境对碱基质量影响。
    看重复率,平均测序深度,覆盖度,4X/10X/20X reads的覆盖度
  • 变异检测软件:SNV(muTect,mutect2),TCGA MC3 计划(7款)
  • CNV(FACETS):5种检测算法(read count数目,paired-end,split reads,assembly, combinatorial approach),主流read count算法(非重复滑动窗口统计覆盖到窗口的reads),FACETS适用WES/WGS;CODEX2软件可检测体细胞和生殖细胞CNV
  • SV检测软件:BreakDancer,FermiKit,laSV,MindTheGap
    Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing
  • 注释软件:
    image.png
    annovar不能商用,snpEff较流行
    集成注释软件Oncotator(基因组,蛋白质,肿瘤和非肿瘤的相关注释)
  • 注释结果:含4方面内容
    image.png

高级分析

  • 主要分析
    超突变样品检测
    显著突变基因
    新抗原预测
    局部拷贝数变异
    病毒整合分析
    生殖系突变过滤
    突变特征分析
    SV突变特征分析
    突变链不对称分析
    突变网络分析
    肿瘤分子分型
    肿瘤克隆进化与异质性分析
    药靶数据库注释
    TCGA数据库分析

  • 四大模块:
    image.png

肿瘤分析数据挖掘及信息解读

肿瘤数据库

  • TCGA,COSMIC
  • BGI-PETA 泛肿瘤跨组学百科全学

肿瘤基因组临床应用专题:
【1】 肿瘤医学研究前言进展
【2】肿瘤基因检测相关技术原理
【3】肿瘤基因组数据分析方法概述
【4】肿瘤转录组测序分析流程及相关软件
【5】肿瘤DNA甲基化数据分析原理及流程
【6】肿瘤胚系突变遗传分析及数据库使用
【7】基于NGS检测体系变异解读和数据库介绍
【8】肿瘤临床遗传咨询及案例分析

posted @ 2020-08-25 09:46  生物信息与育种  阅读(1648)  评论(0编辑  收藏  举报