转录组分析(二):差异表达分析、功能分析、表达验证

一、差异表达分析:找关键样本和关键基因

1. 差异表达分析

哪些基因在两组样本中有明显表达差异?【获得基因集合】

(1)差异表达基因筛选

FC:fold change,>1上调,<1下调
log2FC:>0上调,<0下调

差异表达基因组内差异小,组间差异大

筛选条件:

  • Padj<0.05
  • |log2FC|>1
  • 不同软件结果不同。DESeq、edgeR
  • 不用关注前人已研究清楚的基因
  • 一般筛选出200~1500个差异基因

image

(2)可视化:火山图、热图

image

2. PCA(后续补充)

3. 聚类

基因集分析:找出几个重点想研究的关键基因【获得几个基因】

  • 基因间聚类分析:表达模式相似的基因
  • 相关分析:表达模式相似的基因
  • WGCNA:找出关键基因

(1)聚类分析:聚类有多种算法,有的基于相关系数

  • 样本聚类:探索样本之间的关系,锁定关键样本,分析关键样本间的差异表达基因image
  • 基因间聚类:相似表达模式基因

(2)相关分析

相关系数的三种计算方法:Pearson 相关系数、Spearman 相关系数、Kendel 相关系数

样本间相关系数:用来描述样本表达模式的相似程度

基因间相关系数:找到与已知基因关联的基因。甲壳素别人研究过了,相关分析找到另一个没研究的。基因表达模式相关可能预示基因功能上相关【不一定】

image

(3)WGCNA:探索基因与表型的关系

A:聚类将表达模式相似的基因划分为模块
B:各个模块与表型相关分析
C:用最相关的模块构建网络。处于网络中心位置与其他基因连接多的基因重要,边缘不重要

image


二、功能分析

1. 富集分析

差异基因是否显著集中在某个功能分类上?(差异表达基因较多时)

GO分析:

pathway分析:

是否显著富集?看背景。1000个差异表达基因↓,总基因30000

image

分析软件

  • 模式物种:GO、DAVID
  • 非模式物种:ClusterProfiler

分析结果:

  • 条形图。x-基因数,y-功能分类,颜色-p值
  • 点图。x-比率,大小-基因数

image

2. 蛋白互作网络分析(PPI):500个以内以内,基因数太多要分成子网络分析


三、功能验证

1.实验验证

  • 敲减
  • 过表达

2.信息验证:生存分析


四、分子机制

TCGA等联合分析:

  • 序列变异
  • 表观遗传
  • 转录调控

 

posted on 2025-12-15 02:39  asaca_r  阅读(51)  评论(0)    收藏  举报

导航