去卷积(deconvolution)

🧠 空间转录组去卷积(Spatial Transcriptomics Deconvolution)详解

一、什么是去卷积?为什么需要它?

去卷积(deconvolution)是指从一个混合表达信号中解析出其组成成分的过程。在空间转录组中,它的主要目标是:

应用 说明
❶ 细胞成分识别 推断每个 spot 中有哪些细胞类型及其比例
❷ 空间组织图谱重构 重建“拟单细胞”的空间表达图
❸ 解码功能异质性 揭示组织微环境的免疫、代谢、基质等变化区域

空间去卷积 vs. bulk RNA-seq 去卷积

维度 空间转录组去卷积 Bulk RNA-seq 去卷积
数据类型 空间点(spot)表达 全组织混合表达
是否有坐标 ✅ 有 ❌ 无
分辨率 每个 spot 级 整个样本级
典型工具 cell2location, RCTD, Tangram CIBERSORTx, MuSiC, DeconRNASeq

关键区别

维度 空间去卷积 bulk RNA-seq去卷积
数据类型 空间转录组数据 整体混合表达数据
是否有空间信息 有,点位具有坐标 无空间坐标
精度 高,每个spot都有推测 低,只能估算样本总体组成
所需参考 scRNA-seq表达谱 通常也需要scRNA-seq或marker表达谱
输出结果 每个spot中不同细胞类型的比例 每个样本中不同细胞类型的比例
工具 Tangram, RCTD, Cell2location CIBERSORT, MuSiC, DeconRNASeq

与传统意义bulk RNA-seq 中的去卷积不同

  1. 在 bulk RNA-seq 中,样本通常由多种细胞混合,比如肿瘤组织、血液样本等。Bulk RNA-seq 给出的是一个样本整体的平均表达谱。目标是推断每个 bulk 样本中,不同细胞类型所占的比例(或相对表达贡献)
  2. 常用算法
  • CIBERSORT / CIBERSORTx:利用线性回归,将混合表达数据分解为多个已知细胞类型的表达特征和比例。CIBERSORTx支持batch correction和RNA-seq改进模型。
  • MuSiC:利用scRNA-seq作为参考,建立细胞类型表达加权平均模型,适应不同组织来源。
  • DeconRNASeq: 简化线性模型,适用于较少已知细胞类型的场景。

二、空间去卷积的分析流程(典型四步)

预处理 → 构建参考 → 建模去卷积 → 可视化与空间解释

步骤拆解:

  1. 预处理

    • 空间数据归一化、QC;
    • 单细胞数据聚类与细胞类型注释。
  2. 构建参考表达库

    • 使用高质量的 scRNA-seq 生成各类细胞的 marker profile;
    • 或整合公开单细胞数据集。
  3. 去卷积建模

    • 根据所选工具建立空间表达 = 参考表达 × 比例矩阵。
  4. 空间可视化与解释

    • 将每种细胞类型的分布图还原在组织图像上。

三、主流去卷积方法与分类对比

✅ 1. 监督式建模法(需要 scRNA 参考)

方法 原理 特点 适用平台
cell2location 贝叶斯层次模型 多细胞类型支持好,可整合 batch Visium, CosMx
RCTD 泊松似然估计 对小 spot 更稳健,分辨率适中 Slide-seqV2
SPOTlight NMF + 回归 快速,适合探索性分析 Visium
Stereoscope scVI负二项建模 类似cell2location,轻量但不支持先验 Visium, MERFISH
Tangram 深度学习映射 支持 RNA→Protein 跨模态对齐 CosMx, Xenium

✅ 2. 无监督 / 半监督类(无需 scRNA 参考)

方法 原理 特点 适用平台
NMF 非负矩阵分解 快速、无参考,但难解释 全平台(探索)
BayesSpace 贝叶斯空间聚类 强 spatial 分区能力,不输出细胞比例 Slide-seq, Visium
spatialPCA 降维+聚类 聚焦空间趋势挖掘 全平台

✅ 3. 多模态去卷积方法

方法 特点 支持平台
Tangram RNA→Protein 映射;空间对齐强 CosMx, DBiT-seq
DestVI 建模细胞状态(不是类型) Visium, Xenium
TotalVI RNA + 蛋白整合 多模态平台首选

四、平台适配推荐表

平台 类型 推荐方法
10X Visium 转录组 cell2location, SPOTlight, Stereoscope
Slide-seqV2 转录组 RCTD, BayesSpace
MERFISH / CosMx 空间高通量 RNA Tangram, DestVI
DBiT-seq / Xenium RNA + Protein TotalVI, Tangram
IMC / CODEX 蛋白组学 NMF, 聚类 + marker 注释

五、方法选择的本质逻辑

决策因素 解读方式 示例
🎯 数据模态 仅RNA?是否多模态? CosMx 选 Tangram;单模态选 RCTD
📏 空间分辨率 spot 包含几种细胞? Visium 适合 cell2location
🧭 是否有 scRNA 参考 有参考可用监督法;无参考用 NMF/BayesSpace tumor bulk 无参考 → NMF

六、可视化与输出样例

以下是典型输出图表:

  1. 每类细胞空间热图
  2. 堆叠条形图(每个 spot 细胞比例)
  3. 空间聚类 vs. 原组织结构映射图

你可以用以下工具生成可视化:

可视化工具 推荐
Scanpy / Squidpy 可生成空间图、分布图
cell2location 自带可视化函数 plot_spatial_map()
Tangram 结合 napari 支持原图叠加表达图

七、技术挑战与前沿趋势

挑战 描述
📍 分辨率限制 Visium spot 过大,非单细胞
🧬 batch effect scRNA 与空间数据跨平台误差
🧬 多模态推断困难 蛋白数据数量少,归一化难度大
📌 未来趋势 开发真实单细胞分辨率平台(如 Slide-seq3、Stereo-seq v3);scATAC + 蛋白联合建模

✅ 总结推荐清单

使用场景 推荐方法
Visium + scRNA cell2location, Stereoscope
Slide-seq 高精度 RCTD, BayesSpace
无参考数据 NMF, BayesSpace, spatialPCA
蛋白组数据 NMF, 聚类 + marker 注释
多模态 RNA+Protein Tangram, TotalVI

📦 Bonus:进一步资源

如你需要,我可以提供:

  • 🧪 各方法的 运行代码模板(Python/R)
  • 🧬 公开 scRNA + ST 数据用于练手(如 10x + Tabula
  • 📁 Snakemake 工作流模板,支持自动化 cell2location + Tangram

posted @ 2025-05-17 22:52  tomorgen  阅读(339)  评论(0)    收藏  举报