🧠 空间转录组去卷积(Spatial Transcriptomics Deconvolution)详解
一、什么是去卷积?为什么需要它?
去卷积(deconvolution)是指从一个混合表达信号中解析出其组成成分的过程。在空间转录组中,它的主要目标是:
应用 |
说明 |
❶ 细胞成分识别 |
推断每个 spot 中有哪些细胞类型及其比例 |
❷ 空间组织图谱重构 |
重建“拟单细胞”的空间表达图 |
❸ 解码功能异质性 |
揭示组织微环境的免疫、代谢、基质等变化区域 |
空间去卷积 vs. bulk RNA-seq 去卷积
维度 |
空间转录组去卷积 |
Bulk RNA-seq 去卷积 |
数据类型 |
空间点(spot)表达 |
全组织混合表达 |
是否有坐标 |
✅ 有 |
❌ 无 |
分辨率 |
每个 spot 级 |
整个样本级 |
典型工具 |
cell2location , RCTD , Tangram |
CIBERSORTx , MuSiC , DeconRNASeq |
关键区别
维度 |
空间去卷积 |
bulk RNA-seq去卷积 |
数据类型 |
空间转录组数据 |
整体混合表达数据 |
是否有空间信息 |
有,点位具有坐标 |
无空间坐标 |
精度 |
高,每个spot都有推测 |
低,只能估算样本总体组成 |
所需参考 |
scRNA-seq表达谱 |
通常也需要scRNA-seq或marker表达谱 |
输出结果 |
每个spot中不同细胞类型的比例 |
每个样本中不同细胞类型的比例 |
工具 |
Tangram, RCTD, Cell2location |
CIBERSORT, MuSiC, DeconRNASeq |
与传统意义bulk RNA-seq 中的去卷积不同
- 在 bulk RNA-seq 中,样本通常由多种细胞混合,比如肿瘤组织、血液样本等。Bulk RNA-seq 给出的是一个样本整体的平均表达谱。目标是推断每个 bulk 样本中,不同细胞类型所占的比例(或相对表达贡献)
- 常用算法
- CIBERSORT / CIBERSORTx:利用线性回归,将混合表达数据分解为多个已知细胞类型的表达特征和比例。CIBERSORTx支持batch correction和RNA-seq改进模型。
- MuSiC:利用scRNA-seq作为参考,建立细胞类型表达加权平均模型,适应不同组织来源。
- DeconRNASeq: 简化线性模型,适用于较少已知细胞类型的场景。
二、空间去卷积的分析流程(典型四步)
预处理 → 构建参考 → 建模去卷积 → 可视化与空间解释
步骤拆解:
-
预处理:
- 空间数据归一化、QC;
- 单细胞数据聚类与细胞类型注释。
-
构建参考表达库:
- 使用高质量的 scRNA-seq 生成各类细胞的 marker profile;
- 或整合公开单细胞数据集。
-
去卷积建模:
- 根据所选工具建立空间表达 = 参考表达 × 比例矩阵。
-
空间可视化与解释:
三、主流去卷积方法与分类对比
✅ 1. 监督式建模法(需要 scRNA 参考)
方法 |
原理 |
特点 |
适用平台 |
cell2location |
贝叶斯层次模型 |
多细胞类型支持好,可整合 batch |
Visium, CosMx |
RCTD |
泊松似然估计 |
对小 spot 更稳健,分辨率适中 |
Slide-seqV2 |
SPOTlight |
NMF + 回归 |
快速,适合探索性分析 |
Visium |
Stereoscope |
scVI负二项建模 |
类似cell2location,轻量但不支持先验 |
Visium, MERFISH |
Tangram |
深度学习映射 |
支持 RNA→Protein 跨模态对齐 |
CosMx, Xenium |
✅ 2. 无监督 / 半监督类(无需 scRNA 参考)
方法 |
原理 |
特点 |
适用平台 |
NMF |
非负矩阵分解 |
快速、无参考,但难解释 |
全平台(探索) |
BayesSpace |
贝叶斯空间聚类 |
强 spatial 分区能力,不输出细胞比例 |
Slide-seq, Visium |
spatialPCA |
降维+聚类 |
聚焦空间趋势挖掘 |
全平台 |
✅ 3. 多模态去卷积方法
方法 |
特点 |
支持平台 |
Tangram |
RNA→Protein 映射;空间对齐强 |
CosMx, DBiT-seq |
DestVI |
建模细胞状态(不是类型) |
Visium, Xenium |
TotalVI |
RNA + 蛋白整合 |
多模态平台首选 |
四、平台适配推荐表
平台 |
类型 |
推荐方法 |
10X Visium |
转录组 |
cell2location, SPOTlight, Stereoscope |
Slide-seqV2 |
转录组 |
RCTD, BayesSpace |
MERFISH / CosMx |
空间高通量 RNA |
Tangram, DestVI |
DBiT-seq / Xenium |
RNA + Protein |
TotalVI, Tangram |
IMC / CODEX |
蛋白组学 |
NMF, 聚类 + marker 注释 |
五、方法选择的本质逻辑
决策因素 |
解读方式 |
示例 |
🎯 数据模态 |
仅RNA?是否多模态? |
CosMx 选 Tangram;单模态选 RCTD |
📏 空间分辨率 |
spot 包含几种细胞? |
Visium 适合 cell2location |
🧭 是否有 scRNA 参考 |
有参考可用监督法;无参考用 NMF/BayesSpace |
tumor bulk 无参考 → NMF |
六、可视化与输出样例
以下是典型输出图表:
- 每类细胞空间热图
- 堆叠条形图(每个 spot 细胞比例)
- 空间聚类 vs. 原组织结构映射图
你可以用以下工具生成可视化:
可视化工具 |
推荐 |
Scanpy / Squidpy |
可生成空间图、分布图 |
cell2location 自带可视化函数 |
如 plot_spatial_map() |
Tangram 结合 napari |
支持原图叠加表达图 |
七、技术挑战与前沿趋势
挑战 |
描述 |
📍 分辨率限制 |
Visium spot 过大,非单细胞 |
🧬 batch effect |
scRNA 与空间数据跨平台误差 |
🧬 多模态推断困难 |
蛋白数据数量少,归一化难度大 |
📌 未来趋势 |
开发真实单细胞分辨率平台(如 Slide-seq3、Stereo-seq v3);scATAC + 蛋白联合建模 |
✅ 总结推荐清单
使用场景 |
推荐方法 |
Visium + scRNA |
cell2location , Stereoscope |
Slide-seq 高精度 |
RCTD , BayesSpace |
无参考数据 |
NMF , BayesSpace , spatialPCA |
蛋白组数据 |
NMF , 聚类 + marker 注释 |
多模态 RNA+Protein |
Tangram , TotalVI |
📦 Bonus:进一步资源
如你需要,我可以提供:
- 🧪 各方法的 运行代码模板(Python/R)
- 🧬 公开 scRNA + ST 数据用于练手(如
10x + Tabula
)
- 📁 Snakemake 工作流模板,支持自动化
cell2location
+ Tangram