易基因:NC/IF15.7:RRBS+WGBS揭示DNA甲基化在不同组织与发育阶段中的表观遗传调控机制 构建跨物种跨组织甲基化全景图谱
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因
近日,Nature子刊《Nature Communications》发表题为“The genetic basis for DNA methylation variation across tissues and development”的研究成果。研究基于小鼠和人类的跨物种全基因组甲基化数据,构建了跨物种、跨组织的甲基化遗传调控图谱,建立了统一的DNA甲基化编程发育框架,系统揭示遗传变异如何通过影响转录因子结合以调控DNA甲基化模式。
本研究通过全基因组重亚硫酸盐测序(WGBS)和简化基因组重亚硫酸盐测序(RRBS)技术,系统性揭示了遗传变异如何在不同组织和发育阶段特异性和细胞类型特异性地影响DNA甲基化谱。研究团队首先在小鼠模型中,利用两个近交品系(C57BL/6和129X1/Sv)的不同组织,鉴定出数千个与破坏转录因子结合的序列多态性相关差异甲基化区域(DMRs)。这些DMRs建立分为两个关键发育窗口:胚胎着床期(建立广泛甲基化模式)和器官发生期(建立组织特异性甲基化模式)。随后,研究团队将研究扩展到人类,利用包含39种纯化细胞类型、200多个样本的WGBS图谱,鉴定出33,574个由常见SNP调控等位基因特异性甲基化(SD-ASM)区域。这些区域与eQTL、增强子、沉默子和疾病相关变异共定位,揭示了遗传变异通过影响DNA甲基化来调控基因表达和表型多样性的广泛性机制。该研究不仅阐明表观遗传编程的逻辑和时序性,也为解析非编码变异在发育、复杂疾病和再生医学中的作用提供了基础资源。
DOI:10.1038/s41467-026-71693-5
英文标题:The genetic basis for DNA methylation variation across tissues and development
译文标题:不同组织和发育阶段中的DNA甲基化变化遗传基础
发表时间:2026年4月15日
发表期刊:Nature Communications
影响因子:IF15.7/Q1
技术平台:RRBS、WGBS等
研究方法
(1)小鼠模型与样本制备
使用11-12周龄的C57BL/6J和129X1/SvJ雄性小鼠,获取肝脏、小脑、白色脂肪细胞和结肠上皮细胞。对组织或细胞DNA进行纯化。
(2)DNA甲基化测序
RRBS:使用MspI酶切20ng基因组DNA,进行末端修复、加A尾、连接甲基化TruSeq接头,然后进行亚硫酸盐转化、PCR扩增和纯化、上机测序。
WGBS:小鼠肝脏WGBS数据来源于Grimm等人的研究(GSE106379),人类WGBS数据来源于Loyfer等人的图谱(EGAS00001006791)。
(3)生物信息学分析
DMR鉴定:基于相邻CpG的甲基化块,鉴定不同组织的差异DMR。
等位基因特异性甲基化(ASM)分析:首先识别双峰甲基化区域(bimodal regions),然后根据SNP位点将测序片段按等位基因分离,通过Fisher精确检验评估不同等位基因上的甲基化差异。
人类SD-ASM鉴定:对39种纯化细胞类型中的超30M常见SNP进行筛选,最终确定33,574个SD-ASM区域。
功能富集与整合分析:motif富集分析、转录因子结合位点富集、表达关联分析;孟德尔随机化(MR)和共定位评估因果关系;利用ClinVar、GWAS catalog和OMIM数据库进行疾病关联分析。
结果图形
(1)全基因组DNA甲基化分析
本研究首先利用RRBS分析C57BL/6和129X1/Sv两种小鼠品系四种组织或细胞(小脑、结肠、脂肪、肝脏)的DNA甲基化模式,鉴定出在C57BL/6中普遍低甲基化而在129X1/Sv中甲基化的区域,这些区域富集于CpG岛。此外,研究团队还基于Grimm等人发表的全基因组肝脏甲基化数据,对C57BL/6和C3H品系小鼠的WGBS数据进行分析,鉴定出9,095个在肝脏中的差异甲基化区域。这些DMRs高度富集于CpG岛附近,并且绝大多数与附近的品系特异性SNP相关,表明它们是顺式遗传差异的结果。
为验证这一概念,对C57BL/6和C3H杂交产生的F1代杂合子小鼠肝脏进行WGBS分析,发现这些DMRs的甲基化水平介于两个亲本品系之间,有力证明序列依赖性等位基因特异性甲基化(SD-ASM)存在。PCA分析提示,发育过程(86.2%)是甲基化变异的主要因子,而遗传背景仅占5.6%。
(2)DNA甲基化与发育
为从发育视角分析DMRs,研究团队检测了纯系C57BL/6小鼠多种成体细胞类型和早期胚胎(E8.5)中的甲基化模式。通过分析,这些DMR被分为两大类(图1a)。第一类是“广泛性”区域:在C3H肝脏中高甲基化,但在C57BL/6的所有成体组织和E8.5胚胎中均处于低/未甲基化状态。这表明甲基化差异的决定发生在胚胎着床期,C57BL/6序列保护这些区域免受de novo甲基化。第二类是“组织特异性”区域:仅在C57BL/6的肝脏中特异性地去甲基化,而在其他组织中维持甲基化,且E8.5胚胎中这些区域已被甲基化。这一发现揭示了发育过程中两个关键的甲基化决策窗口:胚胎着床期的保护与器官发生期的去甲基化。
图1:两个小鼠品系之间的广泛性和组织特异性DNA甲基化差异。
a. 与C3H相比,在C57BL/6肝脏中低甲基化的统计显著区域(n=4,632)的热图。
b. 对这两组区域的序列分析,鉴定出整体性和肝脏特异性转录因子(TF)结合基序的富集。
(3)组织特异性和广泛性DMRs的转录因子结合
研究者对这两类DMR进行了motif分析。在C57BL/6肝脏中特异性去甲基化区域鉴定出与肝细胞特异性因子家族(如HNF、PPAR、FOX和HNF家族)的显著富集s。这些位点在C57BL/6中具有完整的motif,而C3H中的品系特异性SNP破坏了转录因子的结合,从而抑制肝脏发育过程中的去甲基化。而广泛性DMR分析发现了胚胎特异性转录因子(如CTCF)的motif富集(图1b)。上述分析结果表明关键的组织特异性“先锋”因子在器官发生过程中介导了调控区域的初始去甲基化。
(4)品系特异性DMRs与基因表达
为分析品系特异性DMR是否影响基因表达,研究团队将DMR与邻近基因进行关联分析。分析结果发现,尽管两个品系的DMR位置不同,但却显著地富集至相同靶基因(45.6%共有基因)。利用C57BL/6和C3H品系的肝脏RNA-seq数据,发现72%的差异表达基因(DE)与品系特异性DMR邻近。通过甲基化与表达的相关性分析,将DMR分类为增强子(负相关,约4,500个区域)或沉默子(正相关,约3,600个区域)。上述研究结果建立了从遗传变异到甲基化变化再到基因表达调控的完整调控通路。
(5)人类中SNP相关的DNA甲基化变化
研究将在小鼠中的发现扩展至人类,研究团队采用两步法分析了包含39种纯化细胞类型的WGBS图谱:首先鉴定出双峰甲基化区域(即同时存在完全甲基化和完全未甲基化reads的区域),然后在这些区域内,根据SNP位点分离reads,测试不同等位基因间的甲基化差异。基于此方法,研究人员鉴定出33,574个在至少一种细胞类型中与遗传变异相关的甲基化区域(SD-ASM),覆盖了超2%的人类基因组。这些区域包括166个在大多数细胞类型中广泛存在的区域,以及19,548个组织特异性去甲基化区域和1,173个组织特异性de novo甲基化区域。这些SD-ASM区域高度富集于CpG岛、启动子和H3K27ac峰等活性调控区域。
图2:DNA的遗传联合表观遗传分析鉴定出不同细胞类型和样本的等位基因特异性甲基化区域
a. 从39种纯化细胞类型的甲基化组中鉴定出双峰区域。
b. 来自B细胞(单一供体)的DNA片段中显示的等位基因特异性DNA甲基化。
c. 如b图所示的等位基因按甲基化状态列出的列联表。
d. 当来自不同供体的n=4个纯化B细胞样本合并分析时的列联表。
e. 这种等位基因特异性差异甲基化在所有细胞类型中广泛存在。

图3:转录因子结合位点上的遗传变异与差异甲基化
a. rs12499263等位基因甲基化差异在所有细胞类型中广泛存在。
b. 序列依赖性等位基因差异分析。
c. 结肠上皮细胞中C等位基因的等位基因特异性de novo甲基化。
d. 广泛性(上)和肝脏特异性(下)等位基因特异性差异甲基化区域的基序富集分析。
e. 组织特异性SD-ASM区域上体内转录因子结合(ReMap)的富集分析热图。

图4:等位基因去甲基化的组织特异性分析
a-b. 肝脏细胞特异性序列依赖性去甲基化区域(n=1,308个)在所有细胞类型中的情况。
c-d. 813个心肌细胞特异性等位基因位点分析。
(6)DNA甲基化SNP影响表型变异
利用这一丰富的调控区域,研究团队分析了这些SD-ASM区域是否与邻近基因的表达相关,从而影响表型。利用GTEx数据库,他们发现2,618个eQTL与SD-ASM区域重叠。例如,SNP rs12636296的G等位基因在几乎所有组织中均未甲基化,且其邻近基因ALGIL表达显著高于甲基化的T等位基因(图5a)。另一个示例为组织特异性的SD-ASM区域(rs659378),其G等位基因仅在甲状腺上皮细胞中未甲基化,导致PCAT18基因在甲状腺中特异性高表达(图5b)。孟德尔随机化分析显示超50%的SD-ASM/eQTL重叠中,甲基化差异是基因表达差异的主要促进因子。
图5:等位基因甲基化对基因表达的组织特异性影响
a. rs12636296的等位基因特异性甲基化在大多数细胞类型(n=33)中表现出广泛性,T等位基因甲基化,G等位基因非甲基化。邻近基因ALG1L(GTEx)的表达水平在不同基因型(该SNP位点)的供体之间表现出显著差异。
b. 对一个细胞类型特异性SD-ASM区域的类似分析显示,该区域在甲状腺上皮细胞的G等位基因上独特地呈现非甲基化,并在甲状腺中表现出差异表达。
c. 在广泛性(蓝色)和组织特异性(红色)SD-ASM位点的100bp范围内,超5种组织显著eQTLs的比例。
(7)疾病易感性
研究团队将SD-ASM库与疾病数据库关联,分析结果发现795个SD-ASM SNP与ClinVar中的致病性位点邻近,1,169个与GWAS目录中的位点邻近。例如,SNP rs2980888在肝细胞中表现出等位基因特异性去甲基化,并与TRIB1AL基因表达以及高密度脂蛋白胆固醇水平、代谢综合征和肝硬化等表型相关(图6)。上述分析表明该SNP可能通过影响DNA甲基化,进而影响肝脏特异性基因表达,从而增加疾病风险。

图6:疾病中的SD-ASM
SNP rs2954038与肝细胞中C等位基因的部分去甲基化相关(chr8:125495066,左侧),并与肝脏相关表型(NHGRI-EBI GWAS目录)的风险增加以及肝脏中TRIB1AL表达升高(GTEx,通过rs2980888)相关联。
(8)转录沉默子和增强子的鉴定
通过整合SD-ASM和eQTL数据,研究团队系统地鉴定了与基因表达相关的调控元件。分析结果发现,并非所有未甲基化的等位基因都对应基因上调。通过比较等位基因甲基化差异与等位基因表达差异,共鉴定出1,902个推定的组织特异性增强子(未甲基化等位基因上调)和1,678个推定的沉默子(未甲基化等位基因下调)(图7)。例如,PCAT18基因在甲状腺中是一个增强子,而CELSR1在甲状腺中是一个沉默子。这一发现揭示了DNA甲基化在增强子和沉默子功能中的双重作用,并揭示了一个此前被忽视的调控元件类别。

图7:沉默子和增强子的系统性全基因组鉴定
a. 通过比较甲基化的等位基因差异(x轴)与基因表达的等位基因偏倚(GTEx eQTL,y轴),在SD-ASM区域与其靶基因之间鉴定出n=9,189个组织特异性关联。
b. 条形图展示每种细胞类型中细胞类型特异性增强子和沉默子数量。
结论和启示
本研究通过小鼠和人类的跨物种大规模WGBS和RRBS分析,构建了一个全面的、发育视角下的序列依赖性甲基化图谱。研究结果揭示了遗传变异通过影响特定发育阶段(着床期或器官发生期)的转录因子结合,以塑造细胞类型特异性的DNA甲基化谱,进而调控基因表达和影响疾病易感性。
WGBS和RRBS技术的深度整合应用,实现从遗传变异到表观遗传变化再到表型的全面解析。未来研究可拓展至更多发育时间点、疾病状态和物种比较,特别是结合单细胞WGBS技术,可在单细胞分辨率上追踪等位基因特异性甲基化的动态变化。
参考文献:
Rosenski J, Sabag O, Marcus E, Loyfer N, Dor Y, Cedar H, Kaplan T. The genetic basis for DNA methylation variation across tissues and development. Nat Commun. 2026 Apr 15. doi: 10.1038/s41467-026-71693-5.
浙公网安备 33010602011771号