Nature Plants | 植物性状动态的基因组预测
高通量植物表型平台和基因分型技术的进步彻底改变了依靠基因组预测培育具有所需性状品种的工作,但是对植物整个生长期内不同时间点多种性状的表达缺乏了解。围绕这一问题,莱布尼茨研究所和马克斯-普朗克分子植物生理学研究所等单位开发了一种计算方法dynamicGP。该项研究成果2025年4月17日发表在Nature Plants上,标题:“Predicting plant trait dynamics from genetic markers”。
背景
植物表型在发育阶段的动态变化受遗传、环境及其互作影响,传统基因组预测(GP)仅针对单一时间点的性状,无法捕捉多性状随时间的动态变化。高通量表型技术(HTP)的发展生成了大量时间分辨的多性状数据(如形态、几何、颜色特征),为预测基因型特异性表型动态提供了可能。动态模式分解(DMD)作为一种数据驱动方法,能将复杂系统分解为时空模式,适用于高维时间序列分析,但其与遗传标记的结合在植物表型预测中尚未探索。本文提出DynamicGP,整合DMD与GP,利用遗传标记预测多性状动态,突破传统GP的时间局限性。
方法
-
- 数据与预处理:
-
• 玉米:347个重组自交系(RILs)的多亲本高级世代杂交(MAGIC)群体,25个时间点的HTP数据(播种后15天开始,每周5天,持续5周),筛选50个代表性性状(基于网络聚类和高遗传力)。
-
• 拟南芥:382个基因型的多样性面板,13个时间点的132个性状,筛选45个代表性性状。
-
• 基因型数据:玉米70,846个SNP,拟南芥207,257个SNP,缺失值插补后用于遗传力分析和GP模型。
-
- DynamicGP框架:
-
• DMD建模:通过经典DMD和Schur-based DMD(提升数值稳定性)构建线性算子矩阵 ( A ),描述表型从时间 ( t ) 到 ( t+1 ) 的动态变化。
-
• 遗传预测:将DMD生成的矩阵元素作为“性状”,利用岭回归最佳线性无偏预测(RR-BLUP)模型,通过5折交叉验证(20次迭代)训练,预测未观测基因型的动态算子 ( A_p )。
-
• 预测模式:
-
• 迭代版:每一步使用实测表型预测下一步,误差较小。
-
• 递归版:仅初始时间点使用实测值,后续依赖预测值,易累积误差。
DynamicGP算法示意图
结果
-
- DMD性能与遗传力:
-
• 玉米:Schur-based DMD在递归场景下表现更稳健(平均预测精度0.78),经典DMD因过拟合导致误差迅速累积。DMD构建模块(如奇异值分解矩阵、Schur分解矩阵)的元素具有中等至较高遗传力(均值0.20-0.47),支持从遗传标记预测动态算子。
-
• 拟南芥:尽管遗传力较低,DynamicGP仍优于基线模型,显示方法普适性。
-
- DynamicGP vs 基线GP:
-
• 玉米:迭代版DynamicGP在所有时间点和多数性状上优于基线RR-BLUP(如顶部图像蓝色值预测精度0.85 vs 基线0.45),递归版次之。性状遗传力时间稳定性越高(变异系数小),预测精度越高(Pearson相关系数-0.46)。
-
• 拟南芥:迭代和递归版均超越基线,尤其在后期时间点表现更佳,证明跨物种有效性。
-
- 误差与稳定性:
- • 迭代版误差(均方根误差)随时间增长更缓慢,递归版因误差累积导致后期精度下降。
玉米数据集上遗传力估计值和预测准确性
玉米数据集上性状遗传力在时间上的稳定性
DynamicGP在玉米数据集上的表现优于基线模型
讨论
-
- 创新与优势:
-
• DynamicGP首次结合DMD与GP,实现多性状动态预测,突破传统GP的单时间点限制,适用于HTP生成的高维时间分辨数据。
-
• 对遗传力时间稳定性高的性状预测更准确,为筛选发育稳定型品种提供工具。
-
- 局限性与未来方向:
-
• 递归版依赖初始数据,误差累积影响长期预测,需结合实测数据更新;拟南芥中低遗传力导致精度受限,需更大样本或环境数据增强模型。
-
• 未来可整合环境因子(如光照、温度)到DMD中,拓展至田间复杂环境,或结合深度学习优化动态模式捕捉,提升跨群体和环境的预测能力。
-
- 应用价值:
-
• 为作物育种提供高效工具,减少表型测量成本,加速品种筛选,尤其适用于需长期观测的复杂性状(如抗逆性、产量动态)。
-
• 推动“数据驱动育种”,通过整合遗传与动态表型数据,解析基因型-环境互作的时间依赖性,助力精准育种策略。
结论
DynamicGP通过整合DMD与GP,有效预测基因型特异性表型动态,在玉米和拟南芥中均优于传统GP方法,为多性状时间分辨预测提供了普适框架。尽管存在误差累积和遗传力依赖问题,其在育种中的应用潜力显著,未来结合环境因子和模型优化有望进一步提升预测精度,推动作物表型预测技术变革。
代码:
本文来自博客园,作者:生物信息与育种,转载请注明原文链接:https://www.cnblogs.com/miyuanbiotech/p/18930023。若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。