全球首个10万规模鸡参考面板项目

“从AI大模型的角度来说,基因组也是一门语言,它本身就非常符合文本类型语言化的特征。因此,我们想用AI的深度学习与大语言模型的方法,把基因组作为一门语言来进行深入的研究。把鸡的基因组弄明白后,对我们理解人类和其他动物的疾病等现象都是有帮助的,这是我们全球鸡基因字典这个项目希望实现的意义。”

中国农业大学 胡晓湘教授

填补空白

全球首个10万规模鸡参考面板项目

在群体基因组研究中,构建一个高质量、代表性强的参考基因组面板(reference panel)是提升基因型填充精度的关键。牛和猪等经济动物已分别建立标准化参考资源,有效推动了数量性状位点(QTL)解析和候选基因识别的进展。相比之下,作为全球饲养量最大的家禽——鸡,此前尚缺乏一套覆盖广泛、样本充足、可支持多场景应用的高质量参考面板。

为填补这一空白,研究团队发起并构建了全球首个10万规模鸡参考面板项目——100K GCRP(Global Chicken Reference Panel)。第一阶段成果于2025年4月15日,在Genomics, Proteomics & Bioinformatics杂志在线发表,题为“GCRP: Integrated Global Chicken Reference Panel from 11,951 Chicken Genomes” 。该研究由中国农业大学胡晓湘和王宇哲团队牵头,联合国内外多个单位合作完成,第一阶段成果构建了全球首个鸡类参考基因组资源库,有望为鸡种遗传变异图谱构建、人工选择研究和精准育种提供基础支撑。

图片

第一阶段成果发布

构建全球首个鸡类参考基因组资源库

鸡的驯化历史可追溯至约8000年前,起源于分布在南亚和东南亚的原鸡(Gallus gallus)。原鸡不仅是首个完成全基因组测序的鸟类,也是最早被解码的脊椎动物基因组之一。目前,公共变异数据库(如 dbSNP v106)已收录约2343万个单核苷酸多态性位点(SNP)和240万个短插入/缺失变异(InDel),为鸡的基因组关联分析(GWAS)和功能基因挖掘提供了重要基础。

随着低深度测序(LCS)技术的发展,研究者得以在控制成本的同时实现大规模样本测序,弥补传统SNP芯片信息覆盖不足的局限,为基因组选择与精细化变异定位提供了新可能。

第一阶段成果采用低深度测序获得了 10,104 份商品鸡样本,此外搜集了1847个高深度测序样本,构建了两个高质量子面板(CBP 与 CMP),系统评估了不同策略下的基因型填充性能,并在模拟与真实性状中展示了其在 GWAS 和因果变异定位中的优势。该资源库有望为鸡种遗传变异图谱构建、人工选择研究和精准育种提供基础支撑。

图片

图示:全球10万规模鸡基因型参考面板GCRP

以下是研究成果的相关总结:

图片

0****1

构建全球首个鸡类参考基因组资源库

图片

本研究构建了全球首个鸡类参考基因组资源库,整合了来自全球多个品种/品系的11,951个鸡基因组样本,涵盖全球主要商品鸡与地方鸡种群,识别了超过48M个SNP以及4.7M个InDel突变,其中新发现突变占比高达67.6%,显著扩展了现有变异数据库的覆盖范围。

0****2

构建两个高质量子面板

图片

依据群体特征构建了两个高质量子面板:CBP(Commercial Breed Panel):基于10,104只商品鸡的低深度测序数据;CMP(Comprehensive Mix Panel):基于1847个深度测序样本,聚焦地方鸡种与遗传多样性。两者可分别支持商业育种与基础研究应用,提供灵活的参考选择。

0****3

优越的基因型填充性能

图片

通过系统评估显示:GCRP在8种典型场景下均表现出优越的基因型填充性能,其中CMP面板在6种场景中表现最优,填充准确性显著高于现有发布的鸡参考面板资源(如AGIDB和 SNPAtlas等)。

0****4

GCRP填充数据有效提升了统计效能

图片

在模拟和真实性状的GWAS 分析中,GCRP填充数据有效提升了统计效能:检测到的关联信号更集中,显著位点更靠近已知功能区域或候选基因,支持更高精度的因果变异定位。

0****5

构建并上线了开放共享的 GCRP 数据平台

图片

构建并上线了开放共享的 GCRP 数据平台,集成变异浏览、在线填充和文件下载三大模块,支持全球研究者开展多样化的鸡类基因组分析任务,并为后续多组学整合分析的基因组面板奠定基础。

数据库链接:http://farmrefpanel.com/GCRP

中国农业大学王宇哲博士为本文的通讯作者,胡晓湘教授为本文最后作者。博士生朱迪以及博士后王宇占为本文的共同第一作者。中国农业大学赵毅强,广东省农科院动物科学研究所舒鼎铭、瞿浩,东北农业大学李辉、张慧,南京农业大学冯春刚,华中农业大学盛哲雅,山东农业大学姜运良,温氏南方家禽育种公司徐振强、张德祥、姜自琴,石家庄畜牧技术推广站褚素乔,奥胡斯大学房灵昭为本文共同作者。本研究得到了国家自然科学基金 (32272862)、国家重点研发计划(2021YFD1300100)以及中国农业大学“2115人才发展计划”的资助支持。

图片

来源:华大智造MGI

图片

posted @ 2025-06-15 22:20  生物信息与育种  阅读(136)  评论(0)    收藏  举报