华大基因:拥抱AI大模型,重塑基因检测与健康管理未来
2025年2月7日,华大基因发布了一份投资者关系活动记录表,其中不仅对2024年的经营成果进行了全面总结,还对2025年的经营目标和发展方向进行了展望。特别引人注目的是,华大基因在AI大模型领域的布局和应用,正成为其业务转型和发展的关键引擎。
华大基因全力拥抱 AI 大模型,2025 年将围绕 “ALL 计划” 战略目标,把业务模式从生产型服务转向智能型服务,推动样本处理自动化、智能化,结合短读长和长读长测序技术平台,提升数据库积累,为业务转型奠基。
2024 年 9 月华大基因提出 “生成式生物智能范式 GBI ALL”,旨在加速基因检测与健康管理智能化,该范式下有基因检测多模态大模型 GeneT、基因组咨询平台 ChatGeneT 等系统。华大基因在大模型技术方面,一是基于 Transformer 等基础模型框架加速生物信息学分析及研究,二是利用开源大语言模型开展临床应用,其大模型已进入基因检测临床应用,提升致病位点选择效率,降低解读成本。
随着测序成本降低,降低数据分析及解读成本、提升效率至关重要,开源模型 DeepSeek - V3 及 DeepSeek - R1 的技术优化有助于此。华大基因 CEO 表示,工具自主可控使测序成本降低,加速人人基因组时代到来,面对海量基因组数据,需高效精准提取基因信息以了解疾病进程,华大基因结合基因组数据与 AI 算法,利于精准健康管理,加速精准医学发展,助推生命科学数智化。
华大基因在大模型领域有两大优势,一是全国产化基因数据产出能力,检测过程自主、可靠且成本可控;二是数据积累和分析上的先发优势,基于二十余年的数据及算法研发能力,能更好结合专业知识,提升检测效率。公司有多年数据积累和与顶级医院合作基础,构建了百万病例训练数据集,数据获取和预处理的高成本构成技术壁垒,真实世界数据的真实性和多样性是数据解读和应用优势的关键因素,通过信息化建设和数据对齐,确保数据高质量输出,满足当前和未来需求,实现标准化。
大规模真实世界数据来源多样性和案例库全面性是提升模型准确率的关键,华大基因通过上万样本验证,确保准确性与稳定性,在算法开发上应用人工智能技术,结合增强索引技术,提升模型泛化能力和准确率。
测序成本大幅下降和技术进步使高深度全基因组数据在医学领域应用更广泛,华大基因与北京协和医院合作罕见病大模型,通过 AI 技术重分析未诊断患者,挖掘基因突变共性,结合基础医学研究和实验室验证确保预测结果准确性,加速药物研究。大模型有望为多基因病诊断带来显著收益,华大基因正在基于中国人群建立多基因风险预测模型及开展药物研发探索。
华大基因在肿瘤早期防控业务有良好布局和增长,利用多组学技术推动肿瘤早筛产品开发,AI 在发现癌症信号和溯源定位方面发挥作用,结合公共大模型与垂直领域数据训练,建立更经济且效果良好的模型,提高特异性和准确性。在小分子药物开发上,华大基因与国内临床机构合作,布局基于大数据的研究和人群队列研究工作。
全基因组信息是个性化诊疗基础,华大基因在个体化用药方面有成熟应用,如肿瘤患者个体化治疗,并拓展到疗效预测和预后判断。多组学整合分析是未来发展方向,包括转录组、蛋白组、代谢组等整合,以及与影像学、生理生化指标、穿戴式设备监测数据结合,为疾病机理研究提供方向。
本文来自博客园,作者:生物信息与育种,转载请注明原文链接:https://www.cnblogs.com/miyuanbiotech/p/18841931。若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。

浙公网安备 33010602011771号