一个完全由-LLM-代理组成的科研实验室如何开发出可以阻断病毒的分子
一个完全由 LLM 代理组成的科研实验室如何开发出可以阻断病毒的分子
在人工智能继续重塑我们编码、写作甚至推理的时代,一个新的前沿出现了:人工智能进行真正的科学研究,正如几家公司(从像谷歌这样的主要 established 玩家到专门的衍生公司)正在尝试实现。我们谈论的不仅仅是模拟、自动摘要、数据处理或理论输出,而是实际上产生经过实验验证的材料,例如具有潜在临床相关性的生物设计,例如我今天带来的这个例子。
那个未来已经变得非常接近;确实非常接近!
在斯坦福大学和陈-扎克伯格生物实验室的研究人员刚刚发表在《自然》杂志上的一篇开创性论文中,一个名为虚拟实验室的新系统展示了人类研究人员与一组大型语言模型(LLM)代理合作可以设计新的纳米抗体——这些是微小的、类似抗体的蛋白质,可以结合其他物质以阻断其功能——以针对 SARS-CoV-2 的快速突变变种。这不仅仅是一个狭窄的聊天机器人交互或辅助工具的论文;这是一个由 AI 代理领导并执行的开放式、多阶段研究过程,每个代理都有专门的专长和角色,最终产生了经过现实世界验证的生物分子,这些分子可以完美地进入下游研究,以在疾病(在这种情况下是 Covid-19)治疗中实际应用。
让我们深入探讨,看看这是如何严肃、可复制的研究,展示了人工智能-人类(实际上还有人工智能-人工智能)协作科学的工作方式。
从“简单”应用发展到实现一个完整的 AI 实验室
尽管有一些先例,但这个新系统与之前任何事物都不同。其中最酷的一点是,它不是基于专门训练的 LLM 或工具;相反,它使用经过提示的 GPT-4o,使其扮演在研究团队中经常涉及的不同种类的人的角色。
直到最近,LLMs 在科学中的作用仅限于问答、总结、写作支持、编码以及可能的一些直接数据分析。有用,是的,但不是变革性的。这篇新发表在Nature上的虚拟实验室论文通过将 LLMs 从助手提升到相互之间以及与人类用户(带来研究问题,在需要时运行实验,并最终完成项目)进行结构化会议以探索、假设、编码、分析和迭代,从而改变了这一点。
这项工作的核心思想确实是要模拟一个由 AI 代理组成的跨学科实验室。每个代理都有一个科学角色——比如说,免疫学家、计算生物学家或机器学习专家——并且是从 GPT-4o 实例化出来的,具有通过精心提示工程打造的“人格”。这些代理由一个主要研究员(PI)代理领导,并由一个科学评论员代理监控,两者都是虚拟代理。
评论员代理挑战假设并指出错误,作为实验室的怀疑性评论员;正如论文所探讨的,这是工作流程中的关键要素,没有它,就会发生太多错误和疏忽,这对项目不利。
人类研究者设定高级议程,注入领域约束,并最终运行输出(尤其是湿实验室实验)。但“思考”(也许我应该开始考虑去掉引号?)是由代理完成的。
一切是如何运作的
虚拟实验室被赋予了解决一个真实且紧迫的生物医药挑战的任务:为 SARS-CoV-2 的 KP.3 和 JN.1 变种设计新的纳米抗体结合剂,这些变种已经对现有治疗产生了抗性。而不是从头开始,AI 代理决定(是的,他们自己做出了这个决定)突变现有的对祖先菌株有效的纳米抗体,但不再那么有效。是的,他们就是做出了这个决定!
由于所有交互都被跟踪和记录,我们可以确切地看到团队是如何推进项目的。
首先,人类只定义了 PI 和 Critic 代理。然后,PI 代理通过产生专门的代理来创建科学团队。在这种情况下,他们是一个免疫学家、一个机器学习专家和一个计算生物学家。在团队会议上,代理们讨论了是设计抗体还是纳米抗体,以及是从零开始设计还是突变现有的。他们选择了纳米抗体突变,理由是时间线更快且可用的结构数据。然后他们讨论了要使用哪些工具以及如何实现它们。他们选择了 ESM 蛋白质语言模型与 AlphaFold 多聚体结合用于结构预测,以及 Rosetta 用于结合能计算。对于实现,代理们决定使用 Python 代码。非常有趣的是,代码需要由 Critic 代理多次审查,并通过多次异步会议进行精炼。
通过会议和多次代码运行,制定了一个精确的策略,用于提出要测试的最终突变集。简而言之,对于阅读这篇帖子的生物信息学家来说,PI 代理设计了一个迭代管道,使用 ESM 通过对数似然比评分纳米抗体序列上的所有点突变,使用 AlphaFold-Multimer 选择顶级突变体来预测它们与目标蛋白质的复合结构,通过 ipLDDT 评分界面,然后使用 Rosetta 估计结合能,最后将评分结合起来,对提出的所有突变进行排名。这实际上是在循环中重复的,以根据需要引入更多突变。
由计算管道生成的 92 个纳米抗体序列在现实世界实验室中进行了合成和测试,发现其中大多数实际上是可生产和处理的蛋白质。其中两种蛋白质对其设计用于结合的 SARS-CoV-2 蛋白质产生了亲和力,无论是现代突变体还是祖先形式。
这些成功率与传统形式(即由人类执行)的类似项目相当,但它们所需的时间少得多。而且说出来很痛心,但我相当确信虚拟实验室总体成本要低得多,因为它涉及的人数要少得多(因此工资也少)。
就像人类科学家群体一样:会议、角色和合作
我们在上面看到,虚拟实验室如何模仿人类科学的发生方式:通过结构化的跨学科会议。每次会议要么是“团队会议”,其中多个代理讨论广泛的问题(PI 开始,其他人贡献,评论员审查,PI 总结并决定);要么是“个人会议”,其中单个代理(有无评论员)在一个特定任务上工作,例如编写代码或评分输出。
为了避免幻觉和不一致性,该系统还使用了并行会议;也就是说,相同的任务多次运行,使用不同的随机性(即在高温下)。有趣的是,这些几次会议的结果在单个低温合并会议中得到了浓缩,这个会议更加确定,可以相当安全地决定在所有来自各种会议的结论中,哪个更有意义。
显然,这些想法可以应用于任何其他类型的多代理交互,以及任何目的!
人类做了多少?
对于计算部分来说,出人意料地少——因为实验还不能如此自动化,尽管请继续阅读,以找到一些关于实验室中机器人的反思!
在这次虚拟实验室轮次中,LLM 代理撰写了总字数的98.7%(超过 12 万个标记),而人类研究人员在整个项目中总共贡献了 1,596 个字。代理编写了所有 ESM、AlphaFold-Multimer 后处理和 Rosetta XML 工作流程的脚本。人类仅帮助运行代码并促进现实世界实验。虚拟实验室管道在 1-2 天的提示和会议中构建,纳米抗体设计计算在大约一周内完成。
为什么这很重要(以及接下来会发生什么)
虚拟实验室可能成为根本新的研究模型的原型——实际上,它可能成为一种全新的工作方式,其中所有可以在计算机上完成的任务都实现自动化,而人类只需做出非常关键的决策。大型语言模型(LLMs)显然正从被动工具转变为积极合作者,正如虚拟实验室所展示的,它们可以从想法到实施推动复杂的多学科项目。
下一个雄心勃勃的飞跃?用机器人取代运行实验的人类技术人员的手。显然,下一个前沿是自动化与真实世界的物理交互,这本质上是机器人的本质。想象一下,将整个流程应用于研究实验室:
-
人类 PI 定义了一个高级生物目标。
-
团队对现有信息进行研究,扫描数据库,头脑风暴想法。
-
如果需要,一组 AI 代理选择计算工具,编写和运行代码和/或分析,并最终提出实验方案。
-
然后,机器人实验室技术人员,而不是人类技术人员,执行实验方案:移液、离心、培养、成像、数据收集。
-
结果流回虚拟实验室,闭环完成。
-
代理分析、适应、迭代。
这将使研究过程真正实现端到端自主。从问题定义到实验执行再到结果解释,所有组件都将由一个集成的 AI-机器人系统运行,人类干预最小——只需高级指导、监督和全局视野。
机器人生物学实验室正在被原型化。Emerald Cloud Lab、Strateos 和 Transcriptic(现在是 Colabra 的一部分)提供机器人湿实验室即服务。Future House 是一个非营利组织,正在构建 AI 代理来自动化生物学和其他复杂科学的研究。在学术界,一些自主化学实验室存在,其机器人可以独立探索化学空间。生物工厂使用可编程液体处理器和机器人臂进行合成生物学工作流程。Adaptyv Bio 在规模上自动化蛋白质表达和测试。
这种与新兴系统如虚拟实验室相结合的自动化实验室系统将彻底改变科学技术进步的方式。智能层推动项目,给那些机器人分配工作,其输出随后反馈到闭环发现引擎中的思考工具,该引擎可以 24/7 不间断运行,无需疲劳或安排冲突,并行进行数百或数千个微观实验,并快速探索对人类实验室来说根本不可行的广阔假设空间。此外,实验室、虚拟实验室和管理者甚至不需要物理上在一起,这允许优化资源分配的方式。
当然,也存在挑战。现实世界的科学是混乱和非线性的。机器人协议必须极其稳健。意外的错误仍然需要判断。但随着机器人和 AI 的持续发展,这些差距肯定会缩小。
最后的想法
我们人类一直自信,以智能计算机和机器人形式的技术将会把我们从高度重复的体力工作中解放出来,而创造力和思考将仍然是我们的专长领域,几十年甚至几个世纪都将是如此。然而,尽管有相当一部分自动化是通过机器人实现的,但 2020 年代的 AI 已经向我们展示了,在某些我们最需要脑力劳动的工作中,技术甚至可以比我们做得更好。
在不久的将来,大型语言模型(LLMs)不仅会回答我们的问题,或者仅仅在工作上给我们提供一些帮助。它们会提问、争论、辩论、决定。有时,它们还会发现新事物!
参考文献和进一步阅读
这里分析的 自然 期刊论文:
www.nature.com/articles/s41586-025-09442-9
AI 系统做出的其他科学发现:

浙公网安备 33010602011771号