电脑嗅觉革命:图神经网络如何解码气味世界

能否教会计算机识别气味?某机构正在尝试

12岁时,Alex Wiltschko购买了他的第一瓶香水Azzaro pour Homme。从那时起,他就对气味产生了浓厚兴趣。“这就是我的天性,”他说。他的另一个痴迷?计算机。“对香水和计算机的兴趣在青少年时期并不是社交成功的秘诀,”他补充道。

这种独特的兴趣组合使Wiltschko深入研究了嗅觉神经科学和尖端机器学习技术,将他推向了数字嗅觉这一新兴科学领域的前沿——也就是赋予计算机嗅觉能力。

Wiltschko现在是Osmo公司的首席执行官,这是一家源自某机构研究部门的初创公司,总部位于马萨诸塞州剑桥。2022年9月,该公司获得了6000万美元的初始资金,其中包括来自某中心Alexa基金的投资。

短期来看,Osmo旨在开启商业香料创新的新时代。长期而言,该公司设想其技术有潜力通过开发更好的驱虫剂,甚至通过检测人呼吸中的严重疾病来拯救生命。

主要气味地图

所有这些的基石是团队的突破性进展:创建了所谓的“主要气味地图”(POM)。

在视觉能够数字化之前,需要一种称为RGB的映射:它显示每种颜色如何由不同比例的红、绿、蓝组成。在Osmo分拆出来之前,Wiltschko的团队在气味方面做了类似且非凡的工作。他们使用机器学习将分子结构直接映射到人类如何感知该分子的气味。换句话说,他们建立了一个模型,只需观察分子就能告诉你它闻起来像什么。这就是POM。

“这对我们来说是一个‘顿悟’时刻,类似于通过了气味的图灵测试。我们构建了具有真正商业价值且经过充分验证的东西,可以将其带入世界,”Osmo首席产品官Jon Hennek表示。

创建POM的过程

以下是他们创建POM的方式,以及关键的是,他们如何证明它有效。他们首先使用来自几个香精和香料数据库的大约5000个分子训练了一个图神经网络(GNN)。所有这些分子的气味都有详细记录,带有多个人类判断的气味标签,如牛肉味、花香或薄荷味。由此,模型能够学习分子结构和气味之间的联系,而无需了解人嗅闻气味时鼻子或大脑中实际发生的情况。

关键问题是,POM能否推广到仅基于分子结构来预测它从未见过的分子的气味?它能否做到与训练有素的人类评估者一样好,这是气味表征的黄金标准?为了找出答案,团队选取了之前POM未见过的400多种气味分子的多样化集合,并让模型盲目预测它们的特征。然后一组训练有素的人类评估者嗅闻并标记了这些相同的气味。

当Osmo团队比较结果时,他们感到高兴。模型不仅成功预测了这些未见分子的气味,与训练有素的人类一样好,而且其预测的气味特征比任何单个小组成员的结果更接近小组的平均结果。

气味之岛

POM不是典型意义上的地图,但仍然可以与RGB地图相比较。在二维颜色地图上随机选择两个点。这两个点越接近,颜色越相似。对于POM中的气味也是如此,尽管这个地图存在于令人费解的256维中。例如,所有闻起来像郁金香的分子彼此靠近。同样,白兰地气味的分子也是如此。

“稍微放大一点,所有的花都彼此相邻。在这个气味地图中有一个完整的花卉泛大陆!我们没有告诉它这样做,”Wiltschko说。这种分组对于木材、面包店类型的气味、酒精气味等也是如此。我们的大脑似乎以嵌套的层次结构组织气味,Wiltschko说,所以玫瑰气味在玫瑰类别内,在花卉类别内,在植物类别内,在愉快类别内。

“我们能够在没有告知POM的情况下观察到这一点,真是令人惊讶,”他说。

商业应用

虽然Wiltschko对Osmo技术的未来有大胆的想法,但首要任务是将公司建立在坚实的商业基础上。目前,Osmo正专注于为全球香料类别开发新成分。

Osmo团队正在使用POM探索气味分子的世界——其中有数十亿个——并专注于POM预测具有有趣且强烈嗅觉特征的分子。

“我相信,我们在这方面比世界上任何人都做得更好,”Hennek说。“因为我们不是从经验法则和化学直觉开始,而是从对我们可能合成的每个分子的气味预测开始。它让我们找到化学家可能从未考虑过的分子。”

该团队正在与顾问合作,包括法国调香大师Christophe Laudamiel,潜在客户包括香料公司和包装商品公司。

“我们反复收到反馈,我们的成分有潜力在商业上非常成功,”Wiltschko说。“这闻起来像是产品/市场契合。”主要想法是将这些分子授权给香料公司。

这是一项及时的努力。全球香料类别价值超过100亿美元,并且稳步增长。但一些传统成分,如檀香油,可能导致过度采伐或其他生态危害,而随着对更安全、更可生物降解产品需求的增长,其他成分的特性越来越不足。

借助POM,Osmo正在为安全、合成香料的调色板铺平道路,这些香料使用环保且易于合成的分子重现自然气味。为此,Osmo正在研究仅由少数几种原子组合:碳、氢、氧、氮、磷和硫。

“然后我们将它们带入我们的实验室,进行类似于药物发现流程的过程,”Hennek说。“我们正在努力获得这些分子的监管批准。”

图神经网络的兴起

所有这一切在大约六年前才成为可能。Wiltschko说,启动这个科学项目的核心见解是,由于最近图神经网络(GNNs)的兴起,机器学习在“分子方面变得非常擅长”。

以前,机器学习方法主要将输入——比如图像或数据数组——转换为矩形或数据网格进行处理。分子不适合这种模式:一个分子可能有两个原子,或者可能有20个原子,具有完全不同的结构和连接性。它们根本不能简化为矩形或网格。

相反,分子中的原子可以被视为节点,它们之间的化学键可以被视为边,形成图结构。这种表示允许GNN建模和处理分子数据。

“其中一些技术是由我在某机构的朋友开发的。所以,这是一个探索这个想法的绝佳肥沃土壤,”Wiltschko说。

拯救生命的潜力

以蚊子为例。POM能否用于找出什么气味能驱赶这些携带疾病的昆虫?

为了找出答案,他们用额外的数据源增强了POM。第一个是一份被遗忘已久的美国政府报告,发表于1940年代,其中包含测试19,000种化合物的驱蚊效果结果。第二个是TropIQ提供的信息,这是一家开发疟疾控制技术的荷兰公司。增强的模型很快就能预测出具有至少与避蚊胺(最有效驱蚊剂中的活性成分)一样强大驱避性的全新分子。

开发更便宜、更有效、更安全的驱虫剂可能对全球健康产生巨大影响。Wiltschko尚未有任何宣布,但表示这项研究正在与比尔及梅琳达·盖茨基金会合作进行。

Hennek说,将POM应用于蚊子也是一个概念验证。“我们可以设想将我们的产品不仅应用于蚊子不喜欢的东西,而且应用于蟑螂不喜欢的东西。或者任何数量的农业害虫。”

展望未来

展望未来,Wiltschko的愿景是数字化我们的嗅觉。这个想法并不像听起来那么牵强。考虑几百年前。一个视觉瞬间——你孩子脸上转瞬即逝的表情或一片盛开的苹果园——可以被即时捕捉并以完美的颜色永远保存下来的想法,简直是不可思议的魔法思维。

到1820年代,出现了第一张照片,随之而来的是人类掌握光世界的第一步。今天,冻结那些视觉记忆并永远保存它们感觉像是一项基本权利。听觉世界也是如此。

“我们知道数字化人类感官需要什么,”Wiltschko说。“我们不必等待视觉所做的任何发明——特别是集成电路。”

事实上,凭借现代计算能力和机器学习的利用,Wiltschko估计计算机将在一二十年内拥有“嗅觉”。需要三个阶段:“读取”气味、理解它和“写入”它。Osmo希望理解并最终策划一个广泛的安全合成分子调色板,可以重现整个人类气味景观。目前,读取(传感)有气味分子需要笨重且昂贵的实验室设备,如气相色谱质谱仪,而按需写入(产生)气味在消费者层面仍然是科幻小说,Wiltschko说,目前如此。

通往内部的窗口

Wiltschko说,高水平的传感和理解气味可能足以带来强大的健康应用。例如,众所周知,包括某些癌症在内的严重疾病可以通过它们对你呼吸的影响来检测。能够捕捉该气味特征的快照——用Wiltschko的话说是“气味图”——可以揭示我们体内发生的大量情况。

“我们不知道这项技术最终是否会对医疗保健产生变革性影响,但我打赌它会的,”他说。

对Wiltschko来说非常重要的是,在未来,Osmo能够成长并开发临床诊断应用。“对我来说,这是北极星,到达那里非常重要。但所需的纯粹成本和人才是稀有且昂贵的,”他说。“所以,它不能是我们攻克的第一个海滩。”

随着Osmo的成长,它将寻找同样热情的人来推动使命向前发展。“我们发现,有一些人是秘密的气味爱好者,他们 secretly渴望在机器嗅觉领域工作,”Wiltschko说。“只是提一下:有一个地方可以做到这一点,那就是Osmo。”

与Wiltschko和那些受启发与他一起工作的人交谈,可以清楚地看到Osmo是他毕生热情的结晶。对他来说,这是情感上的。“一旦你闻到某种东西,你就无法停止从中获得的感觉。有一个非常基本的感觉和情感成分,”他说,“我认为这很美。”
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

posted @ 2025-10-20 09:31  CodeShare  阅读(6)  评论(0)    收藏  举报