菲尔兹网络科学实验室笔记-全-

菲尔兹网络科学实验室笔记(全)

001:细胞计算与学习 🧬

在本节课中,我们将要学习细胞如何像微型计算机一样,在复杂多变的环境中处理信息、形成记忆甚至进行学习。我们将探讨细胞内的生化网络如何实现这些看似需要大脑才能完成的功能。

细胞感知的复杂性

上一节我们介绍了细胞在复杂环境中面临的信息挑战,本节中我们来看看细胞感知信号的具体机制。

细菌会留下一种化学信号,中性粒细胞会追踪这种信号。但同时,它也会面临环境中其他细胞释放出的所有相互冲突的信号。

因此,如果世界对中性粒细胞来说也是复杂的,并且充满了许多不同且相互冲突的信号,那么对于单个细胞来说,如果遵循这个逻辑,即使是细胞也需要拥有某种形式的记忆,或者能够预测或预见环境中将要发生的事件,并能够做出相应的反应。

不同尺度的计算网络

上一节我们讨论了细胞感知的复杂性,本节中我们来看看不同生物组织层次上的计算网络有何异同。

我们有两个不同层次的组织:一方面,老鼠使用神经网络进行高度复杂的计算;另一方面,细胞只有基因和蛋白质网络。那么,这两种网络如何能够实现这些看似相似的计算呢?

如果我们观察神经科学,我们试图解释这些行为的方式是:我们有一个非常复杂的外部世界,然后神经网络会构建一种内部模型,它从环境中提取重要的原理或统计数据,并利用这个内部模型来指导行为。

但是,如果我们观察经典细胞生物学,我们如何看待细胞呢?我们通常认为细胞是非常简单的机器,只将刺激与反应联系起来。在我看来,这是因为细胞生物学实验通常在非常简单的环境中进行,所以你用一个恒定信号刺激细胞,细胞只看到一点信息:信号存在或不存在。如果我的环境是恒定的,那么我不需要任何记忆或学习就能在这个环境中生存。另一方面,如果你的环境是完全随机的,记忆和学习同样没有任何好处,因为环境中没有任何东西可以提取。只有当我的环境中的信号具有某种规律性时,处理环境信息的生化网络(在这种情况下是蛋白质网络)才需要某种形式的记忆、信号整合或学习,以应对它所生活的世界。

研究问题与理论框架

上一节我们比较了不同尺度的网络,本节中我们来看看本课题组提出的核心研究问题及其理论框架。

我们课题组提出的问题一方面是:细胞计算有多复杂?具体来说,蛋白质相互作用网络能进行哪些计算?如果我们能够提取这些计算的一些动态原理,我们希望在理论基础上看看这些计算规则是否也能向上扩展,并应用于神经网络层面,以及生物系统中不同组织尺度上发生的这些生物计算之间是否存在任何相似性。

从理论角度来看,我们如何看待计算的通用框架,正如我们昨天和今天多次听到的,是基于吸引子的计算框架。我们有一个网络,它可以是神经的或生化的。在数学或理论上,我们通常理解这个网络或其每个节点的动态如何随时间变化。我们有很多理论,所以我们可以计算这个网络所有可能的解。正如尤里卡昨天展示的,我们可以有这些由鞍点或不稳定不动点分隔的稳定不动点,也可以有更复杂的解,如振荡或混沌解等。但总的来说,我们如何看待计算是:系统随时间演化,并被吸引到其中一个稳定解。因此,重要的是网络中的这些渐近或长期稳定解。

巴特为神经网络很好地阐述了这一点,但我们对单细胞生化网络的思考方式也是如此:当系统从环境中接收到信号时,随着时间演化,系统从一个稳定状态切换到另一个稳定状态。这就是我们所知道的或称之为网络的计算。然后,每个状态都与系统的特定行为相关联。

验证理论:以EGFR网络为例

上一节我们介绍了基于吸引子的计算框架,本节中我们通过一个具体例子来验证这个框架是否适用于生化网络。

我们想了解这个计算框架是否也适用于生化网络,从一个非常简单的问题开始:当信号随时间变化时,单细胞如何感知信号?细胞通过跨膜受体蛋白实现这一点,环境中的化学信号与这些蛋白结合,激活蛋白质,进而激活整个生化网络,这决定了网络的响应特性。

我们特别选择了一种受体进行研究:表皮生长因子受体网络是一个典型的致癌基因。几年前,我们确定了这个蛋白质相互作用网络中调节动力学的关键最小组件。由于我们对该网络有详细的生化知识,我们也能理解其动态特性。这个网络,也许你已经可以看到,它有一个双重负反馈和自催化激活。从理论上讲,这是经典的可以产生双稳态的系统。

在这个系统中,这取决于膜上的EGFR浓度或受体浓度。因此,对于膜上特定的受体浓度,系统可以处于基础EGFR磷酸化状态或高蛋白活性状态。如果我们从这个景观的角度思考,这两个解都是稳定的,它将是一个有两个势阱的景观:一个势阱是基础活性,另一个势阱是高活性状态。

那么,如果系统被组织成或具有——如果细胞具有对应于这种双稳态组织的EGFR浓度——这意味着什么?通过模拟很容易预测,即使只给它一个生长因子的单脉冲,系统也会从基础状态切换到高活性状态。移除脉冲后,系统保持在这个状态,因为它是一个稳定的吸引子。因此,在某种程度上,系统具有一种永久记忆的形式。

这意味着如果你在系统中添加其他信号,细胞将无法响应,因为它已经处于激活状态。所以它不再关心环境中是否有其他信号进来。

实验验证与发现

上一节我们通过模拟预测了双稳态系统的行为,本节中我们来看看实验验证的结果及其意义。

我们决定也通过实验来测试这一点。我们做的实验是将单细胞(通常使用上皮细胞)放置在微流控装置中,在那里我们可以从外部施加任何不同频率的复杂信号,然后我们用荧光标记单细胞中的蛋白质,这样我们就可以记录它们的位置和活性。

我们进行了扰动实验。正如我所说,由于我们知道网络拓扑结构,如果你过表达受体或敲低其他组件之一,我们可以确保系统恰好组织在这个双稳态区域。

当我们每30分钟用5分钟的化学信号刺激细胞时,我们看到的情况与模拟中看到的非常相似。受体活性随着第一个脉冲增加,所以你从基础状态切换到激活状态,然后系统保持在激活状态,无论系统看到多少信号。这意味着,如果我的世界是动态的,并且我有一个来自稳定吸引子的长期记忆(系统被固定在一个稳定吸引子中),那么细胞将无法整合信号,也无法响应环境的变化。因此,它具有鲁棒性,但不具备灵活响应其他信号的能力。这实际上是致癌情况下的情形。在大多数情况下,如果我们的突变是典型的乳腺癌突变,最典型的突变就是受体过表达,所以系统恰好处于这种双稳态区域,或者在另一侧处于高活性区域,这意味着受体持续激活,持续发出信号,细胞持续增殖。所以这不是一般情况,或者说,这不是细胞在环境中响应变化的化学信号时发挥功能的方式。

但这些非常简单的实验也表明,我们关于系统在环境信号作用下只是在吸引子之间切换的思维方式存在局限性,因为我们看到这无法解释当信号随时间变化时细胞如何处理信号。

临界态与瞬态记忆

上一节我们发现了双稳态模型的局限性,本节中我们来看看一种更优的动态组织方式——临界态。

与伊恩刚才展示的非常相似,我们从模型中提出,对细胞来说最优的实际上不是处于这种双稳态区域,而是恰好处于这个临界转变点。在这种情况下,它是一种不同类型的动态分岔——鞍结分岔。但如果系统靠近这个转变点,也就是说,如果它的EGFR浓度对应于这个区域,这将对应于细胞(在这种情况下是受体)激活的能力:当你移除信号时,系统将暂时保持激活状态,因此它将具有记忆,但这将是一种瞬态或暂时性记忆,然后受体活性将重置,这将允许细胞对每个新信号再次激活。基本上,细胞同时具有稳定性的特性(因为你在一段短暂的时间内保持激活状态)和重置的能力,从而能够响应环境中变化的新信号。

当我们测量单细胞中蛋白质的活性时,这只是来自一个单细胞的例子:当你给予生长因子脉冲时,蛋白质激活;当你移除脉冲时,蛋白质保持激活状态一段时间,然后重置。

这种记忆实际上平均在40到50分钟的量级。所以,如果你考虑底层的磷酸化-去磷酸化过程,这是亚分钟级的,而这种记忆是在一小时或更长的量级,这意味着系统获得了一个额外的时间尺度,在这个尺度上它可以保留它之前看到过信号的信息。

这种记忆的持续时间不取决于你是刺激5分钟还是刺激1小时,记忆的持续时间是系统的固有属性。

我们已经证明,受体网络(我在这里以EGFR为例)具有这种特性,但我们也证明这是整个受体酪氨酸激酶家族的典型属性,不仅仅是这种分子。它们似乎具有临界组织的特征,因此它们非常靠近这种动态转变点,正因为如此,它们具有这种瞬态记忆的涌现特性。这种瞬态记忆给系统带来了一个额外的好处,即它获得了这种慢时间尺度。基本上,现在系统拥有许多不同的时间尺度,它可能用于计算,而这仅仅是因为系统恰好位于这种动态分岔点附近。

细胞为何需要记忆?

上一节我们介绍了细胞在临界态下获得的瞬态记忆,本节中我们来看看细胞为什么需要这种记忆。

那么,问题当然是,细胞为什么需要记忆?在我们的身体或任何系统中,有许多情况细胞实际上必须在复杂的环境中迁移很长的距离,穿梭于许多细胞之间。这是斑马鱼胚胎发育中的一个例子,如果你看过视频或仔细观察,你会看到细胞朝这个方向迁移。它可能会感到困惑,所以它会向下走,但最终会重置,并继续向上移动。

如果我把这画成示意图,这意味着:我是一个细胞,我需要长距离移动。例如,在发育过程中就是这种情况,但在伤口愈合过程中也会出现同样的问题。你必须在非常拥挤的组织中移动,你只受到局部信号或细胞分泌的化学物质的引导。这些信号会有噪声,会被干扰,它们会出现和消失。因此,细胞的典型迁移模式是,它们以随机游走的模式迁移。当信号从一侧传来时,它们会极化并向信号方向移动。

所以,如果我只在看见或感知到信号时才定向移动,并且当信号中断时立即开始随机游走,那么细胞将永远无法实现这种长距离迁移。然而,如果细胞有记忆:好的,我朝这个方向移动,我的信号消失了一会儿,但我会继续朝同一个方向移动,那么细胞实际上可以度过信号中断的时期。但同样,这个记忆,类似于我刚才提出的问题:如果我在记忆期间出现另一个信号,那么细胞应该能够感知到这一点,并且应该能够重新调整其迁移方向。所以,这又是平衡两个对立特性之间的属性:你必须具有鲁棒的迁移能力,以度过这些中断和嘈杂的时期,但你也需要保持灵活性,以适应环境中的新变化。

实验验证:细胞导航

上一节我们探讨了记忆对细胞迁移的重要性,本节中我们通过实验来验证细胞如何利用记忆在动态环境中导航。

我们将同样的细胞放入微流控装置中,在那里我们从外部产生化学梯度,我们使这些梯度动态变化,并在一段时间后将其洗掉。梯度来自左侧,细胞会极化,开始向梯度方向移动。当我们移除梯度时,细胞继续向梯度方向移动,同样平均持续40到50分钟。当它失去这种记忆时,它将开始随机游走迁移。

因此,细胞需要这种记忆,以便能够继续朝着先前看到的信号方向迁移。然而,这种记忆在你移动于复杂环境中时将非常重要。所以,如果你有一个来自左侧的信号并且它中断了,如果细胞在信号中断时立即开始随机游走迁移,那么它将无法进行长距离迁移。

我们做了实验,我们从左侧施加信号,然后中断它。但当系统仍处于这个记忆范围内时,我们从同一侧再次建立信号,然后我们再次中断它,当系统仍在记忆期内时,我们将信号切换到相反的一侧。所以我们想看看细胞是否真的能够整合所有这些信息。

细胞确实做到了:它们开始向左移动,我们中断信号,它们有记忆,所以它们继续朝同一方向移动。我们再次中断信号,并将其切换到相反的一侧,即使细胞处于记忆期内,它也能感知到:哦,现在我这侧没有信号了,但另一侧现在有信号了。所以细胞重新极化,并开始追逐相反一侧的信号。当我们关闭第三个信号时,细胞仍然对该信号有记忆,当它们失去那个记忆时,它们才开始随机游走迁移。

这是一种工作记忆的形式,与你在神经系统中拥有的工作记忆非常相似,因为你随时间存储信息,但你仍然对其他信号保持响应。我们在这里论证,细胞也利用一种分子记忆的形式,以便在环境信号不断变化时进行导航,这对于能够在环境变化和嘈杂时实现鲁棒迁移,同时又能灵活适应这些变化之间的平衡非常重要。

单细胞学习:习惯化与敏感化

上一节我们看到了细胞如何利用记忆导航,本节中我们进一步探讨单细胞是否具有更高级的学习能力。

我们想,好吧,如果细胞具有基本形式的记忆,那么是否也能在单细胞水平上寻找学习的特性?那么,如何思考生化网络中的学习,因为它们不等同于神经网络?我们没有突触变化和连接可塑性,我们所有的连接都是明确定义的。但这也不是一个新问题,有实验,我认为这甚至是第一个实验,由美国生理学家詹宁斯在1907年完成。他取了一种叫做喇叭虫的单细胞生物,它是一种纤毛虫,形状像这样。他表明,如果你用珠子刺激纤毛虫,它会经历一系列定义明确的行为模式:如果你用珠子刺激它,首先它会试图避开;如果珠子继续来,第二步它会逆转纤毛,试图吐出颗粒;如果这没有帮助,它会收缩,最终会脱离。所以它经历了这个真正定义明确的行为序列,这表明它们可以根据先前的经验调节它们的反应。除此之外,他还表明,喇叭虫可以表现出一种非常基本的非联想学习形式,即习惯化。在不同的条件下,当你用脉冲刺激纤毛虫时(在这种情况下,只是暂时添加这些珠子),如果珠子对系统没有害处,只是令人讨厌,系统会做什么?喇叭虫的反应会下降,所以在某个时刻它决定:哦,好吧,这很烦人,但不会伤害我,所以它实际上停止了收缩。

这个实验最近在哈佛大学的杰里米·古纳瓦德纳小组中得到了重现,这也引发了一系列理论工作:好吧,我们是否有生化或最小的生化网络基序,实际上可以表现出这些基本的学习形式,比如习惯化?

但在这一类非常基本的学习形式中,几乎还有相反的一种,那就是敏感化。这种情况是,在重复呈现刺激后,系统实际上表现出反应特性的增加。例如,如果你摩擦双手,它们会开始变暖,你会开始感到疼痛,但过一会儿就消失了。这是因为你重复这种刺激,神经系统被激活,所以你得到这种反应增加,你感到疼痛,持续一段时间,但然后你就失去了它。然而,即使我们尽力寻找,我们也没有发现有一个机制模型可以解释敏感化是如何发生的,即使对于神经网络也是如此。敏感化非常有趣,因为它也经常从进化角度被讨论,认为它是一种支持生存的机制。所以,如果你有一个信号在环境中重复出现,你可能会想:哦,这可能是有害的,所以你增加你的反应能力,以便能够在这个环境中适当地生存。

实验验证:上皮细胞的敏感化

上一节我们介绍了单细胞学习的概念,本节中我们通过实验来观察上皮细胞是否表现出敏感化。

所以我们想,好吧,我们拿我们研究的单细胞网络和上皮细胞,看看它们是否具有这些基本的非联想学习形式。我将向你展示敏感化的例子,但我们也研究了习惯化。正如我提到的,敏感化具有这样的特定特征:当你重复刺激时,你会看到反应增加,但这还不是全部。另外,如果你暂停信号一段时间再给予,系统会表现出相同幅度的反应;但如果你暂停更长时间再呈现刺激,系统已经重置了。所以这是一个瞬态过程,你必须经历相同的行为序列来重新学习行为。

如果这是一个神经系统,我们会想:好吧,我有环境中信号的一些统计数据,系统需要形成一个内部模型来提取关于环境的信息,并产生这种复杂行为。但在这种情况下,我们只研究单细胞,所以我们的假设是:单细胞的内部表征是通过生化网络中的瞬态动态或这些动态状态产生的,细胞利用这些动态状态来提取因果影响,在这种情况下是形态行为。所以,我们能想到的最简单的行为是细胞形状的变化。

我们进行实验,再次在微流控装置中用生长因子脉冲刺激细胞,脉冲具有一定持续时间。我们记录单细胞中的蛋白质活性,以了解生化网络如何编码这些信息,然后我们也量化相对于这些反应的形状变化。这是细胞的例子,我希望你能看到,当你看到一些绿色闪光时,这实际上是我们传递这些脉冲的时候,你会看到形态发生了这种连续的变化。

如果我们量化形态的变化,我们进行一分钟的脉冲,脉冲间隔三分钟。当我们观察细胞形状周长的变化时,我们看到反应或形态变化的幅度有所增加,并且它们以振荡模式的形式响应。当我们传递最后一个脉冲时,我们看到细胞在一段短暂的时间内保持这种强烈的形态变化,然后重置。所以你有了这些基本形式,对应于反应增加的非联想学习、一种暂时记忆的形式,以及系统重置。如果我们同时观察蛋白质动态(在这种情况下,我们测量受体的活性),我们看到在细胞的内部表征中也看到了类似的特征:受体激活方面有这种爬升活性,你看到这种维持的瞬态活性,然后系统重置。

这还不是全部,我们还看到系统实际上具有更复杂的特征,比如频率敏感性,这意味着更频繁的刺激会导致更快速和更明显的反应增加,这也是——或者恰恰相反——是已定义的习惯化的标志之一,但实际上甚至没有人定义敏感化的反应特性。所以,这是我们从单细胞中能够推导出的敏感化特性之一。尽管这是一个非常简单的例子,我认为它表明即使是单细胞中的生化网络也可以具有非常基本的形式,在这种情况下是非联想学习。

记忆与学习的动态机制

上一节我们观察到了细胞学习的现象,本节中我们从理论角度深入探讨其背后的动态机制。

对我们来说,主要来自理论背景,理解这些生化或简单生化网络中实际导致记忆和学习的特征当然很重要。我提到这种记忆的产生是因为网络组织在接近这种动态分岔点附近。我们从动力系统理论知道,如果系统位于鞍结分岔点附近,当你给予信号时会发生什么?你实际上改变了这个景观。这个景观不是固定的。当你从这里开始时,系统只有一个稳定状态,即一个势阱。当你给予输入时,这个景观发生变化,系统进入高活性状态。当你移除信号时,你将景观改回基础活性状态的单一势阱。但是因为你靠近这个动态转变点,你在这个景观中有一个区域,在那里你从三面下来,只从一面离开。在这个景观中,表面略微倾斜,因为它几乎是平坦的,你将在这个表面上缓慢移动。这在动力系统中被称为鬼影集,它是一种鬼影:你曾有一个激活状态,这个状态不再稳定,但系统保留了这个激活状态的某种鬼影,所以你开始沿着这个缓坡向下移动,这减慢了速度。这就是为什么系统获得这种记忆,并且它获得的时间尺度比底层过程的时间尺度长一个数量级,然后系统基本上会掉下来,它会重置。

在这个系统中,当然很容易识别,因为我们研究的是一个最小的网络基序,我们知道或测量了所有参数,所以我们可以详细建模。但是,如果你有一个大规模网络,你将如何识别呢?我们最近对这种鬼影集进行了这种概括。基本上,对于任何网络,你都可以定义一种李雅普诺夫函数的形式(在这种情况下,我们使用了网络的动能),你可以将其最小化。如果动能为零,这将给出你的不动点;但如果动能接近于零,将给出这个景观中相对平坦的区域,因此将能够识别这个鬼吸引子集的范围。因为动能接近于零,系统仍然可以线性化,所以你可以在局部计算系统的特征值。如果你看最大特征值,这个最大特征值有一个从负到正的梯度,这引导了流动。所以,如果你有系统的轨迹,该轨迹将直接通过或穿过这些鬼影集。这些鬼影集的帮助在于,尽管系统远离任何稳态,但它们能够引导系统中的流动以及系统将如何随时间发展。

噪声鲁棒性与计算

上一节我们介绍了鬼影集的动态机制,本节中我们探讨这种机制在噪声环境下的鲁棒性及其对计算的意义。

由于这在形式上不是一个稳定状态,当然问题是:这对噪声稳定吗?因为我们在细胞中观察到的当然是生化网络本质上是嘈杂的。那么,即使系统中有噪声,我们是否仍然能够观察到这种准稳定动态?我们在模拟中所做的是增加噪声强度,并估计系统在这些鬼影集中的捕获时间。对于最小模型,你甚至可以解析地做到这一点。但我们看到的是,这种捕获时间或你在鬼影集中停留的时间(即记忆有多长)实际上在高达非常高的噪声强度下都非常稳定。从实验中,无论是从EGFR还是我们测量网络中的其他蛋白质,我们都能够估计噪声。这当然不仅代表技术噪声,还代表生物噪声的混合。但我们在实验中的噪声水平在10-3到10-2之间,这可能也是为什么我们实际上能够在单细胞测量中观察到这种记忆。但最重要的信息是,位于这种动态转变点附近的网络,它们也可以利用这种鬼影集来实现这些长瞬态的出现,并且这些长瞬态对噪声具有鲁棒性。这是如果你想进行任何有意义的计算时的一个重要特征:当然,你用来进行计算动态对象需要对噪声具有鲁棒性。

学习如何发生?

上一节我们讨论了噪声鲁棒性,本节中我们回到学习发生的具体机制。

学习是如何发生的呢?嗯,这又是系统位于鞍结分岔点附近的混合结果。正如我提到的,这给了系统一个慢时间尺度。但同样非常重要的是要记住,当我们有动态信号时,发生的情况是这些景观不断重塑。当系统在分岔点组织时,它只有一个不动点,那就是这里的不动点。但是当我们在模拟中给予刺激时会发生什么?你看到这个数字——所有这些方块都是系统中出现和消失的不同不动点——你得到的是这种慢点漏斗。系统开始随着信号移动,因为它想要达到高活性稳态,但你移除了信号,所以你重塑了轨迹;轨迹开始返回或试图返回不动点,但它在这组慢点上移动。因为它移动缓慢,当另一个信号到来时,它还没有到达不动点;当另一个信号到来时,它被向前推,所以实际上它可以产生这种爬升活性。因此,这组慢点,除了给系统记忆外,还使得在重复信号时能够产生这种爬升活性。所以,这种靠近动态分岔的组织对细胞很重要,因为它使它们能够感知随时间变化的信号,因为它们获得了一种动态记忆,而且这种慢动态对系统产生爬升活性也很重要,从而具有这种基本的敏感化形式。这里需要提及的一个非常重要的维度是,在整个信号整合过程中,系统实际上保持远离静态状态。因此,计算在形式上是利用系统的瞬态完成的。

迈向新的数学框架

上一节我们总结了学习发生的机制,本节中我们探讨这些发现如何促使我们改变研究网络的数学框架。

我们认为,或者我们想论证,我们也需要改变数学框架,以研究受时变信号刺激的网络。我们需要从自治系统描述(我们仅通过网络拓扑和系统具有的稳态数量来定义系统属性)切换到非自治系统描述,其中环境或外部信号是系统的一部分。因为正如我向你展示的,当我们的信号随时间变化时,稳态的数量和位置可以改变,所以它们在形式上甚至不再代表系统的解。但你可以证明,存在一族解算子,其中系统的解现在是轨迹。因此,在形式上,动力系统的轨迹将是解,我们需要描述受时变信号作用的动力系统的响应。

鬼影集的形式定义与复杂结构

上一节我们提出了转向非自治系统框架的必要性,本节中我们更正式地定义鬼影集并探讨其可能形成的复杂结构。

考虑到我们已经发现了这些鬼影集,或者细胞利用这些鬼影集来拥有记忆和基本的学习形式,我们继续更正式地定义这些鬼影集。定义与尤里卡之前向你展示的非常相似:如果我们有一个有界闭集,不包含任何半轨,并且重要的是在时间上,你可以定义这个鬼吸引子集的吸引域,轨迹进入其中,停留一段时间,然后可能离开。但如果你这样正式定义它,那么很容易看到,你可以在相空间中拥有更复杂结构的鬼吸引子集。基本上,你可以排列它们,使得系统进入其中一个鬼影集,停留一段时间,然后落下并进入下一个鬼吸引子集。所以基本上,你可以产生这种鬼影集通道,或者你可以将轨迹循环回来,产生一个鬼影集循环。例如,一个这样的鬼循环的动态会是什么样子?我们在这个情况下做了非常简单的几何模型。

但你看到的完全一样:系统的轨迹停留在一个鬼影集上,然后非常迅速地转换到第二个,它会停留一段短暂的时间,然后转换到下一个,依此类推。所以你得到了一个非常可靠的顺序切换动态,即使在你增加噪声时也能保持。是的,这类似于通过咖啡因设计因子产生类似大规模稳定行为的设计。

属性不会等价,因为在这里你在一个吸引子中停留多长时间是鬼影集的属性,而在那种情况下,如果你只是依赖噪声,你无法控制。是的,所以这可以说,对于计算来说,这是可靠的,相比之下,如果你只依赖系统的噪声,噪声水平……可能有一些,对吧?我们只做了这个,或者系统有多鲁棒,这只是加性高斯噪声,没有别的,只是噪声,是的,是的,是的。

所以这正是我刚才说的:系统停留在一个鬼影集上,然后跳到下一个,再跳到下一个,所以你可以永远循环下去,因为它们以这样一种方式排列,我们总是在不同的鬼吸引子集之间切换。

你可以量化这一点。例如,你在这个鬼循环上得到的周期在高达非常高的噪声强度下都非常可靠。在鬼影集附近的捕获也非常可靠,这来自单个鬼影集的属性。对于这种顺序切换动态,我们昨天也听到了一些报告,非常重要的一点是:你在一个短暂的时间内保持行为稳定,但然后你非常迅速地切换到下一个。我们再次看到,这种长时间停留和非常快速切换之间的差异也能保持,并且不会被噪声破坏。

与神经编码的类比

上一节我们看到了鬼影集可以形成复杂的顺序动态,本节中我们探讨这与神经系统中观察到的顺序编码有何相似之处。

对我们来说,这非常类似于你在神经元群中看到的顺序切换。这只是众多实验论文中的一个例子,这是在味觉皮层中编码不同味觉的例子,他们测量了神经元活动,然后你看到对于每种不同的味觉,你看到的是顺序切换活动模式。所以,当你重复相同的刺激时,发生的情况只是当系统进入下一个序列时,你可能会有轻微的变化,但序列和序列的顺序保持不变。对于不同的味觉,编码是通过不同的序列实现的。这表明,神经元信息编码,特别是对于这种顺序切换活动模式,可能通过神经元中产生的鬼影集发生。

鬼影支架的计算能力

上一节我们类比了神经编码,本节中我们进一步测试鬼影支架的计算能力。

我们想更多地测试这一点,所以我们想测试这些鬼影支架的计算能力是什么。我忘记提到的是,我认为当时间也是方程的一部分时,利用准稳定瞬态(例如来自鬼影支架的那些)进行计算将很重要,因为你需要在一段短暂的时间内记住某些东西,或者你必须随时间整合信息。因为这些是你必须在鲁棒性和可塑性之间取得平衡的例子。我们查阅文献,看看关于神经网络如何编码感知时间是如何描述的。我们在参考文献中发现,当然这对生命系统非常重要,但我们在参考文献中发现,在神经科学中如何教授的是:计时是一种涌现的内在计算。所以它不是大脑中的特定回路,而是来自网络固有动态的涌现特性。

通常如何测试这一点,类似于我们昨天看到的一些任务,是这些在灵长类动物中进行的非常基本的工作记忆任务之一。你给猴子一个线索,你测量并在这里加权,前两个信号。所以猴子必须记住这个时间间隔,然后你等待一个延迟期,然后你给它们一个线索,它们应该,例如,在它们记住的时间间隔后准确地按下一个按钮。

训练神经网络执行计时任务

上一节我们提出了鬼影支架可能用于时间编码,本节中我们通过训练一个小型神经网络来执行计时任务,并观察其内部动态。

我们想训练一个最小的神经网络,在这种情况下,我们使用门控循环单元,以便能够……我们有意决定使用一个非常小的网络,即一个三组件网络,因为我们想知道我们是否能理解网络如何编码关于时间间隔的信息。你可以非常高效地训练这个网络来执行任务。但是,因为这是一个非常简单的网络,你可以看到网络动态在训练过程中实际是如何变化的。

你从一个单一稳态开始,在不同的训练周期中,你看到系统实际上产生了双稳态行为。但在训练结束时,系统位于分岔点附近。所以这个神经网络为了能够编码这个复杂任务,它找到了接近动态分岔点是最优的解决方案。是的。

所以你说你的训练,是的,整个,不是,不是,是的,我们改变,是的。不,抱歉,所以它是一个门控循环单元网络,所以每个节点由三个变量表示,你可以重新映射它,它是一个离散系统,但你可以将其映射到时间连续系统。所以基本上,它是每个节点的某种活动。

然后,因为我们非常接近动态分岔,这与我们之前在单细胞中看到的非常相似。所以我们使用了完全相同的特征,我们之前定义的:网络中的这种动能近似,我们看到网络具有的这种慢点云,然后在这片云中你也可以计算特征值。这是最大特征值,我们看到系统只有一个不动点,这也是我们从网络组织中求解出来的。在这里,我们看到特征值从负到正的分布,这暗示了这片慢点云实际上是一个鬼影集。当你观察网络实际如何工作时,当我们给予信号时,轨迹持续停留在这片慢点云中。所以当你给予信号时,你把它移开,它又回来。实际上,网络必须编码并可能重现的这个时间间隔对应于轨迹在这片慢点云中移动的距离。所以网络所做的,或者至少我们目前的理解是,它在训练过程中塑造了这片慢点云,然后对于你需要记住的不同间隔或不同的延迟,你最终会到达这片慢点云上的不同位置,这决定了或者这是网络记住这个时间间隔的方式。再次,我认为对我们来说非常有趣的是,所有这些计算都是在远离不动点的地方完成的。提醒你一下,不动点在右上角。即使在网络做出预测之后,系统也需要时间才能达到稳态。所以它根本不使用这个稳态进行计算。

跨尺度的通用计算原理

上一节我们通过神经网络验证了鬼影集在计时任务中的作用,本节中我们总结并展望这种计算原理在不同生物尺度上的通用性。

我们倾向于认为,无论是在生化网络还是在神经网络中,特别是对于与时间相关的任务,也许计算的主要模式是利用这些瞬态进行计算,这很重要,因为轨迹不会稳定在任何吸引子上,这意味着系统保持灵活。而且它们也非渐近地演化,因为你的景观在慢集的影响下不断变化。因此,如果系统停留在这组慢点上,它基本上给了系统更多的时间,可以用来整合信息。通过这种方式,系统既可以保持灵活,也会具有鲁棒性,这是在不断变化的环境中运作所需要的。

当然,既然我们知道了这个原理,你可以很容易地找到一个最小的、更生化的网络,实际上可以执行相同的任务。所以我们认为,尽管生化网络计算和神经网络计算之间存在类比,但可能存在非常通用的原理,允许在水平上研究这些更复杂的任务,或者设计实验在单细胞水平上研究,我们实际上已经开始这样做了。

总结

本节课中我们一起学习了细胞如何像计算机一样处理信息。通过用微流控装置中的动态信号挑战细胞,我们看到它们不是简单的输入输出机器,而是主动处理和整合环境中的信号。我们发现,特别是对于受体网络,似乎对于许多这些受体网络来说,组织在临界态是一个典型的解决方案,这很重要,因为它允许它们在动态的鲁棒性和可塑性之间取得平衡,从而也在对环境的响应之间取得平衡。如果环境是亚稳态的,那么你的内在动态最好也在亚稳态区域运行,因为这正是你响应环境的方式。实现这一点的一种方法是拥有这些鬼影集或更复杂的支架,它们似乎存在于单细胞的生化网络中,也存在于我们研究过的这些非常简单的神经网络模型中。

这给了我们一些希望,我们实际上可以将学习框架扩展到细胞水平,并能够现在提出问题:细胞如何预测、预见或如何为它们的响应计时。一个例子,正如我向你展示的计时任务,人们可以很容易地想象在单细胞生化网络水平上的这样一个任务。我们也在研究一个更通用或更全局的理论框架,该框架将能够基于利用这些鬼影网络的计算来解释跨组织尺度的生物计算,同时也构建以这些鬼影网络为主要计算能力的人工神经网络,因为我们认为你可以拥有更小或组件更少的网络,能够执行与其他循环神经网络相同的任务。


本节课中我们一起学习了细胞计算与学习的基本原理。我们从细胞感知复杂信号开始,探讨了不同尺度网络(生化网络与神经网络)计算能力的相似性。通过研究EGFR网络等具体例子,我们发现了细胞通过组织在动态临界态附近,利用鬼影集实现瞬态记忆和基本学习(如敏感化)的机制。实验表明,这种机制使细胞能在动态环境中平衡鲁棒性与灵活性。最后,我们看到了类似原理在小型神经网络执行计时任务中的应用,提示可能存在跨生物尺度的通用计算框架。这些发现不仅深化了我们对细胞智能的理解,也为设计新型人工计算系统提供了灵感。

002:决策几何学 🧠

在本节课中,我们将探讨生物决策的几何学原理。我们将看到,从单个神经元到动物群体,跨越不同生物组织层级的决策过程,可能共享着一种基于空间几何的、由神经环状吸引子网络驱动的通用算法。这种算法通过一种“分岔”过程,使系统能够在面对多个选项时做出快速而准确的选择。


从个体认知到集体认知 🔄

上一节我们介绍了课程的主题。本节中,我们来看看决策研究的不同尺度。

我今天的主题是生物组织不同尺度下的决策。在座的各位大多非常熟悉大脑内部的组织结构。但是,当大脑通过生物体之间不可见的相互作用连接在一起时,情况会如何?我感兴趣的是个体层面认知与集体认知之间的联系,特别是时空计算。因此,今天我也会讨论空间决策。

我受到本次会议上许多演讲的启发。例如,会议最初展示的一些研究让我重新思考博士期间的工作。在90年代末,我的研究表明蚁群实际上会表现出活动波,这些波从蚁群中心向外传播。我们至今仍不完全清楚蚂蚁为何这样做。但考虑到过去三天我们在许多系统中看到的集体计算,这让我重新思考,并认为这可能是一个易于处理的系统(至少在大脑之外),用于理解为何会出现可能与计算相关的节律性活动模式。

我提出这一点是因为我们拥有大量数据,却无人知晓原因。当时,当我观察更大的蚁群时,波的模式变得过于复杂,我难以理解。但在过去几天,我看到了一些方法,可能让我们真正理解这些蚁群内部更复杂的波。在90年代,我只是观察像素差异。我在网格上观察,当蚂蚁移动时,会产生不同的图像;有活动时,图像更亮。如今,我们当然可以标记单个蚂蚁并进行更复杂的分析,但结果看起来仍然类似。现在我们可以知道每个个体如何贡献。每只蚂蚁在巢穴内都有一个倾向于占据的小区域,有点像神经元,它们并非完全流动,而是相互碰撞、相互作用。有可能当它们更活跃、彼此更接近时,对蚁群的输入更敏感,这是我们当时的推测,但尚无证据。例如,如果提供食物来源,这些波谷会移动吗?尚未进行此类实验。但这确实是一个很好的例子,展示了最近几天看到的一些想法如何直接关联到这些群体。

蚂蚁将80%的时间花在不活动的“睡眠”状态,因此非常高效。但当它们活跃时,会碰撞其他个体并激活它们,进而碰撞其他个体,从而产生空间波的传播。如果你改变个体数量或蚁巢大小,波的模式会改变。我们进行了改变蚁群规模的实验,这使它们能够缓冲,因为离开巢穴的蚂蚁会解耦,当它们返回时,会给系统带来噪声。如果不给它们空间来维持这种耦合振荡动态,那么噪声就会在蚁群中传播。蚂蚁会试图阻止这种情况发生,这表明活动波具有适应性,但同样,谁又知道呢?

当我们观察这些蚁群内部的其他活动波时,这是更近期的研究。例如,为什么细胞会聚集起来协调形成早期的多细胞动物?我们可以观察一种非常酷的动物——扁盘动物,它自成一个门,是基础的后生动物,基本上是一个二维的细胞群。这里我们追踪的是细胞密度的不透明度和细胞移动的方向。现在你看到的不仅是波,而且是实际上在动物表面传播的波。

如果你观察这些波的长度尺度(在此案例中是系统大小的函数),随着这些生物体生长,并观察交叉点,你可以看到随着系统变大,存在一种无标度动态,这些波可以变得更大并渗透整个系统。通过模拟这些细胞片层,我们可以开始理解它是如何以这种特定方式参数化的。它处于一种特殊的机制中,使系统接近所谓的“临界性”,从而获得这些无标度动态。这里的观点是,处于临界性可能使系统既稳健又对环境中的化学物质等输入敏感。因此,我们可以证明,在这种特定生物体中,它们似乎处于一个真正优化信息处理的机制中。

如果我们将这个想法进一步延伸,我们可以观察像成群鱼类和鸟群这样的动物。同样,行为传播的波确实是一个研究热点。它们当然会对捕食者做出反应,但这本质上也是一个可兴奋系统,因此你也会看到自发的波在系统中渗透。据认为,你看到的波中约有80%实际上是这些自发波。因此,我们可以再次观察这些波的大小或分布(在对数-对数坐标轴上),尽管没有足够的事件来断言更多,但这是一种非常长尾的分布,很难先验地预测这些波是非常小还是会传播整个系统。我们也可以做一些事情,我之所以包含这一点,是因为你们也在测量这些波的空间范围等等。


相互作用网络与临界性 🌐

上一节我们看到了活动波在不同系统中的表现。本节中,我们来探讨驱动这些行为的相互作用网络。

当我们思考相互作用时,这与神经系统非常不同。我们研究的生物体,其相互作用几乎完全由视觉驱动。我们也研究侧线系统,结果发现它并不参与水动力社会相互作用,但这不是今天要讲的故事。这里,我们重建了焦点个体右眼(蓝色)和左眼(红色)的视野。我们可以为所有个体这样做,然后逆向工程,找出在行为传播方面,它们关注哪些视觉特征。

这使我们能够重建这种隐藏的相互作用网络,这种不可见的网络。正如今天早些时候的演讲所示,如果你放大这个网络,它既是加权的、有向的,也是随时间变化的。这在社会系统中非常常见。我可能深受你的影响,但你却不受我的影响。因此,这本质上是非对称的。还有其他一些有趣的方面,例如,拥有许多邻居的个体并不是最具社会影响力的;实际上,与少数邻居有强连接会使你更具影响力,因为行为传染不像疾病传染,它是一种复杂传染,动物在复制行为之前,需要从感觉野的多个位置获得强化。因此,存在各种有趣的现象。这些网络经历了数千年的选择压力来处理信息,因此有充分理由思考这些进化网络中出现的拓扑结构和属性。

我们研究的另一个方面是,当世界变得更危险时,例如存在化学物质。当鱼被捕食者咬伤时,它们会释放一种叫做“警报物质”的化学物质。如果你将警报物质放入油中并置于水面,它们会感觉到世界更危险,但没有特定的位置更危险。那么,作为个体动物,你会怎么做?研究表明,你会降低反应阈值,因此会更紧张,更容易产生误报,但这是一个权衡。

然而,如果你考虑一个网络化系统,实际上并不清楚最优策略是什么。我们能够证明,如果有什么变化的话,个体会移动并改变阈值,使其对输入变得不那么敏感。这意味着每个个体产生误报的可能性更小,但它们改变了空间拓扑结构,使得网络现在在个体发出警报时,更有可能发生传播。因此,在面临风险时,它们真正改变的是网络属性,而非个体层面的属性。

我们还可以观察,是否有任何证据表明这些由自私的基因个体(不像细胞)组成的网络接近临界性。这条线表示临界线,红色编码表示最大敏感性。你可以看到,在基线状态下,它们离临界线相当远;当它们表现出这种警报检测时,它们接近但处于亚临界状态,并未完全达到临界性。从信息处理的角度来看,这可能有各种原因,是一个合理的选择。这与如何调整网络系统以使其对信息敏感但不过度敏感的一些主题相关。我也认为这些网络非常美丽,它们不是无标度的,也不是小世界的,它们属于自己的一类网络,最小化了局部相关性(这是好的,因为相关性会削弱集体智能),但同时仍然最小化了信息从群体一侧传递到另一侧所需的跳数。因此,它们在网络空间中处于一个非常特殊的位置。

多年来,我们能够在各种情境下证明,计算可以是这些群体网络结构的一个涌现属性。例如,调节社会传染、调节对风险增加的行为反应,以及感知长距离环境梯度。我们能够证明群体可以感知梯度,而这是任何个体都无法感知的。

我们是唯一在这个层面研究它的人,因此我们期望这些属性(因为它们处于那个特殊位置)是保守的。但老实说,这些是唯一的研究。这确实有点棘手,我也有点嫉妒。当我看到所有这些人谈论正在进行的所有神经科学研究时,你们可能可以参加有1万、2万人的会议。我们全世界只有少数几个实验室。但道理是一样的,对吧?自然选择以同样的方式作用于计算,只是在不同的生物组织尺度上。

我们还证明,这些网络属性很容易在基因自私的个体中进化。我们并不是说选择在集体层面运作,选择是在个体尺度上运作的,但这会转化到集体尺度,因为你的成功机会在适应度意义上与这类集体属性密切相关。这就是为什么我认为考虑大脑内部发生的计算类型,以及它如何可能发生在大脑之间这种隐藏的相互作用网络中,是如此相关。


集体决策的几何学原理 📐

上一节我们讨论了网络相互作用。本节中,我们来看看决策背后的核心几何学原理。

那么,我们能否思考动物的集体条件,它具有何种特征?它能告诉我们关于个体决策的什么信息?

另一件事是未发表的工作,我们也受到你们展示的关于猴子实验类型的启发,例如观察随机移动的点。我们可以将这些想法直接转化为研究集体感知。

例如,这里是100%相关性,但我们可以改变这些移动点的相关性,并询问系统是否能够检测到这些信息,以及这如何随群体大小变化。同样,你也可以观察在何种相干水平下,例如,正确检测的概率是50%。

我们可以观察群体大小如何改变群体正确检测环境中运动的概率。因此,我们可以直接利用神经科学中这些强大的实验范式来研究集体感知和集体智能。

当我在2007年写这篇文章时,我非常谨慎地在大脑内部的计算和大脑之间的计算之间进行类比。选择的层次如此不同,相互作用的机制如此不同,这难道不只是一个有趣的隐喻吗?但我今天要论证的是,并非如此。我实际上认为,时空计算存在超越组织层次的基本特征,它确实关系到我们观察空间决策时的数学或几何学。这就是我今天要试图论证的。

但再次回到过去,当我们最初试图理解动物如何在群体中移动,或鸟群、鱼群如何形成时,你可能在过去遇到过这类模型。我们推测,个体可能与邻居局部相互作用。我们还推测,可能存在相互作用规则,例如,如果你与其他个体隔离,你会在吸引区内表现出吸引力;如果你靠得太近,你会在排斥区内被排斥;还可能存在一个定向区,你在此与其他个体对齐。

这些论文已被引用数千次,而今天我告诉你,它们完全错了。正是由于不理解大脑中发生了什么,导致了一个研究领域(我部分负有责任)在理解这类系统方面走上了错误的方向。

那么,我们当时为什么这么想?这些模型有用,所以我将从我们从中学到的一些有用的事情开始。首先,它可以表明局部相互作用可以扩展到大规模行为,如鸟群和鱼群。但仅仅因为它看起来像真实世界,并不是判断它是否是真实世界适当模型的很好标准。

当然,我们学到了一些东西。例如,在这项特定研究中,我感兴趣的是信息是否可以在群体内传播,而无需显式信号、无需个体能够计数、无需个体识别。在模型中,我将个体标记为白色,以便我们可以看到它们是谁,但没有人知道谁知情、谁不知情,它们希望朝着一个共同的方向前进,比如向右。

我们能够证明,在没有信号、计数或类似事情的情况下,信息可以非常准确地传达给整个群体。我们还可以证明,如果存在冲突,例如,一些个体想去白色目标,一些想去红色目标,而其他个体不知情,那么群体在达成共识和决策方面表现得非常出色。在这个案例中,选择是随机的,因为每个选项的数量相等。在这个特定例子中,它们选择了红色选项,但如果我反复运行,结果将是随机的。但我们发现,如果你打破对称性,比如11个想去白色,10个想去红色,群体几乎总是选择多数偏好的方向,即使没有个体知道它们是否属于多数,它们只知道自己的信息状态,无法计数,但准确性极高,即使在面对噪声、非常严重的噪声和局部相互作用时,也能选择多数。

事实证明,多年后,这真正改变了我对大脑如何决策的思考。

因此,如果我们以一种非常抽象的方式思考,你可以将这些不知情的个体(结果证明非常重要)和具有不同偏好的知情个体视为关键。但信息是通过这种局部复制行为、局部社会影响传播的。

然而,如果你想象我之前描述的那个分区模型,现在在个体层面运作,因为它们生活在鱼群和融合种群中。那么,它就不会那么有效,因为会发生的情况是,最顶部的选项会抵消最底部的选项,动物将陷入犹豫不决的状态。这是一个清晰的例子,说明这种相互作用方式的表述存在问题。

我们当时确实是在猜测这些相互作用是什么。因为它产生了看起来逼真的模式,我们当时觉得还可以。但现在,当然,神经科学在理解空间导航回路方面取得了真正的突破,首先是无脊椎动物(大约2014年起),然后在2023年,斑马鱼中也发现了这种神经元环,它是大脑中的一个“指南针”,让动物感知到物体的方向。

因此,如果我们思考我在研究这些动物群体时感兴趣的向量整合的简单示意图,它实际上与大脑中这些环状结构内的高放电率和低放电率有着显著的、数学上我们认为相同的关联。

因此,在思考这个问题这么久之后,我认为,也许这可以转化为动物在移动中做决策时的情况。


从固定规则到大脑动力学 🧬

上一节我们指出了传统模型的局限性。本节中,我们提出新的视角:决策源于大脑内部的动力学。

我想要论证的是,我们需要摆脱动物遵循固定规则的观点。它们不是由固定规则驱动的,而是由大脑内部的动力学驱动的。这对你们来说可能听起来如此明显,但真的几乎没有关于这方面的出版物,人们仍然在使用这些非常简单的基于分区的模型。

因此,我们主张,与其使用这些经典的所谓自驱动粒子模型,不如将感觉运动接口纳入考虑,这一点至关重要。我与卡尔·弗里斯顿合作的一些工作一直在研究惊奇最小化。假设大脑只是试图最小化不确定性。有两种方式可以改变你对世界的模型:一是移动,这会改变感觉输入;二是改变模型的内部参数。如果你只是假设大脑进化是为了最小化不确定性,那么你实际上可以逆向工程许多这些控制律,并得到涌现的集体动力学。但我没有时间深入那个特定框架,不过我认为值得提及,作为一个潜在非常有用的框架。

今天我要讲的是神经元集体中的共识决策,以及这如何导致动物在移动中做出的决策。在进一步之前,我要感谢Vivek(我今年的博士生,即将在华盛顿大学开始教职)、Dan(一位被我转化为生物学家的黑洞物理学家,他完成了分析理论)、我在魏茨曼研究所休假时的合作者Ne Gova,以及Rico(他想出了一些这些想法,并意识到所有这些不同系统之间的联系)。你们知道,这真的很有启发性,尽管我们的工作是在斑马鱼中发现这个之前完成的,但从我们的数据中你们会看到,我们有非常有力的证据表明,这些环状结构将指导决策。

David Jaman Janlia在果蝇研究中真正开创了先河。大脑椭圆体上的电活动“凸起”实际上包含了向量表示——偏好的强度和动物将前往的方向,绝对非凡。如果你观察其超微结构,这是真实的世界,一个真实的β,绝对令人难以置信。

现在,在脊椎动物大脑中,它并非字面意义上的椭圆体,但其功能行为完全像一个椭圆体。像Heson Polinsky这样的人已经研究了头方向细胞中的这类网络,所以这本身并不是一个新想法。但可能让你们惊讶的是,没有人研究过移动中的环状吸引子。我稍后会解释为什么这很重要。

我甚至不需要深入模型的细节,因为它非常简单。我们有一个只有两个参数的模型。它如此简单的原因是,所有动物都不得不独立进化出相同的属性(在许多情况下),但这是一个保守的属性——在移动中做决策。因此,该模型是分析上可处理的,这是一个优势。此外,如果我们愿意,我们总是可以增加复杂性,但会牺牲普适性。例如,哈佛大学的Ben de Be已经证明,只要你处于一类环状吸引子模型中,投入大量细节,这些细节实际上并不重要,你仍然会得到我今天展示的结果。因此,在环上具有相似方向偏好的集群之间存在兴奋或正反馈,这与我们之前在视觉系统中看到的一些方向敏感活动并无不同。然后可能存在全局抑制和/或长程抑制。就今天的目的而言,它们产生相似的结果,但存在一些非常有趣的差异。有些动物如果蝇是全局抑制,其他动物是长程抑制。但总体而言,我们可以将其视为一个神经环状吸引子网络。

作为一个示意图,如前所述,我们有局部兴奋、长程抑制。我们可以证明,这通常会导致一个稳定的活动“凸起”。如果没有输入到这个网络,这个“凸起”可以出现在任何方向。

我们尚未发表但正在与Philipp Min(我博士后期间的导师)及其博士生Vit合作的一件事是,如果我们大脑内部有这种动态网络,那么动物在没有感觉信息时需要做什么?它们需要探索、需要搜索。当你查看文献时,有系统性的螺旋搜索或循环搜索,以及随机搜索如列维飞行或相关随机游走的经典例子。

因此,我们一直在问的一个有趣问题是,如何在环状吸引子上获得这些行波解。例如,如果波以相同速度传播,这将导致动物轨迹上的循环;如果波速增加,将导致阿基米德螺旋。当然,在模型的随机版本中,它永远不会看起来如此干净,但分析版本允许我们展示这些情况发生的机制,而这些正是你在自然界中看到的数据类型,例如蚂蚁的螺旋搜索。

因此,我们也可以转向随机模型,你可以看到这里动物会表现出一个看起来更混乱的阿基米德螺旋,但这更接近我们认为动物大脑中发生的情况。这是一个生成模型,你还可以看到不同的机制,例如这种蜿蜒的波浪运动,这又是人们在自然界中看到的现象,动物需要以这种系统的方式协调它们的运动。

但今天我不打算讨论搜索,我要讨论的是当网络实际有输入时的情况。这里我们有一个感知层,我将展示视觉信息的数据,但这仅仅是因为虚拟现实与视觉配合得非常好。这也可以是听觉的,也可以是听觉和触觉的组合,无论什么,你都有某种感觉输入进入这个决策层。决策层基于该输入达成共识,决定动物去向何方。随着动物移动,这会改变感知输入的几何形状,从而改变共识,进而改变运动,再改变几何形状,因此这是一个具身的过程。这以前没有被研究过。在这里,你可以窥见我们将要看到的情况:当这些选项之间的角度达到临界值时,解决方案变得不稳定,动物会突然在它们之间做出选择。在这个案例中,这些选项是相同的,我稍后会讨论选项之间的差异。

所有动物在生命的某个阶段都必须决定去哪里。因此,我们想问的是,是否存在跨分类群和情境的空间决策通用算法。如果你采用环状吸引子模型,并询问这个具身过程如何运作(正如我向你们展示的一个例子),现在你将看到成千上万个例子作为一个热图。你可以看到,预测是大脑将平均输入,直到达到一个临界几何角度。然后,大脑中的对称性将被打破,动物将选择走向一边或另一边。现在,这是动力系统理论中的一个分岔,它恰好也转化为现实物理世界中的一个分岔。但当我谈论分岔时,我通常指的是在神经空间中。因此,动物可以从这里进来,它仍然会分岔到两个选项,轨迹看起来会不同,但在神经空间中是相同的。

那么,理论预测是什么?如果我们观察平均场模型,我们可以看到,如果存在神经噪声,模型中会有两个参数,其中之一是神经噪声,因此系统并非完全确定性的,正如我之前所示。系统实际上具有热噪声,代表了神经误差。这是现在选项之间的自我中心角度。如果动物离选项很远,这个自我中心角度会很小。我们可以证明,大脑将选择选项之间的平均值,然后随着动物慢慢接近目标,这个角度将平滑连续地增加,直到你到达这里的旋节线,此时大脑必须(可证明地)过渡到决策状态。

我稍后会回到参数化,但观点是,随着动物在物理空间中移动,如果你俯视一只在两个目标之间做选择的动物,我们应该看到这种临界性,表现为动物方向的突然改变,这是由大脑内神经元动力学的分岔引起的。

让我更详细地介绍这两个模型参数。一个是神经噪声,相当于物理系统中的温度。我们实际上可以从数据中估计这些,我稍后会展示。现在存在一个临界点。在某个温度以下,我们有一级相变;以上,则是二级相变。因此,只要神经噪声低于某个临界温度,你就会得到我展示给你的动力学——大脑内部突然的相变。高于该温度,大脑会在选项之间漂移,因此它会做出决策,但决策相对较差。我们在模型中唯一的另一个参数是神经调谐。我指的是什么?嗯,这就是大脑内兴奋与抑制的功能形式。

著名的神经科学家Larry Abbott将他们从实验中发现的函数描述为一种奇怪的功能形式,但看起来有点像这样。后来在大脑中,当向量进入扇形体时,它总是余弦。他们有一篇漂亮的论文论证,这允许大脑进行相位算术,基本上将余弦加到余弦上总是得到余弦,所以你可以计算出你过去的位置,完全正确。但他们没有理解的是,为什么在此之前它具有这种奇怪的形式,我今天将尝试向你们解释原因。

但同样,如果你观察这个模型的随机版本,我们不能真正谈论真正的相变,但它是一种类似相变的过程。我们证明,即使只有九个神经元,这仍然是一个非常非线性的突然转变,因此这是一个非常稳健的发现。

那么,为什么这对决策很重要?我认为,理解动物如何实际在空间中移动很重要,但当我们看到这种临界性时。有一个与之相关的特征叫做敏感性或超敏感性,这意味着经历这种转变的大脑(现在在模拟中,在分析模型中这趋于无穷大)在有限大小的系统中,你会得到一个强峰值。这意味着大脑在那一刻作为一个涌现属性,变得对世界中输入之间的差异极其敏感。这是一个多么出色的特性,是相变带来的免费属性。

物理学中有令人难以置信的工作真正表明,这种超敏感性是任何经历此类转变的系统的普遍特征。因此,我们可以相当确信,如果动物以这种方式行为,这可能是一个重要特征。

那么,我们如何测试我们的理论?我们的理论完全基于大脑内的对称性破缺和动态分岔。这真的很难通过实验来检验。因为在我的实验室,即使我有一个非常好的设施,也可能有轻微的气流或我无法感知的电场梯度,这会打破大脑中的对称性,动物会做出我无法理解的决策。如果我要探索大脑中的对称性,我需要观察在超对称世界中的决策。

因此,我们解决这个问题的方法是,为自由移动的动物开发虚拟现实或沉浸式虚拟现实。

我现在可以告诉你,这个胶带在桌子上方没有体积。但即使是你们复杂的人类大脑,被告知这是一种幻觉,仍然会立体地看到它,直到幻觉被打破。但即使它大致进入正确的位置,你大脑中的立体线索如此强烈,你的先验知识如此强烈,你再次看到它是3D的。同样,这只鞋实际上不是三维的。

因此,如果我们在这样的世界中有一只动物,并以每秒100次的速度重建它的视野,那么我们就可以让它完全沉浸式地在虚拟环境中互动。我们可以控制物理定律,我们可以拥有旋转不变性。

我们已经为多种动物开发了这个系统,从果蝇(我将展示果蝇的数据)到蝗虫。它们在一个巨大的运动补偿球中,我将在演讲接近结束时展示。以及一些我们上周或上上周收集的、关于蚂蚁在虚拟环境中的未发表数据。

令我惊讶的是,有成千上万篇关于决策的论文,但我们找不到一篇报告动物在做决策时运动的论文。我们能找到的最接近的是灵长类动物和人类或鸟类的手部运动。但实际上,就这个特定理论而言,在动物在空间中移动方面,什么都没有。有些人认为动物看着选项,做出决定,而运动只是输出。但我们认为这是一个具身过程。

因此,我们首先用果蝇进行了实验。现在你看到的是一个热图,显示了数百条果蝇轨迹,展示了它们走向两个圆柱体的概率分布。这是一种反射行为,它们想落到那些圆柱体上。不幸的是,对于可怜的果蝇来说,那里实际上什么都没有,但它们会一次又一次地做出这些决定。同样,蝗虫会走向垂直物体,因为这可能是它们贫瘠沙漠环境中的食物。

因此,有证据表明大脑中存在这种分岔。我们几周前收集的蚂蚁数据,蚂蚁比我们研究过的任何其他动物都要好。这些蚂蚁叫做Diacamma蚂蚁,它们单独觅食,不使用信息素,因此它们不留下化学痕迹。它们生活在群体中,但完全独自觅食。因为它们叮咬得很厉害,几乎没有捕食者。它们出去只是为了寻找食物带回群体,因为它们会把食物给其他蚂蚁,所以它们进化到基本上只是反复做这件事,不会吃饱然后停止行为。因此,与八月的博士生合作,我们可以测试不同选项角度范围,以更全面地测试理论。这是完全未过滤的数据,确切的轨迹,甚至不是热图,展示了蚂蚁的行为。即使在个体层面,你也会看到行为的突然转变。因此,我们现在正在做的是用蚂蚁测试敏感性假说,数据看起来真的很好。

现在,我们可以实际获取这些行为数据,加上来自V vector I的一些神经数据,并实际拟合我们模型的参数。我之前展示过,只要噪声温度低于一级和二级相变之间的临界值,就会发生相变,那么我们就可以解释数据。结果证明,它远低于临界值,大约在0.2到0.25之间。

当你观察神经调谐参数时,正如Larry Abbott和其他人所发现的,我们只能拟合那些既符合神经数据又符合我们实验中观察到的分岔的数据。


多选项决策与分形行为 🌳

上一节我们探讨了两个选项的情况。本节中,我们来看看当面临三个或更多选项时,决策过程如何以分形方式展开。

那么三个选项呢?在现实世界中,动物必须处理任意数量的选项。大多数神经模型不能很好地扩展,你必须添加另一个组件,再一个组件,变得非常混乱。正如我稍后会展示的,这里它自然地扩展到任意数量的选项,并且是一个分形过程。例如,如果在这个像树一样的选项中,有许多其他选项,这个过程将只是再次分支。

但因为通过实验测试这一点相当困难,我将首先关注三个选项。为了能够看到对称性破缺,我们需要世界是对称的,记住。因此,要看到这个过程,我们需要对称性,但我们认为它们拥有这个过程的原因是为了在每个分支点打破对称性。我稍后会回到这一点。

因此,我们用虚拟现实测试了这一点。这是理论,所以我们预测大脑自发地将世界的复杂性分解为二元决策。我们也可以证明(我稍后会展示),即使在动态神经空间中有许多可能的分支,在每个分岔点你只会看到两个。并且接近每个临界分岔点时,大脑将概率性地排除最差的、次差的选项,这又是一个免费属性,因为它是涌现属性,我们没有将其放入模型。

这里是来自果蝇和蝗虫实验的数据,正如理论预测的那样,我们有证据表明,当它穿过空间时,大脑中存在这种双重分岔。

我之前展示了两个选项情况下两个参数到数据的映射。结果证明,这两个参数也完全映射到三个选项的情况。事实上,如果温度高于那个临界温度,可怜的动物将根本无法为三个选项做出决策,因为左边抵消了右边,它们总是走中间。但在临界温度以下,在它们所处的机制中,我们看到这种双重分支过程发生。同样,正如我们之前发现的,神经调谐参数必须处于神经科学实验中发现的那个机制内,才能解释我们看到的分岔几何形状,所以一切都吻合。

再次,我想强调这种超敏感性是它如此出色的原因,即使是一个有点嘈杂的大脑,在这个临界点也能变得像超级计算机一样。

因此,我们刚刚开始进行实验,在那里我们可以打破对称性,并观察选项之间的差异。不幸的是,蚂蚁数据(真的很好)我的学生在马尔代夫,没能及时给我图表,但我认为这很重要,因为我们知道,如果选项之间存在感知差异,很容易看到你可以做出快速准确的决策。如果很难,你可以随时间整合,这完全正确。但我们不需要为这种几何临界性进行时间整合,动物也不会在分岔点花费更多时间,它们也不需要。因此,你可以通过穿过分岔点来“欺骗”这一点。我们预测,动物大脑将强烈选择偏好的选项,即使这是一个非常困难的选择。但如果动物超出了分岔点,如图所示,它将做出非常糟糕的决策。

当然,生物学家不知道这一点,所以他们经常通过将动物直接放在两个选项之间来做实验。但我们认为,大脑能否通过临界分岔点,会有很大差异。

因此,与本科生Lisa Ecker一起,我们为蝗虫测试了这一点。确实,如果大脑不能通过分岔点,它们选择偏好选项的概率只比随机略高;但如果它们能通过分岔点,正如几何分岔理论所预测的,这种选择会被大大放大。

关于Larry称之为奇怪功能形式的另一个有趣方面是,它实际上意味着大脑不是以欧几里得方式编码空间,而是以椭圆方式,在一个相对于动物的弯曲空间中编码。结果证明,这至关重要。如果你扭曲空间太多或太少,动物将无法为三个或更多选项做出决策,它们会陷入选项之间的无尽循环。

我们可以探索这一点的一种方式是观察平均场模型。现在,平均场模型做了很多假设,例如你在空间中的任何点都有无限的时间,但它仍然令人惊讶地捕捉到了我们看到的动力学,可能是因为神经动力学比动物表现出的运动快得多,所以平均场做得相当不错。

因此,我们可以在平均场模型中做的是找到方程的稳态解。因此,对于每个点,我们可以找出哪些向量是可能的。随着我们获得更多目标,你将有可能指向目标或目标平均值的向量。所以这扩展得相当糟糕,但至少从概念上讲,它在实践中效果很好。但如果你只看两个选项的情况,你可以定义动物必须移动的矢量场,然后当它们到达这个流形时,大脑必须分岔,并将在两个选项之间选择。在两个选项的情况下,这很容易理解。事实上,许多参数化可以解决这个问题。

然而,当你处理三个或四个选项时,你必须处于我们发现真实动物所处的那个“甜蜜点”。

我们可以识别显示为红点的分岔点,在那里解决方案变得不稳定,然后你可以观察这些点周围的能量。再次,让我们看看两个选项的情况,这将非常简单。在这一点上,向前移动的解决方案变得不稳定,两个新的解决方案出现,如果选项相等,则有50/50的概率落入这两个吸引子之一。

当我们开始处理三个选项时,事情可能变得相当疯狂,因为它看起来与侧向选项和中间选项的分岔过程相同,但实际上并非如此。存在一种自相似模式向中间目标收敛,伴随着分岔后的分岔,但在随机模型中,看起来好像只是做出了单一选择。

我认为另一个非常有趣的事情(我们仍在研究)是,在第一个分岔之后,如果你观察三个、四个或任意数量的选项,所有的分岔点(无论动物从何处进入,那些分岔点)都位于曲线上。结果证明,这些曲线如何相交的某种元描述定义了动物的轨迹,这至少对我来说是相当难以理解的事情。

例如,如果动物的大脑以欧几里得方式编码信息,即使用余弦,那么你实际上可以得到无限数量的分岔,动物可能陷入选项之间的犹豫不决。这不好。但结果证明,随着你拥有这种更非欧几里得的功能形式,它会展开这些分岔曲线,并允许你从无限数量的分岔减少到有限数量。并且存在一个特定的甜蜜点,对于任何几何配置,最小化动物表现出的分岔数量,使它们能够到达目标并做出高度准确的决策。

如果你想了解更多关于那个特定方面,我们去年在PLOS Computational Biology上发表了一篇论文,但我们正在研究一个更通用的模型版本,在那里我们也可以正式地将环状吸引子模型映射为数学上等价于漂移扩散模型,以及提名意见动力学模型。这就是为什么我认为存在一个超越特定系统的决策通用框架。我们也可以证明它总是二元的,因此在那个甜蜜点,动物可以为任意数量的选项做出决策,并在到达目标时表现出这种分形行为。

它也能产生非常漂亮的图片。


通用算法与应用 🌟

上一节我们看到了决策的分形本质。本节中,我们来总结这种通用算法,并探讨其潜在应用。

因此,如果这是一个普遍原理,并且在我们研究的这三个系统中,我们发现这两个参数是相同的。让我们采用完全相同的模型,使用那两个完全相同的参数,现在将其应用于一个完全不同的大脑——脊椎动物大脑。鱼不被静态物体吸引,但它们肯定被其他鱼吸引,正如你在这里在我们的虚拟现实中看到的,真实的鱼正在跟随这条虚拟鱼。这些鱼是不到一厘米长的幼年斑马鱼。我们也可以进入大脑,鱼缸里什么都没有,但它相信自己在鱼缸里,即使我们投影在表面上。

现在,我不能将多于一条鱼放入这些环境,因为记住,当那篇论文移动时,幻觉突然被打破,它只能为一个特定视角工作。但我们做的是将系统联网,所以这个可以与那个的全息图实时互动,反之亦然。因此,我们可以玩弄网络拓扑,我们可以添加时间延迟,我们可以玩弄角色物理和时间,以真正理解大脑的行为。现在你看到它有点卡顿,只是因为Zoom链接,但你看到两条斑马鱼互动,不是在同一个物理世界,而是在同一个虚拟世界。我们称之为“矩阵”,因为它类似于那部电影。这项研究实际上将在4月30日发表。

但回到早期的工作,我们可以展示,如果我们能改变这些虚拟鱼之间的距离(我永远无法训练真实的鱼表现出如此精致的行为),那么我们应该看到动物大脑中的分岔,或者我们应该看到与动物大脑中分岔一致的行为,这正是我们看到的。如果我们没有理论,没有虚拟现实,我们将永远无法构建这样的实验,在那里你现在看到理论中的双重分岔,它看起来不同,因为现在我们有一个移动的参考系(想象摄像机跟随鱼),但我们看到了双重分岔的证据,这里是实验数据。

我们还有另一篇论文,我们研究了各种不同的配置,前后、左右、四条、五条鱼等等,它符合我们投入的一切。

因此,现在与神经科学家Armond Ba合作,我们开发了一个系统,你可以在细胞水平分辨率上对一条认为自己正在与其他鱼一起游泳的鱼进行全脑成像。它实际上被麻痹了,Armon正在解码给脊髓的信息以左转、右转、加速等等。所以,期待一些非常酷的东西,在那里我们可以将细胞水平的分辨率与个体决策联系起来,并使用相同的设置将个体决策与集体决策联系起来。

如果这如此稳健,那么我们也应该能够解释野外动物的行为,例如野生灵长类动物。这些是肯尼亚未习惯化的野生橄榄狒狒,带有GPS项圈。出于伦理原因,我们不给幼崽戴项圈,但它们往往与母亲待在一起。每秒钟我们都有动物的位置,有成千上万的事件,一些个体走一条路,其他个体走不同的方向。因此,我们可以从每个个体的角度询问,你如何根据选项的角度做出决策?你可以看到这些个体放弃并重新加入群体。

因此,我们可以询问这些关于野生灵长类动物大脑中分岔和对称性破缺的问题,我们再次发现证据表明大脑以这种方式行为。

因此,我们认为存在一种支配决策的通用算法,它实际上超越了生物组织的尺度。因此,自然选择出于相同的原因找到了相同的算法,但在这些不同的尺度上使用了非常不同的机制。

那么,如何将其应用于现实世界的问题?嗯,一种方法是询问像人类这样非常复杂的生物是否表现出分岔。这是我们现已完成的、未过滤的数据,我不知道,数百人。也许有证据表明,当人类走过真实的物理空间时,也表现出类似的分岔。

我们也可以逆向工程这些算法,并将其应用于机器人技术。许多人谈论受生物启发的算法,如蚁群优化或其他,但这真的只是非常松散地受生物学启发。如果我们实际采用这种算法并直接应用于机器人(如无人机)中呢?因此,我们与麻省理工学院的Danielle Larus合作,我们开发了模型预测控制器,这是最优的人类控制器,需要超级计算机18小时来优化,有大量参数,并且需要了解机器人的一切。相比之下,我们的算法只有两个参数。我们在康斯坦茨用无人机做了这个,在麻省理工用车辆和水上船只做了,并表明是的,模型预测控制器稍微好一点,但只是好一点点,它真的是一种全知模型,而自然模型则非常有效。我们还可以证明,在这个特定演示中,它可以扩展到14个机器人。

那么,回到集体行为呢?我论证了我和其他人在90年代和80年代开发了这些简单的基于分区的模型。这种对大脑如何工作的新理解,如何帮助我们解释动物集体,例如这些庞大的蝗虫群?

这是一个真正的问题,因为这些昆虫通过粮食短缺和粮食安全影响着地球上十分之一的人口,然而几乎没有人研究它,因为这些地区的人们负担不起农用化学品。蝗虫实际上是害羞、隐秘的绿色蚱蜢,它们无法忍受彼此靠近。它们实际上是散居的,如果给它们机会的话。但它们可以转变为这种群居形态,当它们蜕皮时,它们变成黑色、黄色,带有红眼睛,我稍后会展示一个视频。因此,这有点非凡,你有一个基因组中的两种动物,它可以在两种不同的状态之间切换。在60年代,人们认为它们是不同的物种,因为它们的行为和外观如此不同。

那么,它们为什么这样做?嗯,这是对生活在这些极端多变环境中的进化适应。当季风进入东非时,它们可以带来大量降雨,很快在一两周内,你可以看到绿色植物在环境中生长。这对于那些小绿蚱蜢来说,是繁荣兴旺的完美条件,这种绿化可以扩展到巨大的范围,因此这些蚱蜢的数量大大增加。

但在这些条件下,这些散居个体的种群增长,有充足的食物,它们可以避免彼此。如果个体是群居的,它们实际上会变回散居类型,因此这些种群可以变得很大。但如果种群变得太大,或者有干旱,或者它们吃了太多食物,那么它们被迫聚集在一起。当它们聚集在一起时,就是它们转变为群居形态的时候,它们表现出这些大规模的群集,这些群集允许这些昆虫以高度定向的方式迁出营养贫瘠的地区。如果你把一个人放在没有GPS的沙漠中,他们会转圈,类似于这些动物,但如果它们在庞大的群集中,这使它们能够持续存在并迁出营养贫瘠的地区。我们还证明,它们互相残食以在这些长途旅程中生存。母亲们甚至通过卵中的一种化学物质传递信息,告诉它们的后代是为散居生活还是群居生活做准备,因此一代又一代,它们能够持续存在,真是令人惊叹的动物。

因此,2020年1月在非洲发生了一次大规模群集,由于COVID加剧,意味着不可能在非洲各地移动化学品或人员,但我们设法在航班取消前让一个团队进入,实际获取了这些群集的定量数据。预测它们何时何地形成是如此困难。因此,这是团队,是Ats实验室和我的实验室之间的合作,也是与我们小组共享的博士后Sirjan(这项工作的主要作者)的合作。

因此,有了这种新的深度学习技术,我们现在可以在这些非常复杂的环境条件下跟踪动物,这篇论文刚刚在二月底发表。

因此,我们在野外发现,如果你从群集中取出一只蝗虫并放回去,它会沿着群集的方向行进,即从左到右。如果你移除它们的嗅觉能力,不会改变任何事情;它们检测

003:马尔可夫过程与脑网络枢纽

在本节课中,我们将学习如何运用图论和马尔可夫过程来研究大脑网络,特别是如何识别网络中的关键枢纽节点。我们将从跨学科思想的融合开始,逐步深入到具体的数学模型和应用。

跨学科思想的融合

数学与物理学等学科长期以来相互关联、相互启发。这种共生关系促进了双方的快速发展。例如,牛顿定律与微积分的发现就是经典例证。物理学研究时空与因果的三重宇宙,这启发了几何学、代数学和分析学的发展。

我们可以用一幅图来直观地定义这三个概念:空间本身的形态是几何;用坐标描述空间并写下方程是代数;理解事物在此时空维度中如何变化则是分析。没有测量和符号化,我们就无法理解外部世界。印度哲学甚至认为,时空、因果与是并列的,这强调了量化的重要性。

然而,人类内心的世界呢?它与外部世界是相同的吗?回答这个问题可能需要多个领域的交汇,特别是数学神经科学。人工智能的兴起促使我们重新思考心智、智能等基本问题。大脑及其奥秘是科学的最终前沿。

大脑作为神经网络

目前,神经科学将大脑视为一个神经网络,并将心智和意识视为这个网络的涌现功能。这意味着你无法指出某个具体位置说“这就是意识”,它是整体大于部分之和的结果。这是自哲学诞生以来就存在的根本问题。

在21世纪,神经科学在描述大脑神经网络方面取得了显著进展,但工作才刚刚开始。或许通过理解大脑网络,我们能更好地理解心智和意识。在此任务中,图论成为了描述大脑连接性的主要工具。

图论基础与大脑建模

图论起源于欧拉解决的柯尼斯堡七桥问题。一个顶点(节点)和(连接)组成。边可以是有向的、加权的。大脑网络可以被建模为一个加权有向图,其中顶点是神经元或神经元群,边表示它们之间的连接,权重表示信号强度。

将图转化为邻接矩阵,我们就从几何表示进入了代数分析。矩阵的每个元素 A[i][j] 表示从顶点 i 到顶点 j 的连接权重。对于大脑网络,这个矩阵通常不是对称的,因为突触连接不一定是双向的。

马尔可夫过程与枢纽识别

为了理解网络中的信息流,我们可以将图视为一个马尔可夫过程。在这个模型中,我们定义了一个马尔可夫矩阵 P,其中元素 P[x][y] 表示从状态(节点)x 转移到状态 y 的概率。一个简单的模型是令 P[x][y] = 1 / (x的出度),即假设从节点 x 出发的所有连接具有相等的转移概率。这个矩阵是行随机的,即每一行元素之和为1。

马尔可夫链的核心定理指出,在温和的条件下,当转移步数 n 趋于无穷时,转移矩阵的 n 次幂 P^n 会收敛到一个极限矩阵。这个极限揭示了系统的长期行为。对应的极限概率分布向量 V 可以通过求解线性方程 V * P = V 得到。向量 V 中的每个分量代表了过程长期处于对应状态的概率。

在脑网络研究中,这个极限概率分布可以用来识别枢纽节点——那些在长期信息流中扮演最关键角色的脑区。这与谷歌网页排名算法(PageRank)的核心思想同源,后者也是基于马尔可夫过程来评估网页重要性。

应用与未来方向

上述方法已被应用于简单的生物神经网络,如拥有302个神经元的秀丽隐杆线虫和拥有约2万个神经元的果蝇。通过分析它们的连接组数据并应用马尔可夫过程,可以识别出与运动控制、应激反应等关键功能相关的枢纽神经元。

未来的工作可以朝多个方向发展:

  • 使用连续时间马尔可夫过程来更精确地建模随时间变化的突触强度。
  • 定义脑网络的 ζ 函数(一种生成函数矩阵),将代数几何的思想引入网络分析。
  • 研究网络度分布的幂律特性,这与数论中的黎曼ζ函数存在有趣联系。

总结

本节课我们一起学习了如何利用图论和马尔可夫过程来建模和分析大脑网络。我们从跨学科的视角出发,介绍了将大脑表示为加权有向图的方法,并重点阐述了如何通过构建马尔可夫矩阵、求解其平稳分布来识别网络中的功能枢纽。这不仅为神经科学研究提供了新的数学工具,也反过来推动了图论本身(特别是有向图谱理论)的发展。探索大脑这一最终前沿,需要数学与神经科学更深入的共生融合。

004:时空人工神经网络的计算归纳偏置

在本节课中,我们将探讨人工神经网络中的计算归纳偏置,特别是如何通过引入时空动力学(如波动)来构建更高效、更具泛化能力的模型。我们将从现代人工智能模型的局限性出发,分析归纳偏置的概念,并深入探讨波动动力学如何自然地引导模型实现空间信息整合、时间信息记忆以及对世界连续对称性的编码。


归纳偏置:模型选择如何影响学习

上一节我们提到了现代大型模型在数据效率和泛化能力上的挑战。本节中,我们来看看一个核心概念:归纳偏置。它指的是在选择模型时所做的、能够约束模型可能学习到的内容以及其泛化方式的先验假设。

一个简单的例子是房价预测。假设你的数据是房屋面积与价格的关系图。

  • 如果你选择一个线性模型y = ax + b),你的模型具有“高偏差”,可能无法完美拟合所有数据点,但你只需要少量数据就能得到一个合理的拟合。
  • 如果你选择一个高阶多项式,你可以完美拟合所有训练数据,但很可能无法很好地泛化到新的数据点(例如,预测一个超大面积的房屋价格时可能出错)。

在深度学习中,一个著名的归纳偏置例子是卷积神经网络。它通过在空间上共享权重(即使用相同的卷积核扫描整个图像),假设了特征在图像的不同位置具有不变性。这极大地提升了模型在图像任务上的数据效率和性能。

那么,自然智能(如大脑)拥有哪些独特的归纳偏置,使其与当前的人工智能模型区分开来呢?


大脑中的时空动力学:波动的启示

上一节我们介绍了归纳偏置的概念。本节中,我们来看看自然界智能系统——大脑——中一种普遍存在的现象:时空动力学,特别是传播波

研究表明,大脑的多个区域都存在波动活动,例如海马体的theta波、睡眠期间的全局波,以及视觉皮层MT区的波。这些平滑的、在空间中传播的动力学模式提示我们,基于此类“基元”的计算系统可能具有独特的归纳偏置。

一个核心观点是,许多波动系统(如最简单的波动方程)具有能量守恒的特性。虽然大脑中的波并非完美的物理波,可能存在阻尼,但在短时间尺度和局部空间区域,可以近似认为存在某种“守恒量”。这种守恒性可能导致系统偏向于以特定的方式整合与存储信息。

具体而言,我们认为时空动力学可能带来两种高阶的归纳偏置:

  1. 信息在空间和时间上的整合
  2. 对连续对称性的编码

空间信息整合:波动如何“看见”全局

上一节我们提出了波动可能促进信息整合的观点。本节中,我们通过一个具体实验来看看波动如何帮助局部神经元“了解”全局信息。

想象一个视觉皮层V1的神经元,它只拥有一个很小的局部感受野。当它看到一片类似天空的纹理时,如何区分这是真实的天空还是湖面的倒影?它需要整合图像其他部分的信息。波动为解决这个问题提供了灵感。

我们从一个经典的数学问题“听鼓辨形”获得启发:在一个固定边界(鼓面)上激发波动,其振动的频率谱包含了边界形状的信息。更大的鼓面会产生更低的基础频率。这意味着,波在传播、反射的过程中,将边界的信息带回了内部。

基于此,我们设计了一个计算实验:

  1. 输入是不同形状(如三角形、正方形、五边形)的二值图像。
  2. 我们构建了一个模拟波动方程的人工神经网络,其神经元仅具有小的局部感受野。
  3. 网络通过侧向耦合进行递归动力学演化,模拟波在“皮层”上的传播。
  4. 任务是从单个神经元随时间变化的激活信号中,解码出整个图像的形状类别。

以下是实验的关键步骤和发现:

  • 模型架构:网络包含一个将局部图像像素编码为初始驱动的输入编码器,一个模拟波动动力学的递归层(其权重具有空间对称性),以及一个从神经元的时空激活信号中解码类别的读出器。
  • 波动传播:网络学习后,输入刺激在边界处产生扰动,波在此处反射并传播。不同形状内部和外部会形成不同的动力学模式。
  • 特征提取:对单个神经元的激活时间序列进行傅里叶变换后,发现不同形状在不同频带上具有显著差异的特征谱。这意味着波动成功地将全局形状信息编码到了局部神经元的时序活动中。
  • 性能对比:这种基于单层波动递归的模型,在形状分类任务上表现优于需要堆叠许多层来实现感受野扩大的传统深度卷积网络。这表明波动提供了一种高效的空间信息整合机制。

一个有趣的发现是,最好的读出方式是对整个时间序列进行一个可学习的线性变换。分析这个变换矩阵的行向量发现,它们类似于小波变换的基,表明模型在利用波动中的瞬态动力学特征进行分类。


时间信息整合:波动作为记忆载体

上一节我们看到了波动如何整合空间信息。本节中,我们来看看波动如何帮助模型在时间维度上整合与保存信息。

直观上,向池塘中投入石子,水面波纹会编码石子投入的时间和位置信息。观察水面,就能读取一段历史。我们想探究,能否将类似的原理整合到循环神经网络中,以增强其记忆能力。

我们比较了两种简单的循环神经网络:

  1. 标准RNN:使用全连接递归权重矩阵。其动力学通常表现为杂乱无章的“脉冲”活动,信息容易随时间消散。
  2. 波动RNN:将全连接矩阵替换为一个局部连接的卷积操作。这近似于对一维平流方程(一种简单的波方程)的离散化。其动力学表现为活动在空间维度上有序地“流动”或“传播”。

我们在简单的复制任务上测试这两种模型。该任务要求模型在接收到一段输入序列后,经过一段延迟,再准确复现该序列。

实验结果非常明显:

  • 学习速度:波动RNN(红色曲线)学习速度远快于标准RNN(蓝色曲线)。
  • 长程依赖:随着延迟时间增长,波动RNN的性能优势更加显著。
  • 内在机制:卷积操作带来的空间权重对称性是产生能量守恒特性和长效记忆的关键。即使随机初始化,模型为了完成需要时间整合的任务,也会自发学习出类似波动的动力学。

这表明,波动动力学为模型提供了一种偏向于在时间上保存信息的归纳偏置。


扩展到现代序列模型:状态空间模型中的波

上一节的实验是在简单模型上进行的。本节中,我们来看看波动思想如何应用于当前机器学习领域热门的状态空间模型,例如Mamba架构。

状态空间模型本质是一种线性递归模型,因其在长序列处理上的效率而受到关注,被视为Transformer的潜在竞争对手。最新的Mamba模型在其核心包含一个特殊的“移位SSM”组件。其状态转移矩阵是一个次对角线为1的矩阵,这恰好对应于速度为1的平流方程的离散形式。

我们发现,Mamba模型的隐藏状态动力学中确实存在清晰的波动模式。然而,其波速被固定为1。受我们之前工作的启发,我们构建了Wave Mamba,允许模型学习可变的波速

在具有挑战性的长序列复制任务上测试:

  • 原始Mamba 在此任务上表现不佳,远逊于Transformer。
  • Wave Mamba 通过引入可变波速,学习速度呈指数级提升,最终性能逼近Transformer,而原始Mamba则需要长得多的时间才能达到类似水平。

这再次表明,允许更灵活的波动动力学(可视为多时间尺度记忆),能为序列模型带来强大的性能提升。波动似乎是解决长程依赖问题的一个有效归纳偏置。


编码连续对称性:波动与变换等变性

上一节我们探讨了波动在记忆方面的作用。本节中,我们将进入一个更概念化的领域:波动如何帮助模型编码世界的连续对称性

世界充满对称性,如平移、旋转、颜色空间变换等。在机器学习中,等变神经网络旨在让网络函数 F 满足:对输入施加一个变换 T,等价于先对输入进行 F 处理,再对输出施加一个相应的变换 T'。卷积网络就是平移等变性的典型例子,这带来了参数共享和高效泛化的好处。

我们认为,时空动力学可能自然地实现一种“慢变换”的等变性。如果世界在发生缓慢的连续变换(如物体旋转),而模型的隐藏状态也经历着同步的、平滑的时空流变,那么模型就可能自动学习到这种变换的等变表示。

为了验证,我们使用之前提到的耦合振子网络进行实验:

  • 任务:训练模型对旋转的数字序列(如旋转的“5”)进行一步超前预测。
  • 过程:输入序列驱动隐藏状态;隐藏状态进行波动动力学演化;解码器从隐藏状态重建下一时刻的输入。
  • 发现:训练后,隐藏状态中产生了对齐的、定向传播的波。波传播的方向编码了旋转变换,而波的波前等细节则编码了物体的身份信息。
  • 等变性验证:我们验证了模型近似满足一个交换关系:对输入施加旋转变换后编码,与先编码原始输入再通过隐藏状态的波动模拟该时间段的变换,两者得到的重建结果基本一致。这表明模型在隐藏状态中学习到了输入变换的同态表示

更令人惊奇的是,当分析模型在处理不同朝向光栅刺激后神经元的朝向选择性时,我们发现,在没有明确监督的情况下,模型自发形成了在空间上平滑变化的朝向选择性图谱,这与初级视觉皮层中的朝向功能柱有相似之处。这表明波动动力学与局部特征表征可以协同共存。


迈向相对性:伽利略与洛伦兹等变性

上一节我们讨论了静态连续对称性的编码。本节中,我们进行一个更前沿的思考:如果变换本身是随时间变化的(如匀速运动),模型应如何处理?这引向了参考系相对性的概念。

物理学中,伽利略相对性原理指出,在所有惯性参考系(相互做匀速直线运动的参考系)中,力学定律形式相同。对于循环神经网络,我们能否构建一个伽利略等变的版本,使其处理在时空中移动的输入时,表现得如同在处理静态输入?

我们定义循环神经网络的“惯性参考帧”:将隐藏状态的神经元排列在空间维度上,其活动模式可以“移动”。一个伽利略等变的RNN要求:对输入序列施加一个匀速平移变换后进行处理,应等价于先处理原始静态输入,再将隐藏状态进行相应的平移。

实验表明,标准的线性RNN或卷积RNN不具备这种等变性。为了实现它,我们需要在模型处理输入的同时,主动地将其“参考帧”与输入的运动对齐。实现这一点的数学变换,恰好又回到了平流方程

我们将这种伽利略等变RNN应用于运动目标检测任务(如移动的光点或游动的鱼)。结果显示,在处理移动的测试数据时,等变模型的性能下降远小于非等变模型,展现了其优越的泛化能力。

一个更深刻的推论是:如果我们使用的动力学是二阶波动方程,那么其对称群将不再是伽利略变换,而是洛伦兹变换(狭义相对论)。这意味着,如果神经动力学遵循此类方程,在高速运动下可能会产生时间膨胀、长度收缩等奇特的感知效应。一些心理物理学实验似乎暗示人类存在类似的主观洛伦兹变换现象,这为未来的研究提供了一个有趣的方向。


总结

本节课中,我们一起学习了时空动力学(特别是波动)如何为人工神经网络提供强大的计算归纳偏置。

我们首先指出了当前大型AI模型在数据效率和直观泛化上的不足,并引入归纳偏置作为解决问题的关键视角。随后,我们探讨了大脑中存在的波动现象,并论证其可能带来两种核心偏置:信息在时空上的整合连续对称性的编码

通过一系列实验,我们展示了:

  1. 波动模型能有效整合超越局部感受野的全局空间信息。
  2. 波动动力学可作为高效的记忆机制,提升模型处理长程时间依赖的能力。
  3. 在现代状态空间模型(如Mamba)中引入可变波速,能显著提升其性能。
  4. 波动网络能自发学习对输入连续变换(如旋转)的等变表示,并形成类似皮层的平滑功能图谱。
  5. 将等变性思想扩展到运动参考系,可以构建伽利略等变的RNN,提升模型对运动输入的泛化能力,并由此连接到更深刻的相对论原理。

总之,将时空波动动力学作为构建模块引入神经网络,是一条通向更高效、更泛化、更接近自然智能计算原理的 promising 路径。

005:神经科学中的亚稳态与瞬态动力学

在本节课中,我们将探讨神经科学中一个核心概念:亚稳态与瞬态动力学。我们将从动态系统的角度出发,解释大脑活动中观察到的各种短暂而持久的模式,例如神经元活动的爆发、同步状态的切换以及癫痫样活动。课程将介绍实现这些现象的多种机制,并特别关注确定性混沌在产生看似随机但实则有序的瞬态行为中的作用。

概述与动机

首先,感谢会议组织者的邀请。在会议第一天,我已经获得了许多启发。

我希望在接下来的几天里,这种启发能够持续。我将展示与几位合作者共同完成的工作,其中包括在场的几位,非常感谢他们的参与。

本次演讲的主题是神经科学中的亚稳态与瞬态动力学。由于时间有限,关于神经科学的部分可能会被压缩。我本质上是一个动态系统研究者,虽然有时涉足神经科学,但我主要受神经科学中的动力学现象启发,来构建和塑造动态系统理论,以解释事物运作的机制。

动机部分可以非常简短,因为它只是从文献中任意选取的一些例子,展示了我们称之为亚稳态的现象。这些例子显示了以特定序列出现的不同神经元活动模式。例如,闭眼时的脑电图记录中出现的微状态,或神经元活动持续一段时间后出现的静息状态(上下状态)。此外,还有不同的活动模式,例如这里的尖峰活动和簇状活动,甚至是受刺激后进入的癫痫样活动。这些动态模式在内部动力学上看起来非常不同,我们希望用一个通用框架来描述它们,为这类模式提供一个统一的视角。

神经科学中的亚稳态概念

在神经科学中,这被称为亚稳态,但其中融合了许多不同的概念。例如,不同活动模式的可变性被称为亚稳态,或者不同状态之间的可变性。同步模式的可变性也是一个例子,正如上一场精彩演讲所展示的,即同步状态的可变性。此外,还有大脑进入不同状态的概念,以及整合与分离的概念,即大脑不同部分要么协同工作,要么各自独立。

因此,存在自发的亚稳态,即不同模式之间的自发跳跃。它也可以由外部信号驱动。这些模式可能重复出现,也可能不重复。可以看到,对于亚稳态是什么,存在多种不同的理解。因此,我们试图寻找一个共同的框架。从动态系统的角度来看,这个共同框架基本上由以下特性定义。

亚稳态的核心特性

亚稳态具有以下特性:存在长寿命但瞬态的准稳定状态。系统会处于某个特定的动态状态中一段时间,例如爆发状态、紧张性放电状态,或更复杂的状态,如同步、非同步、集群同步、完全同步等。这些状态的可能性很多。

这些状态是几乎不变的,意味着系统会在其中停留一段时间,然后离开。最重要的特性是,这类亚稳态必须具有某种属性,因为系统必须在某个时刻到达这些状态。系统从某个地方来,被这个状态吸引,停留一会儿,然后离开。这意味着吸引和排斥的倾向必须同时存在,否则就不是亚稳态。因为亚稳态意味着它是瞬态的,最终会离开。因此,系统有很大概率长时间停留在此,但最终(以概率1)会在某个时刻离开,尽管我们不知道这个时刻何时到来。

实现亚稳态的两种主要机制

观察这一现象,我们有两种不同的实现方式。

一方面,众所周知的是受噪声影响的多稳态系统。多稳态系统是指存在多个不同动态状态的系统。例如,一个双稳态系统,就像图中展示的,有两个稳定的“势阱”。你可以想象在草地上有许多小山谷,每个山谷代表一个稳定状态,小球(系统状态)会落入其中一个。山谷之间是不稳定的区域(鞍点)。所有会流向某个山谷的初始条件集合,称为该稳定状态的吸引盆。吸引盆可以是简单的、平滑的,也可以具有分形的复杂结构,在这种结构下,稍微偏离一点,就难以预测最终会到达哪个状态。

另一方面,也是更有趣的部分,是存在具有吸引和排斥方向的鞍型状态。这些可以是简单的点,也可以是更复杂的结构,这将是下文重点讨论的内容。

噪声诱导的亚稳态

为了给你一个直观印象,最好通过观察双稳态系统来解释。黄色小球在这里,但由于噪声,它会在附近徘徊。存在吸引方向,因为它想滚回谷底;同时也存在排斥方向,噪声可能将它踢过小山,然后它到达另一边,又可能滚回来。这就是在受噪声影响的多稳态系统中观察到的亚稳态。

从这个山谷的逃逸也并非完全随机,尽管有噪声参与。文献中对此有讨论,质疑是否可以称之为亚稳态,因为它似乎是随机的。但事实并非如此。当你考虑这样的“能量景观”时,你总是试图翻越最低的山丘来逃离山谷。轨迹也是如此,存在某些特定的逃逸路径,称为最可能逃逸路径,系统会沿着这些“通道”逃离。

当吸引盆具有分形结构时,情况就更加复杂了。这时,嵌入在吸引盆边界中的不稳定混沌集合决定了跳跃过程如何发生。这些集合的结构决定了实际观察到的现象。

当然,需要补充的是,噪声在多稳态系统中诱导的亚稳态只发生在特定的噪声强度下。如果噪声太强,情况就会改变。概率密度函数的峰值仍然出现在原来的吸引子(现在的亚稳态)位置。但如果继续增加噪声强度,那些具有最小吸引盆的状态就会被噪声淹没。最终,亚稳态消失,一切转变为状态空间中的扩散过程,不再能识别出任何亚稳态,变成一个纯粹的随机过程。

其他确定性机制概述

回到我们的主题,我们希望解释并提供这些现象发生的机制。以下是一些可能的机制,虽然并非全部,但我们将讨论其中几种。

我们已经讨论了噪声诱导的切换。亚稳态系统具有吸引子,这些吸引子是不变的。这意味着一旦到达一个吸引子,如果没有噪声,就会永远停留在那里。如果有噪声,就不会永远停留,最终会离开。因此,这个吸引状态是几乎不变的。在状态空间中存在一个区域,轨迹会在其中徘徊,因为它不仅仅局限于这个状态,而是在其附近波动,但仍然可以识别出它处于哪个状态。

还有其他机制,远不止这些。除了噪声,我们还可以讨论稳定异宿环吸引子合并危机吸引子涌现危机I型间歇性,以及我将特别关注的混沌鞍

具体机制详解

让我给你一个关于异宿环的概念。这里有三个状态(逗号处),轨迹停留在一个状态,跳转到另一个,再跳转到第三个,如此循环。每个状态都有特定的属性,它们不一定是固定点,可以是周期轨道,甚至是混沌状态。这里可以看到不同的模式,但同样具有吸引和排斥方向,这与我们之前学到的属性相同。

对于吸引子合并危机,它看起来与噪声诱导的切换非常相似,但并非由噪声引起。在形式化描述中,在合并危机发生前,存在两个不同的吸引子。它们开始接触,这种接触是通过一个不稳定的周期轨道作为“桥梁”实现的。这意味着,当系统是混沌的,轨迹在状态空间中游走时,偶尔会非常接近这座“桥”。一旦接近,它就有机会跳到另一边,在那里停留一段时间,然后又随机地接近桥梁,跳回另一边,如此反复。在逻辑斯蒂映射中可以看到这种吸引子合并危机,两个混沌吸引子带相互接触,并由一个在首次倍周期分岔中失去稳定性的周期轨道作为媒介。

还有其他类型的吸引子危机。例如,在逻辑斯蒂映射的周期三窗口中,存在所谓的内部危机。危机前,存在一个小的吸引子。这里,这个对象(不稳定周期轨道)将成为媒介轨道。危机后,出现一个大的吸引子,它本质上由原来的混沌吸引子和一个混沌鞍合并而成。这座周期轨道桥梁连接了它们,因此我们可以看到系统浸入到这个大对象中的远足。在模拟中,黄色小球大部分时间在绿色集合上徘徊,但偶尔会离开绿色集合,跳到蓝色集合上,然后再回到绿色集合。我们总是有一座“桥”,即那个媒介性的周期轨道,促成了这种转换。

还有其他现象,例如间歇性。这里只展示一种类型,但其他类型原理相似。存在一个周期轨道,然后系统进入绿色的混沌状态,在其中徘徊一段时间,然后又回到周期轨道附近。这同样发生在之前看到的内部危机所在的周期窗口附近,而I型间歇性则发生在窗口的另一侧。

最后,还有边界危机,这也是混沌吸引子的一种危机。在文献中,通常说混沌吸引子“消失”了,但这并不准确。它并没有消失,而是仍然存在,但变成了瞬态性质。也就是说,它变成了一个混沌鞍。系统最终会离开这个鞍,但你仍然能看到这种混沌动力学的残余。在视频中,我们可以看到黄色点在这个对象上跳跃一段时间,但在某个时刻确实逃逸了,到达了一个新的解。所有这些机制在动态系统理论中都是众所周知的,并导致了这种亚稳态行为。

瞬态混沌与混沌鞍

当我们观察这些转换时,存在大量可能导致亚稳态的机制。它们的特点通常是不同结构的寿命大致呈指数分布,这使得过程看起来是随机的。

那么,什么是瞬态混沌?让我简单说明一下。瞬态混沌和混沌鞍不像混沌吸引子那样广为人知。混沌吸引子是一种不规则行为,其特征是初始邻近的轨迹呈指数分离,可以用李雅普诺夫指数(至少最大的那个为正)来量化。而混沌鞍是,意味着可以沿着其稳定方向到达它,并沿着其不稳定方向离开它。如果你在混沌鞍上放置大量初始条件,观察有多少轨迹逃逸以及何时逃逸,你会看到这种衰减,即指数衰减,其速率称为逃逸率

混沌鞍本身看起来像这样(以周期驱动的摆为例),其稳定和不稳定方向比简单的鞍点更复杂。在二维系统中,只有两条轨迹进入,两条离开。但在混沌运动中,这看起来更复杂。这是稳定方向,这是不稳定方向,两者的重叠就是混沌鞍,也就是这里绘制的黄色物体。

混沌鞍在动态系统中非常常见。它发生在边界危机之后,也发生在周期窗口内(无论是倍周期级联还是周期叠加级联),或者当吸引盆边界变为分形时嵌入其中。因此,这是一大类系统,我们必须预期这类现象也会发生在高维系统中。考虑到我们研究的网络,它们就是高维系统,并且通常具有振荡行为。

网络中的实例:FitzHugh-Nagumo模型

现在,让我展示混沌鞍在由可兴奋和振荡单元组成的网络亚稳态中的作用。这些单元由FitzHugh-Nagumo方程描述,这是一个非常简化的可兴奋性模型。可兴奋性意味着存在一个兴奋变量会突然增长,然后一个抑制变量也随之增长并最终终止兴奋。

首先,我们看看两个这样的单元耦合在一起会发生什么。对于某些耦合强度,只看到低振幅振荡。这两个单元处于振荡状态,它们相互抑制,产生小振幅振荡。一旦增加耦合强度,就会发生完全不同的事情:出现这种极端事件,即自发生成和终止的事件,两个振荡器同步进行,形成这样的极端事件。

这些事件的分布如何?事件之间的等待时间如何?这也是指数分布,是一个泊松过程。因此,它再次看起来是随机的,尽管完全是确定性的。它是如何工作的?我们更详细地观察一个例子。我们看到两个振荡器,就像一个想去酒吧而另一个不想去的两个朋友。想去酒吧的是右边这个,它“发射”出去,并“拉”着另一个一起。然后它们共同形成了这个极端事件。

其机制是:我们在这里有一个低振幅的混沌运动。向极端事件的转换也不是随机的,这里出现了一个通道状的结构。一个轨迹进入通道,另一个被拉在后面,然后它们共同形成事件。这让我们想起了随机系统,在随机系统中,我们也需要翻越最低的山丘。在这里,我们需要进入通道。因此,进入通道是罕见的,但也是循环发生的,因为当你在附近徘徊时,最终(以概率1)会到达通道,然后发展出另一个极端事件。这就像玩游戏,你必须找到正确的方向才能进入通道并形成极端事件。

全网络中的行为

现在看看整个网络的情况。我们有一个在频率上异质但全连接的网络,再次看到了相同类型的行为。这种行为发生在内部危机时,即周期叠加级联和倍周期分岔级联交汇处。在神经科学中,许多神经元模型都会出现这种情况,因此可以预期这类行为。

接下来,改变网络的拓扑结构。我们从类似方格的结构开始,主要采用最近邻耦合。然后,我们用一些长程连接替换部分连接。这时,会发生完全不同的事情。在视频中,我们看到波。然后,波会被类似“闪光”的东西打断,之后波又回来。加速后,我们看到从波到另一种模式的转换:出现了振荡单元集群,它们一起放电,然后消失。这些集群总是不同的。有时,我们还会看到极端事件,即几乎整个网络同时“闪光”,然后可能又有一小段波,接着又回到集群模式,如此反复。

当我们观察这种动态时,它是瞬态的。原则上,这个系统中有三个吸引子:低振幅振荡、行波和全局振荡(即持续不断的极端事件)。当我们分析瞬态动力学时,例如在每个模式中停留的时间、切换到下一个模式前的等待时间,我们需要对这些结构进行分类。可以使用瞬时李雅普诺夫指数来分类,不同模式(波、集群、极端事件)的指数模式非常不同。也可以通过设定阈值来分类极端事件,并对波和低振幅振荡进行分类以获得良好的统计。

观察整个统计,我们看到等待时间和持续时间(至少对于那些有良好统计的模式)大致呈指数分布。极端事件很罕见,因此其持续时间统计很差,但等待时间统计尚可。这种切换,尽管完全是确定性的,但看起来是随机的,就像有噪声一样。

在参数空间中观察,这里显示了不同的吸引子。有时系统是双稳态的。黄色区域是最重要的部分,这里的参数是“重连率”,即我们有多少长程连接。在这个区间内,收敛到任何吸引子都非常罕见,我们有很长的瞬态,并且存在一个大的参数区间,其中这种在不同模式之间的长时间跳跃和不规则切换会发生。

我们也可以改变网络的异质性,得到类似的图像,即存在两个大的参数区间,这种模式切换会发生。整个现象的基础是一个混沌鞍。它是一个不稳定的混沌集合,包含了三种不同的时空模式。我们在这个混沌鞍上运动,在没有外部刺激或噪声的情况下,在不同模式之间切换。这是一个纯粹的确定性过程,通过切换使我们能够到达混沌鞍上的不同模式。

转换的通道结构

现在让我们看看转换本身。我们已经在两个耦合单元中看到,存在一个通道状结构,引导系统发展出极端事件。在这里,对于从低振幅到波、从低振幅到极端事件的不同转换,我们看到了相同类型的行为。从极端事件转换到低振幅振荡或波结构时,我们也看到这种行为,即存在一个必须通过的特定通道,否则就不会发生转换。

这是一个示意图,展示了它是如何发生的。关键量是这里的鞍点,它位于低振幅振荡中间。这个鞍点及其流形组织着整个动力学:如果你走向流形的一侧,你会从极端事件走向波;如果你走向另一侧,你会走向低振幅振荡。这意味着,整个亚稳态行为完全由不稳定集合(鞍点)和不稳定集合(混沌鞍)组织起来。

另一个例子:同质网络与延迟耦合

最后几分钟,让我们看看另一个混沌鞍和另一种动力学,同样基于FitzHugh-Nagumo模型。现在观察一个同质网络(节点相同),但耦合具有异质性,表现为两种不同的延迟连接两个节点。我们再次看到一种亚稳态行为:系统在完全同步(同相振荡)和不同步(反相振荡)之间切换。对于低耦合强度(第二种延迟),同步流形是吸引的,一切都被吸引到其中,我们得到混合模式振荡。然后,发生所谓的冒泡转变,导致同步流形中出现横向不稳定的区域,轨迹找到“漏洞”逃逸。

其机制是:同步流形仍然是吸引的,因此长期来看我们会到达这里的混沌吸引子。但这里存在一个混沌鞍。当我们接近这个不稳定区域时,被弹射出去,在外面徘徊,然后又回来。如果随着延迟时间的另一个临界转变发生吹出分岔,那么这个区域(混沌鞍)会变成横向不稳定的,但它仍然是一个混沌吸引子,只是会接近同步流形,看起来像是原来稳定同步解的残余。我们不会到达它,只是接近,然后又进入反相振荡状态。这是一种进出间歇性:你沿着一条轨道接近同步流形,在其中徘徊到另一条将你再次弹射出去的轨道。

这个过程可以持续非常长的时间,瞬态有时极长,远超过积分时间,以至于你可能永远看不到它结束。与这种行为相关的是,吸引盆甚至比之前看到的更复杂:存在分形吸引盆,也存在所谓的** riddled 吸引盆**,即在吸引子的任意小邻域内,都存在属于另一个吸引盆的点,系统可能被踢出去。这同样导致了这种亚稳态动力学。

总结

综上所述,我展示了两种可以被识别为亚稳态的机制。

第一种是多稳态系统,其中不同的稳定状态共存,当存在噪声时,它们当然会变成亚稳态。

第二种是我刚刚展示的动力学,其中不同的鞍型状态在组织整个亚稳态动力学中发挥作用。噪声诱导的行为和鞍型行为具有相同的属性:它们都是长寿命的、瞬态的。正如我们所见,两者都具有向内吸引和向外排斥的倾向,这一点非常重要。

在高维系统中,混沌鞍具有极高的重要性。系统的维度越高,存在嵌入在吸引盆边界中的混沌鞍的概率就越大。这意味着,在高度多稳态的系统中,我们必须始终考虑这种机制。即使在单个单元不具备混沌鞍的网络中,网络本身也可能产生混沌鞍。

我们展示的转换在两种情况下都高度局域化于状态空间,总是存在这种轨迹必须通过的“通道”。这意味着跳跃并非完全随机,状态空间的某些部分似乎扮演着非常重要的角色。识别这些部分是当然是一个挑战。

此外,识别这些亚稳态状态本身也是挑战,当然有可用的方法(之前的演讲中已经提到了一些)。同样重要的是时间尺度分离,特别是在神经科学中,因为电过程(快)和化学过程(慢)的时间尺度分离可能在转换中扮演重要角色。我们最近的研究表明,在FitzHugh-Nagumo系统中,依赖于时间尺度分离的噪声诱导转换不再经过鞍点,因为时间尺度分离将系统推离了鞍点。这意味着我之前描述的所有转换,在增加系统的时间尺度分离(这在神经科学中非常重要)后是否会以同样方式发生,又成了新的问题。这是我们未来希望解决的问题。

谢谢大家。

007:额叶皮层认知序列的跨物种平行动力学

在本节课中,我们将要学习认知控制,特别是大脑如何执行和监控抽象的任务序列。我们将从人类的行为和脑成像研究开始,探讨前额叶皮层在序列处理中的作用,然后过渡到非人灵长类动物的研究,以探索跨物种的功能同源性。

概述

我们拥有根据目标和计划调整行动的非凡能力,这可以定义为认知控制。这种能力在处理需要按特定顺序执行一系列动作或思考的任务时至关重要,例如计划一顿饭或煮咖啡。这些序列在我们的生活中无处不在。有趣的是,猴子也表现出类似的序列行为。理解大脑如何控制这些序列是一个核心问题,对于理解某些临床障碍(如强迫症)以及推动人工智能的发展都具有重要意义。

人类如何控制任务序列

上一节我们介绍了认知序列的概念,本节中我们来看看在实验室中如何研究人类对抽象任务序列的控制。

我们使用一个简单的任务来研究。在每一个试次中,参与者会看到一张图片,并需要按按钮对其进行分类,判断依据是颜色或形状。

参与者如何知道该进行哪种判断呢?在每一个试次块开始时,屏幕上会显示一个指令序列,例如“颜色、形状、形状、颜色”。

当第一张图片出现时,参与者必须记住第一个任务是“颜色”判断,因此如果图片是红色,就按下按钮1。第二张图片出现时,他们必须记住第二个任务是“形状”判断,因此如果图片是蓝色方块,就按下按钮2。如此重复整个序列。关键点在于,指令屏幕只显示一次,之后参与者必须在没有外部提示的情况下,在内心记住并跟踪自己在序列中的位置。

在一个试次块中,参与者需要重复执行这个序列。这就在内部创建了序列边界,他们必须在每个序列结束时重新开始。我们研究两种序列形式:

  • 复杂序列:例如“颜色、形状、形状、颜色”,其中包含两次任务切换。
  • 简单序列:例如“颜色、颜色、形状、形状”,其中只包含一次切换。

重要的是,当把序列连接起来看时,简单序列的第一个位置实际上也是一次切换(相对于前一个序列的末尾),因此两种序列的总切换次数和重复次数是平衡的。

我们如何知道参与者确实在以序列方式执行任务呢?行为数据提供了清晰的标记。

以下是反应时在序列四个位置上的表现:

  1. 任务切换成本:在需要切换任务的位置(例如复杂序列中的位置1和位置2),反应时显著升高。
  2. 任务重复优势:在重复任务的位置(例如复杂序列中的位置3),反应时较低。
  3. 序列启动成本:在序列的第一个位置(位置1),反应时显著升高。这是一个特别重要的标记,因为在复杂序列中,位置1的任务类型(如“颜色”)相对于前一个序列的末尾是重复的。如果仅基于任务重复,我们预期反应时应该很低,但实际观察到的升高表明,这反映了启动整个新序列的独特认知过程。

大脑中的序列表征:RLPFC 的斜坡活动

上一节我们看到了序列执行的行为特征,本节中我们来看看大脑中哪些区域参与了这一过程,特别是吻外侧前额叶皮层

我们关注大脑的这部分区域——沿着中央前回外侧前额叶皮层。我们感兴趣的原因是,在需要整合信息层级的静态决策任务中,这个脑区表征着最高层级的信息。在我们的序列任务中,我们以序列形式向参与者提供了这种层级信息:根据他们在序列中的位置,他们知道该做出何种决策。因此,我们预测这个区域会参与。

当人们执行序列任务时,我们在这个区域(具体是吻外侧前额叶皮层)观察到一种独特的活动模式:BOLD信号随着序列步骤的推进而逐渐上升(斜坡活动),并在每个新序列开始时有一定程度的重置。

如果观察整个大脑,显示这种斜坡动态的区域并不多。它主要出现在一个额顶控制网络中,但并非整个大脑都如此。今天我们将主要聚焦于吻外侧前额叶皮层。

那么,这种斜坡活动是序列处理所独有的吗?我们检查了另一个区域——前背侧前运动皮层(也称为布罗德曼44区的一部分)。这个区域的活动模式不同:它不显示斜坡活动,而是简单地在简单序列和复杂序列之间表现出活动水平的差异。

因此,前额叶皮层的不同区域对序列有不同的反应模式,并非整个前额叶都表现出相同的斜坡动态。

斜坡活动的功能:经颅磁刺激研究

上一节我们观察到RLPFC在序列任务中表现出斜坡活动,本节中我们通过经颅磁刺激实验来探究这种活动是否是执行序列所必需的,以及它在序列中的具体作用。

一个核心问题是:这种斜坡活动是干什么用的?首先,它是否必要?如果是,那么它可能在整个序列执行中都起着作用。或者,它可能只参与序列中某些特定时间点的瞬时过程。

我们最初的一个假设是:这种斜坡活动可能与跟踪序列中的不确定性有关。随着在序列中一步步推进,个体对自己所处位置的确定性可能会逐渐降低,不确定性增加,RLPFC的活动可能反映了这种不确定性的累积。

我们使用单脉冲经颅磁刺激来暂时干扰特定脑区的神经活动。我们在刺激出现后、参与者做出反应前的一个时间点施加单脉冲TMS,并且每个序列最多只刺激一次(例如在位置2或位置4)。

我们刺激了两个区域:表现出斜坡活动的RLPFC和表现出序列间差异的前背侧前运动皮层。我们测试了10个不同的刺激时间点。

以下是主要发现:

  • 时间特异性:刺激RLPFC在较早的时间点会导致错误率增加,而刺激前背侧前运动皮层则在较晚的时间点导致错误率增加。这暗示这两个区域可能存在功能层级。
  • 动态效应:当我们观察刺激对序列不同位置错误率的影响时(比较刺激试次与非刺激试次),发现对于RLPFC,这种干扰效应从序列开始到结束逐渐增大(呈斜坡式上升)。而对于前背侧前运动皮层,效应模式几乎相反。

为了控制TMS本身的感觉效应(如头皮被敲击感),我们增加了另一个控制区域——吻内侧前额叶皮层。结果再次证实了RLPFC的斜坡式干扰效应,而吻内侧前额叶皮层的刺激效应与零没有显著差异。

我们学到了什么?

  1. RLPFC的斜坡活动对于序列执行是必要的。
  2. 结果表明,在序列任务中可能存在一个瞬时的“检查点”机制,以保持任务跟踪。RLPFC的参与表明,你对自己正在跟踪的事物的不确定性越高,就越容易出错。
  3. 这为额叶功能障碍患者为何会“迷失”在复杂任务中提供了一个潜在解释。

深入探究:斜坡活动背后的计算

上一节我们通过TMS确定了RLPFC斜坡活动的必要性,本节中我们将快速浏览一系列实验,以更深入地理解这种动态背后的计算原理。

我们通过几个实验来探究斜坡活动是否由特定因素驱动:

  1. 不确定性:我们给参与者提供了关于序列位置的线索,以降低不确定性。结果发现,无论有无线索,RLPFC的斜坡活动依然存在,并未发生显著改变。
  2. 多层级决策:我们让参与者完成一个更简单的任务——只需记住并判断一系列物体的呈现顺序(没有抽象决策)。结果发现,RLPFC仍然显示出斜坡活动,但同时有更多视觉皮层区域参与。这表明多层级抽象决策并非产生斜坡活动的必要条件。
  3. 位置线索:在物体序列记忆中,我们模拟了物体被遮挡的情况(没有直接视觉线索)。结果发现,无论物体可见还是被遮挡,斜坡活动依然存在且没有显著差异。这表明即使没有外部位置线索,这种动态也很稳健。
  4. 目标与奖赏:我们改变了任务,让参与者记忆物体序列,但有些序列会带来高奖励,有些则是低奖励。我们发现,斜坡活动会受到奖赏的调制,但仅限于序列块快结束、奖赏即将交付时。高奖励序列的斜坡活动持续上升,而低奖励序列的斜坡活动则有所下降。这表明奖赏会调制但并非驱动斜坡活动的唯一因素。

快速回顾:
我们展示了RLPFC的斜坡动态非常稳健。它不受(我们操纵的)不确定性影响,在没有多层级决策和位置线索的任务中依然存在,并且会受到目标/奖赏的调制。

那么,这种动态到底在做什么?
我们目前认为,RLPFC的斜坡活动可能是在随时间跟踪或监控“状态”信息。有建模工作表明,斜坡作为一种动态编码,可以是一种高效的序数编码方式,因为你可以为正在跟踪的序列中的每个位置分配一个独特的活动水平。

序列控制的紊乱:以强迫症为例

上一节我们探讨了正常的序列神经机制,本节中我们来看看当这些机制可能出错时会发生什么,例如在强迫症中。

我们开始研究强迫症的原因包括:

  1. 行为表现:强迫症患者常表现出重复性的行为序列(如反复检查门锁、炉灶),这些行为阻碍了他们达成最终目标。
  2. 神经环路重叠:与强迫症相关的脑区与前额叶控制网络有大量重叠。
  3. 理论支持:有理论提出“结构化事件复合体”的概念,这本质上就是序列。
  4. 已有证据:强迫症患者在非序列的认知控制任务(如任务切换)中也存在缺陷,且缺陷程度与症状严重性相关。

我们提出了两个替代性假设进行测试:

  1. 序列控制缺陷假说:强迫症患者在抽象序列控制上存在缺陷,表现为RLPFC活动降低和斜坡活动减弱。
  2. 一般认知控制缺陷假说:缺陷主要体现在与任务切换更相关的一般认知控制脑区(如背外侧前额叶皮层、前扣带回皮层),并且与症状严重性相关。

我们让强迫症患者和健康对照组执行相同的序列任务。

行为结果:

  • 反应时:两组模式基本相似,强迫症组可能稍慢。
  • 错误率:关键差异出现在切换成本上。强迫症患者的切换成本(切换试次与重复试次错误率之差)显著小于健康对照组,因为他们不像健康人那样在重复试次上错误率显著下降。这种减小的切换成本与症状严重性相关。

脑成像结果:

  • RLPFC:在活动起始点或斜坡活动强度上,两组没有显著差异。活动起始点与症状严重性有轻微相关,但斜坡活动没有。
  • 全脑网络:尽管在特定ROI内差异不大,但强迫症患者和健康对照组用于完成任务的脑区网络有很大不同。直接对比显示,强迫症患者在额上沟(背外侧前额叶皮层后缘)和吻侧前扣带回皮层的活动与对照组有显著差异。

结论:
尽管强迫症可能表现为序列控制缺陷,但我们的证据更支持缺陷主要源于涉及一般认知控制和任务切换的神经环路。一个重要的注意事项是:在我们的任务中,任务切换是嵌入在序列中的,因此不能完全排除序列复杂性本身的影响。我们需要扩展关于序列的神经生物学模型。

此外,其他工作表明,相同的任务可以区分焦虑症、强迫症和健康对照组,说明抽象序列任务具有诊断潜力。

跨物种比较:从人类到猴子的fMRI研究

上一节我们探讨了人类序列控制的神经基础及其紊乱,本节中我们将视角转向非人灵长类动物,通过fMRI研究来探索跨物种的功能同源性。

我们的长期目标是让猴子执行与人类完全相同的任务,从而直接测试功能同源性,并在神经元水平研究这些动态。那么,我们从哪里开始?

首先是一个基本问题:猴子大脑中是否存在与人类吻外侧前额叶皮层功能类似的区域?一个起点是猴子的背外侧前额叶皮层。已有大量电生理研究表明:

  • 在运动和感觉序列任务中,该区域神经元表现出对序列位置的调谐。
  • 该区域也表征非序列的抽象规则。

从解剖连接性和功能连接性来看,与人类RLPFC连接模式最相似的猴子脑区是位于主沟深部46区

因此,我们从两个基本问题开始研究猴子:

  1. 猴子46区是否表征抽象的视觉序列信息?
  2. 该区域是否存在与序列相关的斜坡动态?

我们使用最简单的序列追踪/监控任务来研究。我们让猴子在扫描仪中注视一个中心点,观看以特定规则模式呈现的分形图像,例如“相同、相同、相同、不同”。猴子不需要做任何反应(无报告任务)。

我们使用“偏离”范式:先让猴子习惯一种规则序列,然后在某些试次中插入不同类型的“偏离”刺激,通过大脑对偏离的反应来推断其内部是否存在序列表征。

  • 规则偏离:改变序列规则。
  • 数量偏离:改变“相同”或“不同”项目的连续数量。
  • 双重偏离:同时改变规则和数量。

关键比较是:规则偏离 vs. 相同规则的新项目。这控制了“新异刺激”效应,因为两者都是新图像,任何差异都应归因于规则违反。

结果:

  1. 序列表征:在位于主沟深部的46区,我们观察到了对规则偏离数量偏离的显著BOLD反应。全脑分析显示,背外侧前额叶皮层是唯一对两种偏离都反应的区域。
  2. 斜坡动态:我们使用与人类研究相似的模型,也发现了与序列相关的斜坡活动变化。具体来说,在规则偏离(而非数量偏离)条件下,该ROI的活动出现显著变化。全脑分析也确认了背外侧前额叶皮层的参与。

结论:

  1. 猴子46区表征抽象的视觉序列信息。
  2. 该区域存在与序列相关的斜坡动态。
    这为我们思考跨物种的功能同源性奠定了良好基础。有趣的是,猴子和人类的斜坡活动都显示出一定的左侧化倾向,值得进一步探究。

猴子大脑内的功能特异性:46区的细分

上一节我们确认了猴子46区参与序列处理,本节中我们进一步探究该区域内部的功能特异性。

46区并非一个均一的区域,它面积较大,且可根据细胞构筑和功能连接细分为多个子区。我们特别关注两个相邻子区:

  • P46F:位于主沟深部(后部),功能连接性与人类RLPFC相似,是我们之前发现序列反应的区域。
  • P46V:位于更腹侧的位置,与视觉皮层有更多连接。

我们想探究:序列反应是遍布整个46区,还是具有功能特异性?

我们让猴子执行序列任务非序列任务(顺序打乱的相同刺激),并比较这两个区域的反应。

结果:

  • 序列任务:P46F对规则和数量偏离有反应,而P46V不关心序列水平的偏离。
  • 非序列任务:P46F对刺激变化(如图像、时间)没有反应,而P46V则对这些变化有反应。
  • 熟悉度:在非序列任务中,P46V对图像曝光度(高 vs. 低)的变化有反应,而P46F没有。

结论:
我们可以在46区内部分离出功能不同的子区域:P46F专门处理序列信息,而P46V则更偏向于处理视觉特征和熟悉度。这证明了前额叶皮层内功能组织的特异性。

从宏观到微观:猴子46区的电生理记录

上一节我们通过fMRI在宏观层面定位了猴子序列处理的脑区,本节中我们将进入微观层面,介绍我们最新的电生理记录研究,以直接观察神经元的活动。

我们进行功能靶向的神经元记录。根据fMRI激活图(规则偏离的对比)来指导我们的电极植入位置。

我们带着几个简单的假设开始:

  1. 神经元放电率会在不同序列类型间出现分离。
  2. 我们会观察到与序列相关的神经斜坡活动。
  3. 这些对偏离有反应的神经元在解剖位置上会与BOLD激活区域重合。

初步结果(基于两只猴子约650个神经元单位):

  1. 反应类型多样:我们观察到多种反应类型的神经元。
    • 对偏离类型有选择性反应的细胞(有些对规则偏离反应更强,有些对新项目反应更强)。
    • 对习惯化刺激与偏离刺激有差异反应的细胞。
    • 大约20%的细胞对序数位置有反应。
  2. 斜坡活动:我们确实观察到一些对序数位置表现出斜坡式放电的神经元,但这并非大多数细胞的反应模式。这表明我们在BOLD信号中观察到的斜坡动态,可能并非源于大量单个神经元的斜坡放电,而是群体活动的某种涌现属性。这是我们正在努力理解的问题。
  3. 解剖共定位:对偏离有显著电生理反应的记录位点,在空间上与fMRI中规则偏离的激活区域有很好的重合。在两个猴子的数据中,深度记录点(对应于P46F区域)的反应与BOLD激活区域匹配,而该区域外的记录点则很少出现显著反应。

结论:
电生理记录初步证实了我们在fMRI中的发现:

  • 46区存在对序列信息敏感的神经元。
  • 这些反应在解剖上与BOLD激活区域共定位。
  • 斜坡动态的神经基础比单个神经元的斜坡放电更为复杂。

我们还可以进行反向推理:根据电生理记录中发现的神经反应类型,反过来在fMRI数据中寻找对应的活动模式,从而在两个研究层面之间建立更紧密的联系。

总结

本节课中我们一起学习了认知序列控制的跨物种神经机制。

我们从人类研究开始,揭示了吻外侧前额叶皮层在跟踪和监控抽象任务序列中的关键作用,其斜坡活动对于序列执行是必要的,并且可能反映了对内部状态的跟踪。在强迫症中,序列控制缺陷可能更多地与一般认知控制环路(如背外侧前额叶皮层和前扣带回)的功能改变有关,而非特异的序列处理区域。

接着,我们过渡到非人灵长类动物的研究。通过fMRI,我们发现在猴子背外侧前额叶皮层46区(特别是主沟深部的P46F子区)存在对抽象视觉序列的表征和相关的斜坡动态,这为与人类RLPFC的功能同源性提供了证据。进一步的电生理记录初步证实了神经元水平对序列信息的编码,并且这些反应与宏观的BOLD激活区域在解剖上共定位。

这项研究建立了一个桥梁,允许我们在人类和猴子之间进行直接比较,从而更深入地理解序列认知控制的进化保守的神经计算原理。未来工作将继续利用这种跨物种方法,在细胞环路水平上解析序列处理的机制,并将其与人类的行为和临床障碍联系起来。

008:传播运动皮层模式编码运动的起始与执行

在本节课中,我们将探讨运动皮层中活动的传播模式,这些模式可能编码了运动起始与执行的信息。我们将从经典的皮层功能图谱开始,逐步深入到皮层振荡、传播模式及其与行为的关系,最后讨论这些模式可能的功能意义。

从彭菲尔德图谱到皮层空间模式

上一节我们介绍了课程概述,本节中我们来看看运动皮层功能组织的经典观点。许多人都知道著名的彭菲尔德图谱,它描绘了大脑皮层运动区与身体各部位的粗略对应关系。这张图谱很重要,因为它与我们观察到的皮层空间模式相关,或者说它激励了我去寻找这些空间模式。

这张图展示了大脑皮层运动区的横截面,从代表腿部的区域开始,到手、手臂、面部,包括舌头。这张图谱多年前被绘制出来,并在宏观层面上被多次验证。然而,在更精细的尺度上,它是具有误导性的。彭菲尔德本人也从未声称存在如此精细的定位。例如,它让人误以为存在一个专门的拇指区域、食指区域或手腕区域,但事实并非如此。

在我主要研究的上肢(手臂和手)区域,情况并非如此。腿部区域可能也是如此。我同时研究口面部系统,包括嘴唇和舌头,在精细尺度上,你同样找不到不同身体部位的特定分区。在宏观尺度上图谱是准确的,但在精细尺度上则不然。

当我们观察这个局部的手臂-手区域时,情况相当混乱。我们看到的是高度分布式的表征。例如,拇指在手臂-手区域的许多位置都有表征,手腕也是如此,它们相互交织在一起,似乎没有任何空间结构。

因此,我有些羡慕视觉系统或体感系统的研究者。顺便提一下,体感系统中存在更清晰、明确的躯体拓扑图,有明确的拇指区、食指区、手腕区。但那是感觉皮层。在运动皮层,其组织方式似乎没有明确意义,或者看起来是随机的。这激励了我去寻找空间模式,而事实上我们也确实找到了。

运动皮层的传播波

在了解了静态图谱的局限性后,本节我们来看看运动皮层中是否存在其他时空结构。大约二十年前,我们发现了在运动皮层中传播的波的证据。这是一种呈现形式,经过平滑处理使其看起来更清晰,它是通过局部场电位测量到的。

与MT区不同,运动皮层存在一个非常显著的振荡,即β振荡,频率大约在15到35赫兹之间。这些波是由我们在运动皮层观察到的这些振荡介导的。自我们的工作以来,已有证据表明运动皮层存在不同类型的波模式,但我们主要关注平面波,即沿单一方向平面传播的波。

部分动机在于,这是最常观察到的波类型。此外,考虑到阵列相对于运动皮层的大小,这似乎是一个很好的近似。与覆盖整个MT区的绒猴实验不同,这些阵列只覆盖了整个区域的一小部分,因此对这些模式的局部近似可能是一个平面或单一方向。

这是中央沟。这是大脑前部,这是大脑后部。这些是我们在四只猴子身上观察到的传播方向,用颜色编码。它们倾向于沿两个方向之一传播:要么向吻侧,要么向尾侧。有趣的是,我们还在另一个称为背侧前运动皮层的结构中植入了阵列,这个区域参与运动的早期计划,与实际运动执行的关系不那么密切。在那里我们也观察到了波,但它们的朝向是内侧-外侧方向。

因此,如果考虑涵盖运动皮层和前运动皮层的整个区域,你可能会看到更复杂的东西。虽然我们尚未研究这一点,但可以认为波可能以这种方式传播,然后改变方向,因此它们不仅仅是单一的平面或方向。在更大尺度上,它们可能更复杂,这也是一个非常有趣的问题。顺便提一下,这些是猕猴。我希望能在绒猴身上进行一些实验,它们的大脑更小,可以记录更大比例的脑区。

运动准备与观察期间的皮层活动

上一节我们介绍了传播波,但多年来我们一直试图弄清楚这些波可能具有什么功能,却未能找到这些传播波与行为之间的任何联系。也许存在某种联系,有待研究,但我们一直在努力寻找其可能的功能,因此我们研究了与这些波相关的其他传播模式。

我们想解决的第一个问题是:为什么在运动准备或动作观察期间不发生运动?我们找到了证据支持传播模式可能解释这个问题。当你准备做一个动作时,在猴子实验中,它们坐在那里,手臂放在一个联动外骨骼机器人上,手放在一个手柄上,它们控制一个光标。光标位于屏幕中央,然后出现一个它们需要触及的目标。

但我们设计的实验包含一个准备期,猴子必须坐在那里。它们得到视觉提示,知道未来要去哪里,但必须等待目标开始闪烁才能启动运动。当然,这很困难,训练猴子需要数月时间,因为猴子自然会将击中目标与奖励联系起来,而现在你告诉它们要等待。在那段等待时间里,推测存在运动准备,因此我们观察到了准备期活动。

如果你记录运动皮层,你会在这个准备期看到活动。那么,为什么猴子没有移动?因为我们知道运动皮层发出投射,通过皮质脊髓束最终影响肌肉。那么,为什么运动皮层被激活了,却没有产生运动?这是我们要解决的问题之一。

同样地,在猴子(以及人类)观察动作时,你实际上也能看到运动皮层的激活。这是我以前的研究生丹尼斯进行的一项研究,他让猴子做伸手动作,然后在电脑屏幕上回放猴子刚刚执行的动作视频。所以它们基本上是在被动地观看光标移动到目标。有趣的是,我们在许多细胞中观察到非常相似的调制。细胞在主动执行动作和观察相同动作时的反应方式非常相似。

这又引出了一个问题:在动作观察期间,为什么实际上没有产生运动?因为我们训练这些猴子只是被动观看屏幕,不做任何动作,它们是如何做到的?是的,在不同的实验中,我们有时会改变准备期,从1秒到1.5秒随机变化,有时则保持固定。但问题是,如果延迟固定,它们确实会预测“开始”信号的时间。在这种情况下,它们的反应时会非常快,因为它们知道“开始”信号何时会出现,它们会提前开始移动,反应时比正常情况更快。

通常,在随机间隔或没有指令只是看到目标就移动的情况下,猴子的典型反应时约为300-350毫秒。如果是可预测的,它们的反应时会更快。

解释运动皮层激活但不运动的假说

那么,是什么解释了这种在计划或观察运动时激活运动皮层但实际上并不运动的现象呢?有以下几种假说:

以下是几种主要的解释假说:

  • 门控假说:由Bullock和Grossberg多年前提出,认为存在某种机制,可以门控来自运动皮层的信号,阻止它们到达脊髓驱动肌肉。这是一种“关闭开关”或“门”。
  • 阈值假说:也许这些细胞被激活了,但激活强度不够。事实上,我们通常观察到,在准备或观察动作时,细胞的放电强度不如执行运动时强。因此,可能细胞被激活了,但尚未达到实际触发运动的阈值。下游可能存在某种非线性机制,尚未达到启动运动的程度。
  • 零空间假说:由我的同事Matt Kaufman提出。这个想法是,在高维神经状态空间中,存在一些维度或子空间实际上不会导致运动。在准备期间,神经活动可能在这个从神经元到运动的投射矩阵的零空间中徘徊,因此你可以看到活动,但不会产生运动。

这些都是有趣且看似合理的想法,但我们有另一个想法。我认为所有这些解决方案都缺少一个我们观察到的现象:局部振荡活动的去同步化。

β振荡与运动起始信号

我提到了β振荡。β振荡是显著的振荡,你实际上可以看到它。这是一条原始的局部场电位轨迹。零点是动物收到要触及的目标的指令信号出现的时间。这里有一个准备期,直到“开始”信号在这里出现,然后运动发生。

在准备期,你可以看到非常强烈的锯齿状模式,那就是β振荡。这些是介导我之前提到的那些波的振荡。如果你将信号带通滤波到β波的窄带内,你可以非常清楚地看到它们。它们在准备期间非常显著且振幅高。

然而,有趣的是,在“开始”信号之后,它们开始衰减。它们仍然存在,但被高度衰减。事实上,我们看到的波在运动期间仍然存在,只是信号非常弱。这是另一种呈现方式:如果你观察多个通道的功率谱图,在指令延迟期间,你可以看到非常强的β振荡功率。它可能会减弱一点,但仍然存在,直到运动期开始。运动开始后,β振幅衰减,并一直保持衰减状态直到运动结束,然后恢复。

这并不是我们首次展示这一点,这已经被证明了数十年,实际上在EEG发现后不久就在人类中得到了证实。所以这并不新鲜。但新的是,如果你观察这种衰减发生的时间,这个时间点告诉你它与运动起始锁时。在这里,我们根据反应时对试验进行了分组。这些是反应时非常短的试验,黄色的是反应时较长的试验。你可以看到β功率衰减的时间点随着反应时系统地变化。

如果你现在将这些衰减对齐到运动开始时刻,它们都对齐了。因此,β衰减持续发生在运动开始前的某个固定时间延迟处,如这条红线所示。所以,β的衰减可能是一个运动起始信号。这一点相对没有争议,在文献中已有记载。

β衰减的传播模式及其功能意义

那么这种衰减代表什么?这些振荡发生,然后关闭。来自人类经颅磁刺激研究的一些证据表明,在β频率范围内,β功率与TMS诱发电位呈负相关。这意味着当β强时,TMS诱发电位小,反之亦然。这至少向我表明,也许这种衰减现象反映了运动皮层的兴奋性。

所以,当你坐着准备移动时,你处于低兴奋性状态。然后“开始”信号出现,网络中发生了一些事情,将你切换到高兴奋性状态,导致低振幅的β振荡。我认为约翰展示了一些单次试验中振荡数据的例子,它们看起来相当混乱。虽然我向你展示了一个特别好的单次试验例子,你可以计算这个信号的振幅并观察时间点,但通常它们是有噪声的,因此我们必须找到一种方法来去噪这些信号。

我的一位前博士后Fellow Burmanian使用自编码器来清理单次试验的信号。我在这里向你展示的是不同电极上β信号包络的振幅,每种颜色代表一个不同的电极。红色的电极在这里衰减得稍晚一些,蓝色的电极在这里衰减得较早。如果你现在将衰减时间映射到电极网格上,你可以看到一个传播模式。

并不是整个皮层同步衰减,而是你看到一个系统的衰减进程,从这些电极开始,进展到那些电极。这是在一次试验中。在另一次不同的试验中,你看到相反的模式:这些电极先衰减,然后是这些电极。这是我们发现的新现象:振荡并非同步衰减,而是显示出这种传播模式。

事实上,如果你观察许多许多试验并构建一个圆形直方图,你可以看到它们大多数沿两个方向之一传播,且方向完全相反。结果证明,这大致与我们用β波观察到的方向性相当。大致是吻侧方向,另一个是更偏向尾侧的方向。很少有衰减传播模式出现在正交方向。这是我们在所有猴子身上都看到的。有时我们看到一些细微的差异,例如一个方向占主导,第二个方向弱得多,例子少得多,但我们总是看到这种传播的双峰分布。

我喜欢做的一个类比(可能不恰当)是:你可以想象运动皮层在你准备移动时闲置着。想象你在一辆有离合器的车里。你踩下离合器,发动机在空转,但车实际上没有动。然后你松开离合器以接合发动机。因此,皮层的β衰减就像松开离合器。你基本上有一系列离合器按顺序被释放,这就是我喜欢思考它的方式。

传播模式的因果证据

那么,我们能否提供因果证据,证明这些衰减或兴奋性的传播模式是运动起始的必要组成部分?我们看到了运动起始期间的这种现象,它在每次试验中都发生。但我们是否有任何因果证据表明它可能发挥作用?为此,我们设计了一个实验,进行电刺激,但不是在同一个电极阵列上,而是以电刺激模式进行刺激。

想象一下,在给定的试验中,你有一个从阵列右侧向左传播的衰减模式。现在,假设在那个试验中就是这种情况,我们以如下方式刺激电极:我们同时用单个脉冲刺激所有这八个电极,然后在下一个时间点,我们刺激这一列和第二列,然后逐步地,我们随时间偏移我们刺激的电极组,使其镜像我们看到的自然传播模式。这被称为一致刺激模式

或者,想象我们有同样的从右侧向左传播的模式,但现在我们先刺激这组电极,然后是这两组,接着是这两组,依此类推。这将是不一致的,因为它与自然传播模式相反。我们想要测试的想法是:如果我们以与自然模式相反的方式进行刺激,我们是否会减慢反应时?

这里需要注意的重要一点是:在一致和不一致两种情况下,被刺激的电极完全相同,每个电极上使用的电流完全相同,频率也相同。唯一的区别是顺序。我们是在“开始”信号之后进行刺激。我们根据之前的实验大致估计我们认为衰减何时会发生。是的,我们是在干扰它。问题是,不一致的情况是否比一致的情况干扰得更强烈?但是的,在两种情况下我们都在干扰。另外,我应该指出,我们使用的刺激电流是亚阈值的,足够低,以至于不会实际诱发运动。如果你只是传递这种模式,在没有任务的情况下,你不会诱发运动。我的意思是,你可能会,我们还没有测试,有时你可以测量到非常微弱的EMG肌肉活动,但不会诱发运动,所以是亚阈值的。

这就是我们想要检验的假设,而我们确实发现,在三只猴子身上,其中一只猴子的两个不同运动方向,我们看到不一致刺激模式比一致刺激模式的反应时慢了大约10到20毫秒。因此,当我们施加与自然进程相反的扰动时,我们实际上可以减慢反应时,虽然不多,但显著。

传播模式与躯体拓扑的关系

我们想研究的另一件事是:这些衰减的传播模式与躯体拓扑相比如何?我们关注这三只不同的猴子,这两只猴子有两个阵列,这只猴子有一个阵列。对于这两只猴子,我们只关注顶部的阵列。蓝色的双箭头表示衰减传播方向的双峰分布。棕色箭头显示从近端到远端的躯体拓扑梯度,即从肩和肘向下到手和手腕。

虽然不完美,但似乎这两种不同的空间模式几乎是正交的:躯体拓扑与衰减的传播模式几乎垂直。这对我来说实际上是有道理的。如果你想启动一个运动或允许运动发生的可能性,你并不想必然先启动一个身体部位再启动另一个,你希望允许上肢的所有身体部位在需要时都能启动。

不同行为中的传播模式

我们遇到的另一个问题是:我们看到的这种模式似乎标志着运动起始,我们有因果证据表明这种模式是运动起始所必需的(可能不是充分的)。那么在其他行为中呢?到目前为止,我们关注的是平面伸手运动,但伸舌运动呢?我们实际上训练猴子伸出舌头,并用舌头对力传感器施加力。我们还有用手进行的精确等距捏握。我们还在一项人脑机接口研究中有一位人类参与者,他是一位脊髓损伤患者,自愿在其运动皮层植入阵列。他有一些残余功能,并非完全瘫痪,所以他实际上可以用他的原生肢体进行伸展运动和施加等距伸展力。

在这四种不同的行为中,我们都看到了电极上的β衰减。我们看到它们以空间方式组织,即它们从一侧传播到另一侧,或相反方向。除了在这个案例中两个方向略有偏差外,在其他三种情况下,它们几乎完全沿相反方向传播,取决于试验,有些试验沿一个方向传播,其他试验沿相反方向传播。我认为这很酷,即使是像伸舌这样的动作。顺便说一下,在伸舌任务中,我们是从口面部运动皮层区域记录的,而不是上肢区域,所以我们在不同位置植入了阵列。

所以我们看到了这种模式。我们遇到的另一个问题是:除了时间(即运动何时发生)之外,这种模式是否告诉我们任何关于实际运动的信息?答案是否定的,它没有告诉我们任何信息。对于平面伸手运动,例如,这是模拟传播方向双峰分布的冯·米塞斯函数,无论是远离身体的运动还是朝向身体的运动,你看到几乎完全相同的分布。同样,传播速度(以厘米/秒为单位)实际上与在绒猴MT区观察到的非常接近。你也看不到速度上的差异。同样,在人类受试者中,要求他们用手腕施加等距力,无论是低力还是高力,分布几乎相同,无论是方向性还是速度。因此,我们没有发现任何证据表明这种传播模式提供了关于将要发生什么运动的信息。

运动执行期间的高伽马振荡与传播模式

这引出了我的下一个话题。我将跳过这个,也许稍后再回来。还有多少时间?我想大概12点左右。我将跳过这个,然后讲一些尚未发表的内容,所以我想讲到它,如果有时间我再回来。那么,是否存在与运动执行相关的时空模式,这些模式实际上告诉我们运动是什么类型的信息?因此,我们必须放弃β振荡。其他人也曾在β振荡中寻找关于运动的信息,但没有找到太多。例如,在解码研究中,他们试图从β振幅解码运动,结果发现几乎找不到什么。所以我们放弃了β,转而研究一个完全不同的信号:高伽马振荡

我所说的高伽马实际上是一个误称,它并不是真正的振荡,而是局部场电位在200到400赫兹高频范围内的功率。这相当高,可能非常接近放电频率,所以它可能包含了放电活动。我们这样做是有目的的,因为我们想研究一个携带运动信息并作为多单元活动代理的信号,即与电极周围局部放电的神经元群相关的东西。之前的人们已经使用这种非常高频的信号在脑机接口研究中解码运动,而且确实效果很好,这就是选择这个频率范围的理由。

如果你观察试验平均后的高伽马振幅,你可以看到随着猴子运动方向的变化,信号如何变化,因此它携带了关于将要进行什么运动的信息。例如,对于向左的运动,信号非常强;对于向右的运动,信号非常弱。因此,它似乎携带了关于正在发生什么运动的信息。

如果你比较高伽马振幅的调谐曲线与多单元活动的调谐曲线(因为我们也可以从这些电极记录多单元活动,实际上这在犹他阵列中很常见,你不是记录一个孤立的单元,而是记录可能几个或更多的单元),这向你展示了作为目标方向函数的多单元活动放电率(红色)和高伽马振幅(蓝色),它们几乎完全相同。因此,在整个电极群体中,我们看到高伽马和多单元之间非常相似的调谐。

所以现在我们知道这个信号意味着什么,对此我更有信心。而对于β,我们说它是兴奋性,但具体是什么?检测赫兹?我们通常通过将信号高通滤波到350赫兹以上来检测,所以有重叠,但处理数据的方式不同。高通滤波后,你使用阈值交叉,寻找超过阈值的峰值,并计算那些峰值,而不仅仅是包络功率。是的,但在频率范围上有重叠。所以,那是试验平均,很漂亮。左边是单次试验,每种颜色代表一个不同的电极,看起来相当混乱。所以,我们再次必须使用不同的信号处理方法,如首先进行主成分分析,然后应用自编码器,再进行低通滤波,以获得这些平滑的单次试验高伽马包络。需要大量的预处理才能得到这些平滑、漂亮的信号。

将高伽马包络视为振荡进行分析

有了这些信号,我们可以像其他人一样直接使用振幅来解码。但我的博士后Millan Rebar提出了一个非常巧妙的想法:与其看振幅,不如将它们视为振荡,即高伽马的包络本身(不是高伽马本身),将其视为0到5赫兹之间的振荡,并像我们之前处理β振荡一样,使用希尔伯特变换计算相位。

因此,我们计算每个电极的相位随时间的变化。我们可以将其布局在阵列上,所以这是在某一时刻每个电极的相位,但现在是低通滤波到5赫兹以下的高伽马包络的相位。然后,你可以像约翰谈到的那样计算相位梯度。由此,我们可以使用我们在最初关于β波的论文中使用的一种度量,称为相位梯度方向性,这是一种度量相位梯度对齐程度的指标。

基本上,它是平均相位梯度的幅度除以相位梯度幅度的平均值。因此,PGD值为1表示所有相位梯度都对齐,显示出平面波的证据。PGD值为0表示梯度方向随机。是的,1表示拟合良好,这正是重点。所以我们现在可以随时间测量平面拟合的优度。这是一种方法。

我们采用的另一种方法受到我们一年半前发表的一篇论文的启发,使用了一种略有不同的方法。我们没有计算相位梯度,而是直接对相位本身拟合平面。因此,我们现在在Z轴上有展开的相位,而在X和Y轴上是特定电极的相位,然后直接拟合一个平面。然后我们可以测量平面对这些展开相位的拟合优度。这与相位梯度的PGD具有可比性。

传播模式与运动信息编码

使用这两种方法(线性回归的拟合优度和使用PGD的空间相位梯度),我们发现从运动开始前约200毫秒开始,到运动结束后约100毫秒,拟合优度出现短暂的增加。这在两种度量中都是正确的。如果你观察传播方向(现在是那些相位梯度的方向或拟合平面的方向),我们看到可比的方向,并且它们更稳定。每条黑线代表一次不同的试验,红色是平均值。因此,每次试验都显示R平方或PGD的增加,然后平均值更清晰地显示出来。但如果你观察传播方向,同样,在拟合优度高的时间段内,它更加一致,并且它们匹配得相当好。

现在,如果你观察每个时间点的传播方向(试验平均后),你会得到像这样的图。这些图有点难以理解,它们是极坐标图。时间在半径上,所以从运动开始前300毫秒(这个内圈)到运动开始后300毫秒,这是半径。沿着圆圈是传播的瞬时方向,即高伽马包络传播的方向。每种颜色代表猴子正在做的不同运动方向。这是不同颜色的图例,小箭头告诉你猴子向哪个方向移动:上、左、右等等。

有趣的是,你看到两种方法都有非常相似的模式。它们开始时非常相似,然后针对不同的运动方向分叉,这表明其中存在关于运动的信息,存在于这些传播模式的方向中。注意这里有趣的一点:注意这三个家伙(蓝色、橙色和灰色),它们形成了一个集群,并且与其他方向不同。这些有什么特别之处?我一直在思考,直到我意识到我们所做的:我们过度训练了这只猴子。这完全是个意外。我们过度训练猴子进行向外、向上或向右外的运动。所以橙色目标,它们进行了大量这样的运动,因为我们的机器人生物力学特性,这类运动和这类运动对猴子来说非常容易,而这些运动则较难。因此,它被高度过度训练用于这些运动。

结果,对于蓝色目标(蓝色目标在这里),它开始向橙色目标移动,然后改变方向。同样,对于灰色目标(在这里),它也默认向橙色目标移动,然后意识到需要改变方向。所以,这可以解释为什么这三个方向聚集在一起,因为对于这只被过度训练的猴子,这三种不同目标方向的默认运动指令非常相似。这再次提供了进一步的证据,表明这些传播模式告诉你关于运动运动学的信息。

解码运动与对运动控制的启示

我们应用了一个非常简单的解码算法(基本上是维纳滤波器解码器),尝试解码手部的X和Y速度随时间的变化。使用基于线性回归计算的方向或基于空间梯度的传播方向,你看到了非常相似的结果。如果你看绿线(它是X和Y速度的综合),开始时解码效果弱,然后在运动后约100毫秒达到峰值。有趣的是,随着运动展开,它开始下降。

这对我来说很有趣,因为我开始以一种不同于人们通常认为的方式思考运动皮层。常见的观点是运动皮层在整个过程中持续控制肢体,这也是脑机接口的基础:我们从运动皮层获取信号,受试者思考,我们连续解码以控制机器人设备、光标等。但这开始让我认为,也许在自然系统中,运动皮层实际上使用的是间歇控制策略。它实际上并不在整个运动过程中都参与,只在某些关键点参与,然后皮层下结构接管其余部分。

这可能与这样的想法一致:皮层形成这些传播模式,这些模式介导了产生运动的指令,但这些指令随后消失。在运动后期,当这些传播模式完全消失时,运动仍在继续(顺便说一下,运动至少持续到400毫秒以后)。因此,运动持续的时间远远超过这个模式存在的时间点。如果这个模式反映了来自运动皮层的实际运动指令,那么之后它们就不再存在,由其他结构接管,直到运动皮层可能需要再次介入。脑机接口确实有效。是的,安迪·施瓦茨的例子,机器人控制等。所以,这是否是你设想的一种“发射后不管”模式,但如果需要更闭环的控制,它可以参与更长时间?事实上,我认为我们有一些数据表明这一点。在我们当前的脑机接口受试者中,因为他们可以同时使用脑机接口和使用他们的原生肢体,所以我认为脑机接口中发生的是,他们使用了一种“非自然”模式。他们可以做到,但这不是他们通常使用手臂的方式。他们需要高度集中注意力,并且必须持续控制。他们进入了这种不同的操作模式。这是一种推测,我没有确凿证据支持,但这就是我的想法,因为我们刚刚完成的观察这些使用原生肢体的脑机接口受试者的实验表明,当我们用原生肢体运动构建解码器,然后应用到脑机接口情境时,它不能泛化,反之亦然。所以解码器在不同的模式下工作。这并不是说它不能发生,是的,你可以进入那种模式。

传播模式可能的功能:肌肉募集顺序

最后,我想再次强调,这完全是推测。我没有确凿证据支持这一点,尽管我知道一种方法来实际测试这个想法。事实上,我刚刚有一项资助申请(希望NIH仍然存在并会评审)来测试这个想法。基本想法是:也许这些皮层传播模式可能促进肌肉的募集顺序。

这些实际上是向右运动时的肌电图肌肉活动模式,你可以看到被激活的肌肉序列。对于向左的运动,你看到不同的序列。因此,对于这个向右的运动,前三个肌肉首先是三角肌前束,然后是肱三头肌,然后是肱桡肌。对于这个向左的运动,首先是肱桡肌,然后是腕伸肌(可能是腕伸肌,我可能记错了),第三个是肱二头肌。所以,也许这就是这些皮层模式(波或传播模式)可能具有的功能。

有一种方法可以测试这一点,因为我们实际上可以在猴子身上测量这些传播模式,并且还可以通过电刺激测量每个位点激活了哪些肌肉,然后问:当猴子进行这个运动时,这些肌肉是否以这种模式被激活?传播模式是否匹配那个序列?

传播那个序列。说到这里,我将结束。这是我的实验室,感谢大家的关注。对不起,有问题吗?如果有人有任何问题,那么我们将继续进行小组讨论,我们也会回答这些问题。

好的。那么其中一个问题是,当你刺激猴子区域时...


本节课总结

在本节课中,我们一起学习了运动皮层中活动的传播模式如何编码运动信息。我们从经典的彭菲尔德图谱及其局限性开始,认识到运动皮层在精细尺度上缺乏清晰的躯体拓扑组织。接着,我们探讨了运动皮层中存在的β振荡及其传播波,但指出其与行为功能的直接联系尚不明确。

然后,我们深入研究了运动准备和观察期间运动皮层激活但不产生运动的现象,并回顾了解释这一现象的几种假说。我们重点介绍了β振荡的衰减作为一种可能的运动起始信号,并展示了这种衰减在皮层上是以传播模式而非同步方式发生的。我们通过电刺激实验提供了因果证据,表明干扰这种自然传播模式会减慢运动反应时。

此外,我们探讨了这种传播模式与躯体拓扑梯度近乎正交的关系,以及在不同行为(如伸手、伸舌、握力)中观察到的类似传播模式,指出它主要编码运动起始时机而非运动细节。

最后,我们转向运动执行期间的信息编码,介绍了高伽马振荡包络作为多单元活动代理的价值。通过分析其包络的相位传播模式,我们发现这些模式携带了关于运动方向的信息,并且其解码效能在运动开始后达到峰值然后下降,这提示运动皮层可能采用间歇控制策略。课程以推测这些皮层传播模式可能通过促进特定的肌肉募集顺序来指导运动作为结束。

本节课的核心概念包括:β振荡衰减的传播模式作为运动起始信号,以及高伽马包络的相位传播模式编码运动细节。这些发现为我们理解运动皮层如何动态地组织和传递运动指令提供了新的视角。

009:固有传播波与视觉感知

在本节课中,我们将要学习大脑视觉系统中一种名为“固有传播波”的神经活动模式。我们将探讨这些波是如何产生的,它们如何影响神经元对视觉刺激的反应,以及它们如何最终影响我们的感知行为。课程内容基于对灵长类动物大脑的实验研究和计算模型。

概述

感谢Alex和Roberto,以及Lyle和菲尔兹研究所邀请我今天进行演讲。我认为接下来的几天将会非常精彩,我很高兴能在这里。

我今天要描述的工作是由Zach Davis发起的,他曾是我实验室里一位非常有才华的博士后,现在已在犹他大学建立了自己的实验室。他与Lyle Mueller密切合作,Lyle当时在索尔克研究所Terry Sowski的实验室做博士后,而Terry和Julio也对这项工作做出了重要贡献。

我将要描述的证据表明,在灵长类动物和老鼠大脑的视觉系统中,存在以波的形式在大脑皮层中传播的活动模式。它们每秒发生数次。我将展示证据,表明这些波反映了在占据大脑皮层浅层的水平无髓鞘纤维上传播的动作电位。我还将展示一些证据,表明这些连接包括长距离的、特征选择性的解剖连接模式,这些连接将具有相似调谐特性的神经元群体联系起来。

但我最想传达的核心信息是,在空间和时间维度上观察神经活动动态的重要性。我想用这张图片来说明这一点,它看起来可能有点令人困惑。这是一张鸟群的放大图像,你可以看到这里有一些结构,但看起来有点杂乱无章。

但如果我们缩小视野,可以看到它实际上是一个更大整体的一部分,在这个例子中,是一种传播波的形式,即椋鸟的集群行为。只有通过这种更广阔的视角,才能真正理解这一点。我将向你们展示,类似这样的模式也存在于大脑皮层中。只有通过观察整个脑区的活动模式,我们才能开始看到其中存在的秩序。

研究方法:感知阈值的变异性

我们采用了一种特定的方法来研究这个问题,即考虑感觉感知具有可变性这一事实。理解这一点的一种方法是观察发生在感知边界、即感知阈值附近的事件。

我们训练了狨猴(一种来自巴西的新世界猴)执行一项非常简单的任务,它们只需要检测屏幕上目标刺激的出现。猴子通过注视屏幕中心的一个点(我们称之为注视点)来启动一次试验。经过一段可变的延迟后,一个目标出现在屏幕上的某个位置。如果猴子在目标出现后很快将眼睛移动到目标位置,它就会获得果汁奖励。

我们改变目标的亮度对比度,以控制其检测难度。我们可以由此推导出所谓的“心理测量函数”。这个函数显示了猴子检测到目标的概率,作为目标显著性(即亮度对比度)的函数。你可以看到,对于两只猴子,当目标以10%的亮度对比度呈现时,它们都能可靠地报告目标,这很容易看到。但我们可以降低亮度对比度,使任务变得更难,直到我们找到一个略高于1%的亮度对比度,此时猴子只能在一半的试验中检测到目标,我们称之为感知阈值。

这些是反应时间图,显示了两只猴子对目标出现的反应(眼动)潜伏期大约在250到300毫秒之间。所以它们看到目标就看向它,这表明它们真正理解了任务是检测目标并看向它,并且有很强的动机去执行。

神经元活动的变异性

现在,如果我们观察运动选择性脑区MT中一个孤立神经元的动作电位,我们会看到一个熟悉的活动模式。这里的每一行都有一个刻度标记,表示一个动作电位发生的时间。红色垂直线表示目标出现的时间,展示了五次不同的目标呈现。

你可以体会到,尽管我们非常擅长监测动物的眼动位置,确切知道眼睛在看哪里,因此也知道感受野的位置,并且可以将刺激精确地放置在感受野内的同一位置。所以,从实际目的来看,光感受器上的感觉条件是相同的。尽管如此,在每次试验中,被诱发的特定动作电位序列仍然存在很大的变异性。

因此,人们会想,这种刺激诱发反应强度的变化,是否与猴子在给定试验中检测到目标的概率有关。确实,如果我们将试验分类为猴子没有检测到目标的试验(失误试验)和检测到目标的试验(命中试验),我们可以看到,在猴子检测到目标的试验中,刺激诱发反应确实比它未能检测到目标时更强,这暗示了这种关系。

网络状态与局部场电位

但这是针对单个神经元的观察。如果我们观察许多次试验,这是一个单个记录良好的MT神经元,你再次可以看到很大的变异性。在目标出现后不久,有一个与目标出现时间锁定的、强烈而清晰的刺激诱发反应。

我刚才向你们展示了这种变异性,那么它来自哪里呢?它并非来自产生动作电位的机制,那个机制是高度可靠的。相反,它是网络的一个属性。网络正在进入各种状态,这些状态决定了在任何给定试验中神经元发放率的高低。

为了理解这一点,我们可以观察局部场电位,它是电极尖端周围局部群体活动的度量。我们可以看到,在目标出现之前的一段时间里,网络活动相对静止。然后,有一个向下的偏转,与刺激诱发的动作电位同时发生。经过一次波动后,系统恢复到其基线状态。

但这实际上是对数据的误读,这对你们许多人来说非常熟悉,这是我们将许多次试验平均在一起时看到的结果。但如果我们观察单个试验(在我的屏幕上显示为粉色,在你们的屏幕上可能是紫色),我们会发现,在目标出现之前,网络活动的波动幅度与刺激诱发反应发生时发生的波动幅度相似。所以,大脑的发放活动在目标出现之前是高度活跃且波动剧烈的。只有通过平均,我们才能看到在目标出现时间附近存在一种变化的趋势。

固有传播波的存在

现在,我将向你们展示证据,证明这些自发的神经活动波动并非随机的,它们实际上是以传播波的形式在大脑皮层中穿行。我将展示这些波在视觉系统的单个皮层区域内传播,在动物执行任务时每秒发生数次,因此它们是一个非常普遍的特征。我认为它们可能代表了一种以前未被充分认识的神经计算形式,值得我们思考。

那么,这些网络活动波动的来源是什么?解剖学研究表明,它们至少部分可能是由于网络中存在的固有连接。这样说的原因是,例如,在初级视觉皮层中,只有大约5%的突触是前馈的,来自外侧膝状体。大约80%的突触连接是局部的循环连接,其中许多就在皮层的浅层。它们的范围相当有限,大约90%的连接位于接收神经元几毫米之内。

因此,我将展示一些证据,表明这些水平连接确实驱动了这些传播波模式。正如Lyle提到的,我们在MT区(一个运动选择性纹外视觉区)进行了记录,这是在狨猴大脑中进行的。狨猴有几个关键优点,其中之一是其大脑相对无皱褶,是光滑的。因此,狨猴大脑皮层上神经活动的展开就像一块电影屏幕供我们观看。MT区的大小约为13平方毫米,恰好可以被一个商业上可用的、称为“犹他阵列”的单一电极阵列覆盖。这个阵列大约有96个电极,彼此间隔约400微米,可以放置在MT区上方,这样我们就可以在动物执行任务时从整个MT区采样神经活动。

我想在这里停下来,承认我今天展示的工作确实受到一系列论文的启发。早期是Grinvald、Arieli及其同事的论文,以及后来Meor、Carandini及其同事在麻醉动物初级视觉皮层的工作,在那里可以辨别出非常清晰的波模式。同时也深受Nico Hadjipapas工作的启发,他今天将在我之后演讲,他在清醒行为猴的运动皮层观察传播波模式方面做了开创性工作。

然而,在清醒状态下,在视觉系统中,在目标出现之前的静止期,数据中没有持续窄带振荡的证据。这意味着我们需要开发技术来定义我们正在研究的这个频谱复杂系统中的相位。

定义频谱复杂相位

如果我们放大到目标出现之前的时期,当动物正在等待目标出现时,屏幕上没有任何东西,我们可以观察局部场电位。这是一个典型的例子,你可以看到这里有一些振荡模式,但它们是瞬态的,并且存在很多频谱复杂性。如果你用带通滤波器(例如8到13赫兹的阿尔法滤波器)过滤局部场电位,你会发现结果并不能真实地再现或反映大脑中的模式。

即使其他频段,例如这个15到30赫兹的贝塔频率窄带滤波,确实捕捉到了这段时间内动态的某些方面,但在相位和幅度上存在明显的失真和差异。但在其他时间段,它并不真正适用。所以,如果你是研究视觉系统中贝塔振荡的人,你会说“啊哈,这就是我研究的”,并专注于那个时间段,然后编造一个关于它的故事。但即使在那里,他们也只捕捉到了瞬态波动,这些波动实际上并不那么窄带。

因此,我们开发了一种方法,这确实是Lyle在这个项目中做的许多步骤之一,来定义一个度量,该度量是一个与频率无关的相位度量。这里的要点是,我们更广泛地过滤了数据,从5到40赫兹。这里的颜色编码表示相位,即广义相位,这个新度量是Dennis Gabor最初开创的解析信号方法的推广。

所以要点是,我们可以以一种有意义的方式跟踪相位,它大致上跟随随时间变化的主导信号的相位。

验证相位度量

我们如何验证这一点呢?一种方法是观察动作电位,它是大脑的主要“货币”,并询问它们与我们使用这些不同相位度量测量的相位之间的关系。我们可以通过计算发放-相位耦合来做到这一点,即询问当我们使用广义相位度量与各种窄带滤波器计算相位时,发放是否可靠地与特定相位对齐。你可以看到,对于广义相位,发放-相位耦合比窄带相位要好得多。

但我确实展示了有时在窄带相位中存在显著的功率,如果我们挑选出这些时间段(例如西塔频段),它们约占时间的7%,阿尔法频段占12%。即使我们只看那些你会说“啊哈,这就是我研究的,就在那里”的地方,我们也会发现,一旦你对数据进行窄带滤波,发放-相位耦合就会变差。

因此,有了这个有意义的频谱复杂相位概念,我们现在可以将该相位度量用作定义、检测、跟踪传播波模式的一种方式。

检测传播波

我们通过计算阵列上所有电极的相位,然后计算相位梯度来实现这一点。在相位梯度中,寻找梯度最大发散点。这些是波的潜在源点,波可能从该点向外辐射。然后,我们计算相位作为与该最大发散点距离的函数,并询问它是否在空间上系统地变化。

为了说明这一点,这里有一个虚构的数据,只是一个模拟。每个红点是一个最大发散点,但没有产生波。当一个波从特定点传播出去时,绿点是最大发散点,它正确地检测到了波的出现。

这种方法是有优势的,因为它不需要空间平滑,而空间平滑可能会从噪声中产生虚假的波。它是对其他方法(如奇异值分解)的改进,奇异值分解在噪声条件下可能会失效。它为这类高噪声多通道数据中的传播波提供了定量的、逐时刻的测试。

当我们将这种方法应用于检测活体中的波时,这就是我们所看到的。这里你看到的是阵列上每个电极的幅度(毫伏)。虽然它们很复杂,看起来不像海浪拍岸那样的波,但你可以清楚地辨别出存在跨越电极阵列传播的、时空组织的模式。我应该指出,这不是经过空间平滑的,所以这确实是你在狨猴大脑皮层中检测波时看到的真实模式。

波与神经元发放的关系

现在,当我们观察发放频率作为波相位的函数时,我们发现它是变化的。现在我们同时记录局部场电位,在局部场电位上计算这些传播波,然后观察同时记录的发放活动如何与波的相位时间锁定。我们发现,自发活动中的发放概率作为波相位的函数变化很大。

我们将发放活动升高的波相位时间段称为波的“去极化相位”,相比之下,波的“超极化相位”则发放活动较低。这些小红点对应于一个控制条件,我们平均了所有局部场电位,并观察了发放活动对波相位的依赖性。目的是区分我们看到的是同步模式还是波模式。我们确实看到的是波模式,而不是同步模式。

波的传播速度与解剖基础

如果我们观察波的传播速度,这是来自两只猴子的分布。我们看到它们倾向于落在由这里垂直线指示的范围内,该范围对应于这些无髓鞘纤维上动作电位速度的范围。这是证明波与水平传播的动作电位相关的一条证据。

我们建立了一个模型,一个大规模的、循环连接的模型。该模型中的神经元通过距离依赖的连接相互连接,这些连接从每个神经元开始呈高斯衰减。我们关键地加入了传播延迟,以反映动作电位在水平纤维上传播该距离所需的时间。

这些是非常大规模的模型,大约有50万个神经元,5亿个左右的突触连接。在这种规模下,可以建立一个在突触处使用生物学上合理的兴奋性和抑制性电导的模型。当我们这样做时,我们发现在广泛的参数范围内,模型可以产生与我们在活体中看到的相似的波。

观察它的最简单方式在这里,这只是模型的一个模拟。现在这是一个比我在电极阵列96个通道中展示的图像分辨率更高的图像,但你可以看到,在性质上存在类似的复杂波动态模式。波的统计特性,例如它们的传播速度、波长,与我们在活体中看到的相当。因此,我们认为这是一个很好的工作模型,用于解释可能是哪种网络在产生这些波。

模型参数与网络状态

如果我们观察兴奋性和抑制性电导的参数空间,我们会看到存在一个范围,在这个范围内波会发生。如果我们超出这个范围,网络会变得癫痫样或沉默,但在这个范围内,我们看到波模式,它们的波强度和波长随着这些参数系统地变化。

关键点是,在产生持续发放活动的参数范围内,该活动以波的形式存在。因此,对于一个像这样的连接网络来说,形成传播波模式似乎确实是其自然的运行模式。

对于那些对发放数据真正感兴趣的人,我会提到,在相同的参数范围内,我们看到单个神经元的发放活动与我们在活体中看到的非常相似。它们是随机的,有点像速率变化的泊松过程。

波、增益与感知

那么,从概念上讲,我们认为发放活动、波和行为效应之间是什么关系呢?想象一下,我们正在从MT区记录,这里的颜色编码表示网络的超极化或去极化状态,我们认为这实际上反映了兴奋性与抑制性活动的比率。我们认为正是这个E/I比率的变化驱动了增益变化,这是关键的考虑因素。

因此,在这个时间点,如果我正在记录这个锥体神经元,当三个动作电位进入细胞时,我可能只看到一个诱发的动作电位。但是,随着波状态的变化,将细胞置于更兴奋或去极化状态,发放输出会升高。因此,对于相同的输入,我们现在可能会看到锥体细胞诱发出更多的发放,因为整个网络现在处于一个更兴奋的状态。

为了研究这一点,我们回到了在自发期记录的数据。我们根据目标出现前即刻的去极化状态对试验进行分类。来自概念模型(也来自理论模型)的预测是,在更兴奋的状态下,即在驱动更高自发活动的状态下,刺激诱发反应的强度也应该升高。确实,这就是我们所看到的。这里用紫色显示的是在目标出现前即刻网络状态处于超极化相位的试验中,细胞群体的平均诱发反应。用绿色显示的是当刺激诱发反应与兴奋状态同时发生时升高的反应。

主要的观察结果是,根据刺激出现前即刻的波状态,刺激诱发反应的增益会升高或降低,这取决于波相位。

波相位预测行为

那么,这与行为有什么关系呢?模型的预测是,升高的增益将驱动我在开始时向你们展示的那些变化,即命中试验相对于失误试验的发放率升高,从而增加猴子检测到目标的概率。

如果我们在行为层面观察检测情况,确实,在相同的超极化和去极化相位上,我们看到猴子检测到目标的概率降低或升高。如果你仔细想想,这是相当可观的。我们已经调整了刺激的亮度对比度,使猴子在一半的时间里检测到目标,而在这里我们看到检测概率有大约20%或30%的变化,这取决于波相位。

为了进一步量化这一点,我们构建了一个广义线性模型,其中我们使用波相位作为预测猴子行为的预测因子之一。还包括其他度量,如瞳孔直径(动物唤醒状态的指标)、目标诱发反应的强度(我已经向你们展示过,在命中试验中相对于失误试验是升高的)、以及目标前阿尔法功率(研究脑电图的人用作注意状态度量的指标)和目标前发放率(当注意力部署到感受野时,活动的基线水平会升高,这是注意状态的另一个预测因子)。

在所有这些因素中,波相位是最好地预测猴子表现的因素。对我来说,这有点令人不安,因为我花了很多时间研究视觉注意力及其如何调节感知,但这里有一些视觉注意力的指标不如波相位预测力强。这告诉你,波相位确实是猴子表现的一个强有力的预测因子。

解剖连接塑造波模式

现在,我要提出最后一个主要论点,即我们认为,正如我根据模型所阐述的那样,波实际上是动作电位沿着这些无髓鞘水平纤维传播的结果。但事实证明,这些纤维并不是像我一直在模型中向你们展示的那样是同质的、各向同性的连接模式,实际上那里有很多有趣的解剖结构。

我们有证据表明,这些固有传播波受到解剖连接结构的塑造或影响。这最初来自初级视觉皮层的工作,包括Charles Gilbert及其同事的工作。

这是一张V1区方向偏好的地图,是用光学成像技术获得的。他们只是改变了刺激的方向,你在这里看到的是一张颜色编码的地图,显示了初级视觉皮层上哪些位置的神经元偏好某个特定方向。这些就是你们听说过的初级视觉皮层中的“针轮”模式。

事实证明,如果你在同一皮层注射一种被轴突吸收并返回到细胞体的示踪剂,你确实会看到这种强烈的局部连接,这就是我之前提到的水平连接,大约90%是局部的。但在此基础上,还有这些示踪剂斑块,表明从这些位置到注射点存在解剖连接。事实证明,如果你观察这些斑块对应的方向偏好,它们是那些与注射点方向偏好相匹配的斑块。

你可以在这里看到,这是存在连接的概率,作为这些斑块之间方向差异的函数。因此,初级视觉皮层由这些特征选择性的斑块网络组成,这些网络将志同道合的神经元群体相互连接起来。最初,Charles Gilbert认为这与轮廓完成有关,与看到模态完成、物体被遮挡等有关。但自从那项工作完成以来,其他示踪研究已经在许多其他脑区进行,这种连接模式确实遍布整个皮层。所以,在初级视觉皮层中看到过,在V2区、MT区、颞下皮层中也看到过,在初级运动皮层中也看到过。因此,这确实是一种解剖学上的主题模式,需要解释它有什么用,因为它不可能只服务于像解决轮廓完成这样有限的目的。

因此,我们回到了初始模型,并对其进行了修改,以考虑这种解剖连接模式。我想在这里强调,这是一项由Alex Bush领导的工作。Alex和同事们所做的就是简单地添加额外的连接,以连接网络内志同道合的方向域。

因此,这是模型的一个预测。不幸的是,颜色编码有点混乱,所以在这个屏幕上不太明显。但预测是,我们应该看到模式。当动作电位穿过这些水平网络时,预计会产生反映该解剖连接的不同类型的波模式。因此,预测是,我们应该能够看到这样的模式,这里显示了特定时间点的波相位,我们应该能够看到存在相似的波相位模式。

我们可以将这些模式分组为主题,这些主题反映了我们放入网络中的解剖连接模式。与随机连接的网络相比,在随机网络中,我们能看到数据更倾向于被分组到这些主题中。

此外,预测是,因为我们正在提升偏好特定特征(在这个例子中是运动方向)的神经元亚群,所以我们应该看到这些波群、这些主题在某些情况下会表现出对刺激反应增益的特征选择性调制。

实验证据支持特征选择性增益

因此,这里有一个解释,我本应更早地说明。这是特定时间点的局部场电位相位,我们只是用颜色编码在整个相位上进行映射。

这就是我们所看到的。在MT区,这里有两个非常相似的波相位模式的例子。下面你看到一个重复波模式的例子。这是一个非常引人注目的例子,如果你看这两个在时间上分开的模式,你会看到非常相似的波模式。我们认为这些波模式是动作电位穿过一个或另一个网络的反映。

模型的预测是,正如我提到的,因为我们正在增强一个本身具有特征选择性的网络,所以我们应该在某些情况下看到增益的特征选择性升高。这是预测。

显示在黑色中,如果我们在这些主题之一被激活期间,观察神经元的自发活动(我们根据运动方向偏好将它们围绕时钟组织起来),我们应该在某些情况下看到系统性的偏好,即偏好特定运动方向的神经元自发发放活动升高,而如果我们随机打乱连接矩阵,则不存在这种偏好。

当我们在MT区内观察时,我们看到了支持这一观点的惊人例子。再次,这里是一个打乱的控制条件,一个零分布。这是发放率的升高,即对于这个主题,偏好向右下方运动的神经元的活动增加。这里是另一个不同的主题,恰好偏好向左运动。因此,与解剖学上的斑块网络(具有特征选择性)驱动我们在Vet中看到的这些主题的观点一致,当我们将这些主题分组时,我们可以看到这样的例子。

在初始建模中,它只是最简单的模型,与大脑中的模式没有太大不同。只是后来我们才有兴趣看看通过添加这个额外的解剖特征是否能获得更多信息,并且我们看到了这方面的证据。

如果我们比较模型预测的调谐和我们在活体中看到的主题发放调谐,它们的大小相当。

特征选择性感知变化

这里只是显示效应大小的数据,表明存在这些特征选择性的增加。这意味着,如果我们采用与主题偏好相匹配的刺激并记录刺激诱发反应,如果它与主题的方向匹配,则相对于它向相反方向运动时是升高的。所以,不仅仅是自发发放受到这种塑造,而且网络对刺激的增益调节和敏感性也是特征选择性的。

因此,我们预测感知敏感性也存在特征选择性的变化,这显示在这里。所以,这里是一个傅里叶主题,它驱动了这个方向的发放活动,如红线所示。当该主题被激活时,我们观察猴子检测到目标的概率,它以与偏好一致的方式得到了改善,你可以在这里看到其他一些例子。

因此,这里是自发活动的调制,大约10%的自发活动调制。这里是猴子表现的调制,当呈现的目标要么匹配要么不匹配主题的偏好时。是的,Roberto,没错。所以这是完全相同的任务,完全相同的数据集,是相同的数据,Andrew。所以偏好是通过观察群体中的发放活动,根据它们测量的方向或运动方向偏好来组织细胞来定义的。然后我们观察那条曲线,并在特定主题存在时挑选出偏好。

因此,一个主题会上调偏好向上运动的神经元,而另一个主题会提升偏好向下运动的自发活动状态,这就是主题偏好的定义。然后我们将其应用于刺激诱发反应,我们发现,当一个上调向上方向自发活动的主题被激活时,一个向上的刺激就会获得升高的增益。猴子对该目标的敏感性也会升高。如果我们在该主题活跃时呈现相反的目标,我们看不到那种升高的增益,也看不到感知敏感性的增加。所以它们都是一致的。

我还要提到,我们也在与Adam Cohn和Andrew Parker合作,在猕猴中研究这个问题,我们看到了非常相似的模式,我们正处于那个项目的中间阶段。我们还在与斯坦福大学的Mark Schnitzer分别合作,使用不同的方法。所以,我一直在谈论局部场电位,它们是对神经活动的一种间接测量,是细胞外测量。但在这里,我们使用基因编码的电压指示剂在小鼠皮层中看到了波。这些是荧光标记,根据显微镜下局部群体的膜电位以非常高的时间分辨率波动。我们现在正在建造一台显微镜,在狨猴中使用基因编码的电压指示剂进行这些实验,我不能讲太多细节,我们刚刚开始注射病毒,我们已经建造了显微镜,很快将开始进行这些记录。

但这非常令人兴奋,因为这是一个直径8毫米的成像窗口,意味着我们将能够可视化不仅跨越MT区,还包括周围视觉区域的活动,并观察这些模式如何在相互连接的大脑区域中展开。

传播波的计算潜力

但在我结束之前,我只想退一步说,我提出了各种证据线,表明波存在于清醒的灵长类动物视觉系统中,它们每秒发生数次,它们调节神经元反应的增益,它们调节感知敏感性,并且以这种映射到解剖结构的特征选择性方式来实现。

但我告诉你们的一切,都是建立在能够观察整个脑区的基础上的。这有点老派,你知道,你正在观察神经元感受野中的刺激诱发反应,这是一种很好的观察方式,一种富有成效的观察方式。但我们现在有能力做得更多。

我想用最后一个小片段来激发这样的想法:我们作为系统神经科学领域,真的需要开始思考这些波的计算能力是什么,它们为我们做了什么,而不仅仅是通过细胞感受野这个小窗口观察它们做了什么。

因此,我只想强调一些Roberto在推进方面起到关键作用的非常漂亮的工作。在这项工作中,我们基本上退了一大步,问波可能对什么有用。进化创造这种古老的波基础设施,并不是为了让我们在计算机的空白屏幕上检测一个目标。这是一种非常定量和严谨的观察方式,我们在证明它们存在方面取得了很大进展,但我认为那不是它们的作用。所以,在这最后一个小章节中,我将简要介绍一篇已发表的论文,你可以去查阅,它表明波可能具有更大的能力。

特别是,因为它们是在空间和时间中展开的,所以波中包含大量信息,它有能力在大脑中编码复杂的时空事件。左边是一个非常漂亮的图示,你看到一个人来回走动,这只是来自Weizmann电影数据库的一段视频。我稍后会展示这是如何完成的,但右边是一个连接起来产生波的网络,它有能力在其突触连接中编码整个电影。你还会注意到,因为电影是来回移动的,它具有上下文。相同的帧出现在向前走和向后走的方向上,网络区分了这两种状态,尽管它们在物理上在任何时间点都是相同的。因此,网络的状态确实使这个网络能够产生真实世界级别的复杂事件。

我认为这真的非常令人兴奋。那么我们是如何做到这一点的呢?模型结构如下:我们有一段电影在播放。电影作为网络的输入,通过一组前馈连接传递到一个地形组织的网络上,该网络是循环连接的、复值振荡器网络。这就是世界进入网络的方式。

但网络本身类似于我一直告诉你们的循环连接网络,因此它有自己的内部动态。当你从外部“轻推”它一个事件时,它会产生一个波模式。当你用一个真实电影的复杂帧序列“轻推”它时,你会得到非常复杂的动态。

因此,网络的输入来自外部世界,然后我们调整前馈输出的权重,以预测电影的下一个帧。我们希望最小化模型所做的预测与实际电影下一帧之间的差异,通过适当调整权重,我们可以做到这一点。如果我们对每一对帧都这样做,是的,网络不是在这个意义上被训练的。但它以循环的形式回来,所以你是对的,我们没有调整循环网络内的局部连接,这类似于储备池计算的概念。

因此,输出权重被调整以预测电影的下一个帧。但如果我们在整体上做得很好,我们从每一帧和网络的动态状态预测下一帧,那么我们可以获取预测,关闭外部世界,并允许预测作为输入反馈到网络中。如果我们擅长做出那个预测,那就和真实世界一样好。所以,我刚才向你们展示的,就是这个的放大版本。但这里是真实情况,一个人在房间里走动。这是模型对每个下一帧的预测。第三个面板是网络本身的动态状态,即循环网络。右边是如果你移除循环连接、没有传播波模式时得到的预测。

因此,你可以看到网络内部存在这种有些复杂的活动模式。它具有这些有趣的时空动态。所以要点是,通过对循环网络施加这种循环连接,我们可以重现电影。

因此,从我的角度来看,那里有两件非常有趣的事情。其中之一是,这是一种思考大脑如何进行预测的方式,我们在大脑生理学中看到大量证据表明大脑在预测未来。或者在视觉系统的例子中,光线照射到视网膜,激活猕猴的V4区大约需要70毫秒,我们看到V4区正在预测世界可能当前的状态,它反映的不是70毫秒前的状态。所以我们有生理学证据表明大脑会进行这样的预测。我们还没有完成闭环实验,但这是一种思考那如何发生的方式。我认为这也可能是一种有趣的方式,来思考我们如何形成生活中那种真正丰富的记忆。你知道,过马路差点被车撞,你有一个非常生动的图像,那部电影你可以凭自由意志重放,并使其在你的网络中播放。所以你有激活的能力,但没有人真正知道那种过程是如何发生的。我认为这确实指向了那个方向。

总结

让我总结一下,以便我们可以结束。我已经向你们展示,在一项猴子必须检测微弱刺激的任务中,我们看到穿越MT区的波模式,我们在小鼠的细胞内电位中也看到类似的模式。我已经向你们展示,发放活动与波的相位对齐,这意味着我们认为波是由发放活动驱动的。并且刺激诱发反应的增益发生了变化,这取决于波的相位。我已经向你们展示,它非常强烈地影响感知,波相位可靠地预测检测。我提出了证据,表明长距离特征选择性斑块网络塑造了波的形状,我们可以根据这些网络上活动的反映对波进行分组,这导致了我们可以识别的主题。这些主题在刺激诱发反应层面和感知敏感性层面都驱动调谐。

然后,我阐述了一个例子,我认为,网络中波的存在赋予了网络编码复杂时空事件所需的那种时空复杂性。

本节课总结

在本节课中,我们一起学习了大脑视觉系统中固有传播波的存在和特性。我们了解到:

  1. 波的存在与特性:在清醒的灵长类动物视觉系统中,存在以波形式传播的神经活动,每秒数次,速度与无髓鞘水平纤维上的动作电位传播速度一致。
  2. 波的检测与度量:需要使用广义相位等方法来检测和度量这些频谱复杂的波。
  3. 波与神经元活动:神经元的自发发放和刺激诱发反应都与波的相位密切相关。波的去极化相位与更高的神经元增益相关。
  4. 波与感知行为:波的相位是预测动物感知表现(如检测阈值附近刺激)的强有力因素,甚至超过了一些传统的注意力指标。
  5. 解剖基础:大脑皮层中长距离的、特征选择性的斑块连接网络塑造了波的模式,导致特征选择性的增益调制和感知变化。
  6. 计算潜力:这些传播波具有强大的计算潜力,例如在模型中,它们使网络能够编码和预测复杂的时空事件(如视频),这可能为理解大脑的记忆和预测功能提供了新思路。

总之,固有传播波代表了一种基本且强大的神经计算原理,强调了在更大空间尺度上理解大脑动态的重要性。它们不仅调节局部神经反应,还可能构成高级认知功能(如预测和记忆回放)的基础。

posted @ 2026-03-26 12:27  布客飞龙III  阅读(6)  评论(0)    收藏  举报