
我们如何能通过只听一把小提琴来理解一部交响乐?我们将会错过和声、对位以及只有集体演奏才能产生的涌现音乐。拥有数十亿个独立神经元的大脑,也提出了类似的挑战。破解其思想、知觉和行动交响乐的关键,在于将我们的焦点从单个演奏者转移到整个乐团——即研究群体活动。本文旨在解决神经科学中的一个根本问题:大脑如何从其构成部分——那些看似混乱和不规则放电的神经元——中产生可靠的计算和行为?
为了回答这个问题,我们将首先探索那些让我们能够在这片复杂中找到秩序的核心原理和机制。“原理与机制”一章将揭示神经科学家使用的统计学和理论工具,从利用平均法揭示清晰信号的力量,到描述集体动力学的平均场理论的优雅,再到低维神经流形的深刻洞见。随后,“应用与跨学科联系”一章将展示这一框架的非凡力量。我们将看到群体活动如何支配我们运动的力量,构成我们决策的逻辑,驱动学习,并为理解神经系统疾病提供了一个新的视角,揭示了一条连接神经元放电的微观世界与行为和认知的宏观世界的统一线索。
想象一下,试图通过聆听一把小提琴来理解一部交响乐。你会听到它的音符、节奏,以及它时而静谧、时而激昂的瞬间。但你会错过整部交响乐。弦乐的和声、木管的对位、打击乐的轰鸣——音乐本身——都源于集体。大脑就像一个由数十亿个独立神经元组成的庞大乐团。我们的挑战是理解从这个令人惊讶地没有指挥家的乐团中涌现出的思想、知觉和行动的交响乐。
当我们初次聆听皮层的一小块区域时,我们听到的并非清晰、同步的旋律。相反,我们发现的是神经科学家所称的异步不规则状态。每个神经元(一位“音乐家”)似乎都在演奏自己不稳定的曲调,以不规则、近乎随机的间隔发放脉冲。此外,不同神经元的放电时间似乎基本不协调,即异步。乍一看,这就像是混沌。然而,正是从这种闪烁、随机的背景中,连贯的行为得以涌现。大脑如何用不可靠的部件产生可靠的计算?答案就在于理解群体活动的原理。我们必须学会停止聆听单个的小提琴,而开始倾听整个乐团。
第一步是在单个神经元的“噪声”中找到“信号”。单个神经元的脉冲序列最好被描述为一个随机的点过程;它就像盖革计数器的咔哒声,其咔哒声的概率可以随时间变化。如果一个神经元在任务的某次试验的特定时刻放电,它在下一次试验的同一时刻可能不会放电,即使条件完全相同。那么,我们如何找到该神经元试图演奏的潜在“乐谱”呢?
答案是平均的力量,这是统计学的基石。假设我们让一只猴子伸向一个目标。我们可以在数百次重复的伸臂过程中记录同一个神经元。虽然每次试验的脉冲序列都不同,但它们都是由相同的移动意图驱动的同一潜在过程的实现。通过将脉冲序列与运动开始对齐并进行平均,随机的、试验间的抖动会相互抵消。大数定律保证了这个平均值会收敛到一个平滑、可靠的信号:神经元潜在的、随时间变化的放电率,或其在条件 下于时间 时的条件强度函数 。这个试验平均放电率是我们对乐谱的初步一瞥。这就是我们如何从嘈杂的演奏中提炼出清晰旋律的方法。
同样的原理也使我们能够自下而上地构建一个群体放电率的确定性图像。如果我们想象一个由大量相同神经元组成的群体,它们都从相同的状态开始(例如,它们都在 时发放一个脉冲),我们可以描述它们随时间的集体放电率。在任何时刻 ,群体中脉冲发生的速率是任何给定神经元的脉冲是第一个、第二个、第三个等等的概率之和。这导出了一个优美的数学表达式,其中群体速率是峰间期分布的连续卷积之和。这表明,一个平滑、确定性的群体水平行为可以从嘈杂的、单个单元的集体统计中涌现。
试验平均法虽然强大,但需要一遍又一遍地重复同样的事情。那么自发的思想或新颖的动作呢?这时,我们需要一种不同的平均:跨神经元的平均,而非跨试验的平均。这就是平均场理论的核心,一个从统计物理学借鉴而来的强大思想。
想象一个由 个神经元组成的庞大议会。每个神经元都接收来自数千个其他神经元的输入。为了预测一个神经元的行为,我们可以尝试追踪它接收到的每一个输入——这是一项不可能完成的任务。平均场近似做出了一个绝妙的简化:它假设每个神经元主要受到的不是其个别邻居的具体喋喋不休的影响,而是整个群体的平均活动水平的影响。到达一个神经元的无数个别突触输入可以被视为一个单一的、有效的“平均场”。
这是可行的,因为对于一个庞大且密集连接的网络,输入的波动趋于被平均掉。中心极限定理告诉我们,随着输入数量 的增加,这些波动相对于平均值会缩小(具体来说,它们按 的比例缩放)。在非常大的群体极限下,平均活动的动力学变得实际上是确定性的。我们可以用描述群体平均值(如兴奋性神经元的平均放电率 和抑制性神经元的平均放电率 )平滑演化的少数几个方程,来代替一个由数十亿个耦合的、随机的方程组成的系统。
这正是像Wilson-Cowan模型这类经典模型背后的逻辑。在这个框架中,动力学是兴奋与抑制之间的一场精妙舞蹈。兴奋性神经元相互兴奋 (),试图放大活动,而抑制性神经元则试图平息它 (,其中从 到 的连接是减法性的)。模型的参数,即权重 ,代表了群体之间的总突触效能,捕捉了无数单个突触的净效应。
但是,一个群体的平均活动如何转化为输出放电率呢?这由群体传递函数决定。由于自然的差异性——一些神经元比其他神经元更容易被兴奋——群体并非同时全部激活。随着输入到群体的平均电压 增加,少数敏感的神经元开始放电。随着 进一步增长,越来越多的神经元被招募进来。最终,当神经元开始达到受其不应期限制的最大放电率时,群体速率达到饱和。这种关系被一条S型(S-shaped)曲线优美地捕捉到。一种常见的形式是逻辑斯蒂函数:
在这里,每个参数都有明确的生物学意义: 是群体的最大放电率, 是使群体以其最大放电率一半放电所需的平均膜电位(一个有效阈值),而 衡量群体的多样性或噪声水平,控制放电率随输入增加的陡峭程度。这个函数是神经元议会的集体“声音”。
即使在平均之后,我们可能仍然面对数千个同时记录的神经元的放电率。这是一个维度极高的数据集。如果我们有 个神经元,那么大脑在任何时刻的状态都是一个1000维空间中的一个点。我们到底如何才能理解这一切?
关键的洞见,也是现代神经科学中最深刻的思想之一,是流形假说。它提出,尽管大脑的“状态空间”大得惊人,但实际的活动模式——即神经轨迹——被限制在其内部一个维度小得多的表面上。这个表面被称为神经流形。想象一颗在一根长而蜿蜒的金属丝上的珠子。这颗珠子只能沿着一维的金属丝前进或后退,尽管金属丝本身可能缠绕在三维空间中。类似地,大脑的活动状态可能沿着一个低维流形演化,受其神经回路潜在规则的约束。大脑动力学的真实维度 可能远小于神经元的数量 。
这是一个可检验的假说。如果数据真的位于一个低维流形上,那么随着我们记录越来越多的数据,我们对内在维度的估计应该会稳定在某个小数 。相反,如果维度持续增长,则表明数据只是一个填充空间的云,该假说就是错误的。同样,数据应该形成一个单一的、连通的云;如果它仍然分裂成不相连的部分,就违背了单一、连续动力学过程的理念。
为了找到并可视化这些低维轨迹,我们使用像主成分分析 (PCA) 这样的技术。PCA就像是寻找观察一个复杂3D物体以理解其形状的最佳摄像机角度。它识别出高维神经空间中活动变化最大的方向。这些方向就是主成分。通过将N维数据投影到仅有的几个顶层主成分上,我们可以创建一个捕捉了绝大部分信息的动力学低维“影子”。这些投影点随时间的序列形成了一条低维神经轨迹。
这些轨迹不仅仅是影子;它们通常具有深刻的含义。例如,在运动皮层中,一个在二维平面中旋转的轨迹可能直接对应于猴子伸臂的平滑旋转。这种旋转动力学的发现提供了强有力的证据,表明大脑通过在这些隐藏的流形上平滑演化的动力学过程来实现计算。PCA及其相关方法使我们能够透过单个神经元令人困惑的活动,看到潜在神经计算的简单而优雅的“齿轮”。
将群体活动视为流形上的平滑轨迹这一观点非常强大,但这并非全部。大脑的乐团可以以多种风格演奏。
有时,目标不是复杂的计算,而是原始、强大的同步。在脑干中产生呼吸等节律性模式的区域,神经元必须步调一致地放电。在这里,大脑使用了另一种工具:电突触,或称间隙连接。这些是连接神经元的直接物理孔道,允许电流几乎瞬间在它们之间传递。与需要神经递质释放和扩散而有内置延迟的化学突触不同,电突触速度极快。这使它们成为完美的“同步电缆”,确保整个神经元群体作为一个强大、协调的单元统一放电。
在另一个极端,是一个被称为临界假说的迷人思想。它提出,大脑可能被调整到在一个特殊的临界点上运行,一个类似于沙堆不断被逐粒添加沙子,随时准备引发雪崩的“临界状态”。在这种状态下,一个小的输入有时可以引发一连串的神经活动——一场神经雪崩——在网络中传播。临界状态的特殊之处在于,这些雪崩没有特征尺寸;它们以各种尺度发生,从微小到巨大,遵循数学上的幂律。这种状态被认为对于信息处理是最优的,因为信号可以广泛传播而不会过快消失,也不会爆发成不受控制的、类似癫痫发作的状态。这个视角不将群体活动视为平滑的流动,而是一系列离散、噼啪作响的级联,为大脑复杂的动力学提供了不同但互补的视角。
从单个细胞类似随机的放电到确定性速率的涌现,从所有可能性的高维空间到神经流形的低维舞台,对群体活动的研究是一场在巨大复杂性中发现简单与秩序的旅程。这是一个关于没有指挥家的乐团如何学会演奏其交响乐的故事。
既然我们已经探索了庞大的神经元集合如何协调其活动的原理,我们便来到了最激动人心的问题:这一切是为了什么?这场脉冲的交响乐到底做什么?如果说前一章是关于学习神经音乐的音符和音阶,那么这一章就是关于聆听音乐会。正如我们将看到的,群体活动的框架不仅仅是一个优雅的抽象概念;它是一把强大的钥匙,解锁了我们如何移动、思考、决策和学习的基本秘密。它甚至赋予我们一个审视疾病的新视角,并让我们一瞥思想本身的几何形态。让我们开启一段跨越大脑及其邻近科学学科的旅程,见证集体的非凡力量。
我们的旅程从最切实的领域开始:我们自己身体的控制。你做的每一个动作,从举起咖啡杯到在键盘上打字,都源于你初级运动皮层(M1)中的一阵电脉冲合唱。但是,这场电风暴是如何转化为精确的物理力量的呢?
想象一下你正稳住手腕,推向一个不可移动的物体。你施加的力量大小由从M1沿皮质脊髓束发送到脊髓中运动神经元的信号所控制,后者再指令你的肌肉。我们可以用极其简洁的方式来模拟这整个级联过程。来自M1群体的集体指令可以被看作是所有参与神经元放电率的加权总和。这个总和信号是对脊髓运动神经元的净“驱动力”。然而,神经元和人一样,不会对每一个细语都做出反应;它们有一个阈值。只有当皮层驱动力超过某个阈值时,运动神经元才开始放电,招募肌肉纤维。超过这个阈值后,随着驱动力的增加,运动神经元的放电率以及随之而来的肌肉力量也会增加。这种从皮层指令到肌肉扭矩的关系,可以用一个非常简单的数学形式来捕捉:一个修正线性函数。该模型预测,在神经指令超过阈值之前不会产生扭矩,之后扭矩随指令强度线性增加。这是一个惊人的例子,说明一个复杂的生物过程如何服从于一个植根于群体活动的简洁、定量的描述。
但故事比这更深刻、更优美。大脑不仅仅是一个牵线木偶的主人。它是一个极其智能的控制器,其指令由深刻的潜在原则塑造。当我们在一次伸臂运动中记录M1中数百个神经元的活动时,我们发现了令人惊奇的事情。虽然每个神经元的活动原则上可以独立变化,在一个高维空间中创造出无数种可能性,但实际的群体活动却受到了极大的限制。集体放电模式描绘出清晰、循环的低维轨迹。拥有数百个维度的整个群体,其行为就好像只有几个旋钮可以调节。这种低维结构就是我们所说的神经流形。
为什么会发生这种情况?答案是物理学和计算理论的美妙结合。大脑不是向虚空中发送指令;它将指令发送到一个有骨骼、肌肉和惯性的物理身体。这个肌肉骨骼系统就像一个天然的过滤器。并非所有神经模式都能同样有效地产生运动。事实上,大多数随机模式只会让肌肉相互无用地抽搐。只有一个小的、“输出有效的”(output-potent)神经活动模式子空间能够有效地驱动肢体。此外,大脑似乎遵循一种最优性原则,类似于一种生物学上的懒惰:它寻求以最小的神经努力实现其目标。一个最优控制策略会自然地偏好只激活那少数几个有效的神经模式,将所有活动集中到一个低维流形中。因此,我们在神经编码中观察到的优雅简洁并非偶然;它是一个聪明的解决方案,由身体物理和大脑追求效率的双重约束所塑造。
支配我们身体的原则同样也支配着我们的思想。让我们从运动皮层转移到顶叶皮层,一个与高级认知功能有关的区域。想象一个经典的实验,受试者必须判断一个充满噪声的点阵的运动方向。当受试者观察这些点时,外侧顶内区(LIP)的神经元开始改变其放电率。对于代表“向右”选择的神经元群体,活动会缓慢上升,为该选择积累证据。
这种神经活动的斜坡式增长是一个优美的心理学理论的物理体现:漂移扩散模型(DDM)。DDM假设,决策是由一个假设的“累加器”做出的,它向一个决策边界漂移。这种漂移的速率()与证据的强度成正比。累加器为触发决策必须达到的水平是边界()。对某个选择的任何初始偏好由起始点()捕捉。非凡之处在于,这些抽象的认知参数中的每一个,在神经群体活动中都有一个直接、可观察的对应物。漂移率 是斜坡式放电率的平均斜率。边界 是放电率阈值,一旦越过,就表明对选择的承诺。起始点 是群体在证据出现之前的基线放电率,它可以被先前的期望或奖励所改变。神经放电的内在随机性为模型提供了“扩散”或噪声()。在这个优雅的框架中,我们看到认知科学的抽象世界和脉冲神经元的物理世界融合成一个统一的整体。
这种将群体编码用于抽象变量的思想延伸到了现代神经科学和人工智能中最强大的概念之一:奖励预测误差。这是驱动学习的信号,代表了你收到的奖励和你期望的奖励之间的差异。几十年来,人们认为多巴胺神经元将此作为一个单一的标量信号广播出去:“比预期的好”或“比预期的差”。但如果误差更复杂呢?如果时机对了,但奖励的类型错了呢?这需要一个多维的误差信号,一个向量()。这样的向量不能由单个数字编码,但可以由一个多巴胺神经元群体的分布式活动完美地表示。利用先进的分析技术,我们可以“解混”群体信号,并找到独立编码奖励幅度、身份或时间误差的不同活动轴。通过因果性地沉默多巴胺系统的不同输入——例如,来自眶额皮层(携带预测)或脑干核团(携带结果信息)的输入——我们可以观察到这些特定的误差轴消失,从而揭示大脑如何从输入的汇聚中构建这些复杂的多维误差向量 [@problem-id:5058221]。这一研究前沿将群体编码直接与强化学习理论联系起来,并为理解动机和选择提供了一种新方式。
大脑的代码并非一成不变;它是一个动态的、活生生的脚本,通过学习不断地重写自己。这一点在神经工程和脑机接口(BMI)这一新兴领域中表现得最为明显。在BMI中,一个计算机解码器被编程来读取运动皮层的群体活动,并将其翻译成控制机械臂或屏幕上光标的信号。
现在,假设我们使用一个固定的、不完美的解码器。最初,当用户意图将光标向上移动时,解码器可能会错误地解读神经信号,将其向上并稍微向右移动。这就产生了一个错误。接下来发生的事情简直是奇迹。大脑注意到意图与结果之间的差异,开始巧妙地调整自己的神经活动。通过一个类似于数学优化的过程,那些其活动导致了错误的神经元开始改变它们的放电模式。具体来说,每个神经元的“偏好方向”——即它放电最强的运动方向——开始旋转。那些其放电模式被解码器解读为有助于纠正错误的神经元,会将其偏好方向朝向意图方向旋转,而其他神经元则向相反方向旋转。在几分钟内,整个群体集体地重新映射其活动,创造出一个新的神经指令,与固定的解码器协同工作,产生期望的输出。大脑学会了“说”机器的语言。这是群体水平可塑性的惊人展示,是神经乐团为掌握一件新乐器而进行的集体重新调谐。
群体活动的协调和谐对于健康的大脑功能至关重要。但是,当乐团失去了指挥家,动力学失控螺旋上升时会发生什么?这为理解神经系统疾病提供了一个强大的框架。
以癫痫为例,这是一种以癫痫发作为特征的疾病。其核心,癫痫发作可以被视为群体动力学的一种病理形式。在任何神经回路中,兴奋(E)和抑制(I)之间都存在着微妙的平衡。我们可以模拟一小块皮层,其中群体的平均膜电位由兴奋性和抑制性电流的平衡决定。现在,想象一种病理状态,其中E/I平衡略微偏向兴奋——也许是由于基因突变、脑损伤或突触化学的变化。这个微小的转变可以将整个群体的平均膜电位推近其放电阈值。如果这个转变大到足以将群体推过临界点,一个灾难性的反馈循环就可能被点燃。少数神经元的放电可以兴奋更多的神经元,后者又兴奋更多的神经元,导致一波超同步的、失控的活动席卷整个回路。这就是癫痫样爆发的本质。因此,一个复杂的神经系统疾病可以被理解为群体动力学问题,是从一个稳定、平衡的状态到一个不稳定、病理状态的相变。
我们所讨论的这些发现,是由我们用来分析神经数据的工具的并行革命所促成的。同时记录数百或数千个神经元会产生一股巨大而复杂的数据洪流,以至于无法通过逐个观察神经元来理解。解决方案是降维——在高维复杂性中找到隐藏的简单、潜在结构。
像主成分分析(PCA)这样的早期方法是一个重大的进步。PCA是一种“无监督”方法;它只是找到神经状态空间中活动变化最大的方向。这很有用,但有一个主要缺点:方差最大的方向可能不是科学上最有趣的方向。它可能是与刺激、决策和运动相关的信号的混合体,全部混杂在一起。
这导致了“有监督”或靶向降维(TDR)技术的发展。这些方法就像一个神奇的棱镜。它们不仅仅是找到最亮的方向,而是利用我们对实验任务的知识,将总神经活动的“白光”分解成其组成的“颜色”。像解混主成分分析(dPCA)这样的方法被设计用来寻找与刺激特别相关的群体活动模式,而其他模式则与决策相关,还有一些与运动本身相关。它通过将问题重新构建为重构问题来实现这一点:它问,“在平均掉所有其他因素后,什么样的神经活动模式能最好地重构仅与刺激相关的信号分量?”通过对任务的每个方面都这样做,dPCA提供了一个精美地“解混”的视角,展示了大脑如何分别表示和处理不同类型的信息。
从具体到抽象的这段旅程,最终汇聚到所有科学中最深刻、最令人费解的前沿之一:理解神经编码的几何。通过运用一门叫做拓扑数据分析(TDA)的纯数学分支的工具,我们可以探究神经群体产生的数据的“形状”。TDA可以识别出诸如连通分量(0维孔洞)、环(1维孔洞)和空腔(2维孔洞)等稳健特征。考虑一个任务,猴子必须记住一个物体的3D朝向。所有可能的3D朝向空间具有球体的拓扑结构。当神经科学家将TDA应用于执行此任务的神经元群体活动时,他们得到了一个惊人的结果:神经数据包含一个单一的、持续存在的2维空腔。神经活动模式被限制在一个拓扑上等同于球体的高维表面上。以一种令人难以置信的自然优雅,大脑似乎通过创造一个本身在拓扑上等同于球体的表示来代表一个球形概念。
从移动我们肌肉的力量到我们思想的形状,群体活动的概念提供了一条单一的、统一的线索。它揭示了简单的元素如何协同作用,产生令人惊叹的复杂和优美的计算。随着记录和分析这场神经交响乐的工具不断改进,我们有望揭示关于我们头脑中宇宙的更深层次的真理。