try ai
科普
编辑
分享
反馈
  • 群体向量算法:运动的神经民主

群体向量算法:运动的神经民主

SciencePedia玻尔百科
要点总结
  • 大脑通过大量广泛调谐的运动皮层神经元的集体“投票”来编码运动方向,这一原则被称为群体编码。
  • 群体向量算法通过对代表每个神经元偏好方向的向量进行加权求和来计算预期的运动,权重为其放电率。
  • 精确解码需要考虑基线放电率、神经噪声和偏好方向的非均匀分布等生物学因素。
  • 群体编码是一种普遍的大脑机制,不仅用于运动控制,也用于感觉知觉,例如解码前庭系统中的头部运动。

引言

大脑如何将一个简单的意图,比如伸手去拿杯子,转化为精确的身体动作?这个神经科学中的基本问题挑战了为每个动作都存在一个单一“指挥官神经元”的观点。现实远比这更优雅和稳健:这是一个民主过程,数百万神经元集体投票以决定行动方案。本文深入探讨了​​群体向量算法​​,这是首个解释运动皮层中群体编码原理的开创性模型。通过理解这个算法,我们可以解码大脑发出的运动指令。以下各节将首先在“原理与机制”部分解析该算法的核心原则,探讨单个神经元的“选票”是如何投出和计数的。随后,“应用与跨学科联系”部分将展示该算法的深远影响,从驱动脑机接口到解释我们如何感知周围世界。

原理与机制

大脑这个由数十亿个充满噪声、发放脉冲的神经细胞组成的器官,是如何协调手臂优雅而精确地伸向一杯咖啡的呢?人们可能会想象,每一种可能的运动都有一个“指挥官神经元”,一个单独的细胞通过放电来启动一个特定的动作。但大自然以其智慧,选择了一个更稳健、更优雅的解决方案:民主制。向特定方向移动的决定并非来自某个独断的声音,而是来自大量神经元的集体投票。这个被称为​​群体编码​​的原则,是运动皮层生成指令方式的核心,而​​群体向量算法​​则是首个解开这个美丽秘密的钥匙。

神经元的投票:广泛的方向调谐

在20世纪80年代,Apostolos Georgopoulos和他的同事们在猴子执行简单的伸手任务时,记录其初级运动皮层(M1)的活动,并取得了突破性发现。他们发现,单个M1神经元并非等待完美时机才行动的“沉默刺客”。相反,它们更像热情的体育迷,每个神经元都有自己钟爱的运动方向。

当手臂朝某个神经元的特定​​偏好方向​​移动时,该神经元会最剧烈地放电。但它的热情不止于此。对于邻近方向的运动,它仍然会放电,只是热情稍减。随着运动方向与其偏好方向的偏离越来越大,其放电率会平滑而可预测地下降。这种分级响应被称为​​方向调谐​​。每个神经元远非一个二元的“开/关”开关,而是对每一种可能的运动都有一个广泛而连续的“意见”。

这种关系通常可以用一个简单的数学函数——余弦函数——完美地捕捉。神经元 iii 的放电率 rir_iri​ 可以建模为:

ri(θ)=bi+kicos⁡(θ−θi)r_i(\theta) = b_i + k_i \cos(\theta - \theta_i)ri​(θ)=bi​+ki​cos(θ−θi​)

让我们来解析一下这个公式,因为每一项都揭示了该神经元的一些特性:

  • θ\thetaθ 是预期运动的实际方向。
  • θi\theta_iθi​ 是神经元固有的​​偏好方向​​,即其响应最强烈的角度。
  • bib_ibi​ 是​​基线放电率​​,一种持续存在的背景“喋喋不休”或兴奋性,即使神经元对当前运动不“感兴趣”时也存在。这是当运动方向与其偏好方向成90度角时细胞的放电率。
  • kik_iki​ 是​​调制深度​​或增益。它衡量神经元对其偏好有多“热情”。高的 kik_iki​ 意味着神经元的放电率随方向变化剧烈,而低的 kik_iki​ 则意味着它的意见较为温和。在许多情况下,这种调制也与运动速度成正比。

这个余弦模型揭示了单个神经元本质上是模糊的。一个中等水平的放电率可能意味着手臂正在以两个可能的角度之一移动,这两个角度围绕其偏好方向对称。一张选票不足以确定结果。大脑的天才之处在于它如何统计数百万张这样模糊的选票,从而得出一个清晰明确的共识。

拔河:统计选票

群体向量算法是这种计票的正式方法。想象一个中心点,绳索向四面八方伸展。每根绳索代表一个M1神经元,并与其偏好方向对齐。要解码一个预期的运动,我们让每个神经元以与其当前放电率成正比的力“拉”动它的绳索。中心点移动的方向就是群体的集体决定。

在数学上,我们将每个神经元的投票表示为一个向量 vi⃗\vec{v_i}vi​​。向量的方向是神经元的偏好方向 pi\mathbf{p}_ipi​,其大小是神经元的放电率 rir_iri​。最终的​​群体向量​​ V⃗pop\vec{V}_{pop}Vpop​ 就是所有这些单个向量的总和:

V⃗pop=∑i=1Nripi\vec{V}_{pop} = \sum_{i=1}^{N} r_i \mathbf{p}_iVpop​=i=1∑N​ri​pi​

这个合向量 V⃗pop\vec{V}_{pop}Vpop​ 的角度就是解码出的运动方向。

让我们来看一个简单的假设性例子。假设我们只记录了四个神经元,它们的偏好方向分别是右(0∘0^{\circ}0∘)、上(90∘90^{\circ}90∘)、左(180∘180^{\circ}180∘)和下(270∘270^{\circ}270∘)。在某次试验中,我们测量到它们减去基线后的放电率分别为 r1=20r_1 = 20r1​=20 Hz(右)、r2=5r_2 = 5r2​=5 Hz(上)、r3=10r_3 = 10r3​=10 Hz(左)和 r4=15r_4 = 15r4​=15 Hz(下)。

向右拉的神经元最为活跃,但其他神经元并非沉默。向左的神经元以10的力向后拉,向下的神经元以15的力向下拉。向上的神经元只贡献了5的微弱拉力。水平(x)方向的净拉力是 20−10=1020 - 10 = 1020−10=10。垂直(y)方向的净拉力是 5−15=−105 - 15 = -105−15=−10。最终的群体向量是 (10,−10)(10, -10)(10,−10),指向右下方,角度为 315∘315^{\circ}315∘ 或 −45∘-45^{\circ}−45∘。这个简单的求和成功地整合了所有四个细胞的“意见”,产生了一个单一、明确的指令。

公平选举的规则

这个优雅的算法效果惊人地好,但其成功取决于神经元群体的一些关键属性——这些是确保民主过程公平的规则。

首先,群体必须是多样化的。神经元的偏好方向必须​​均匀分布​​,覆盖所有可能的运动角度。如果大多数神经元偏好向右运动,那么群体向量就会有一个内在的偏置,使得解码向右的运动容易,而解码向左的运动困难。均匀分布确保解码器对任何运动方向都没有偏见。

其次,我们必须区分信号和噪声。基线放电率 bib_ibi​ 与当前运动的方向无关。如果我们在计算中包含它,就会给每个神经元增加一个恒定的拉力。如果群体不是完全对称的,这些基线拉力相加可能会产生一个非零的偏置向量,不断地将最终估计值拉离真实方向。一个简单的解决方法是使用​​减去基线的放电率​​ ri−bir_i - b_iri​−bi​ 作为每个神经元向量的权重。这确保我们只关注信号中实际编码方向的部分。

同样,增益 kik_iki​ 必须是​​各向同性​​的,意味着它们不系统地依赖于偏好方向。如果偏好向上运动的神经元始终比偏好向下运动的神经元更“热情”(具有更高的增益),那么解码出的输出就会被扭曲并向上偏置。

从理论到现实:实时解码

到目前为止,我们考虑的是一个静态的快照。但运动是动态的。大脑如何时时刻刻更新它的指令?答案在于计算一个​​时间分辨的群体向量​​。真实的神经元不会产生平滑的放电率;它们产生的是离散的、全或无的脉冲。要应用我们的算法,我们首先需要从这个脉冲序列中估计一个“瞬时”放电率。

一种标准技术是​​核平滑​​。我们将每个脉冲视为一个微小的活动点,然后将这些点随时间平滑。想象每个脉冲都敲响一个小铃铛;任何时刻的瞬时放电率是所有近期铃声衰减声音的总和。在数学上,这是通过将脉冲序列与一个核函数(如窄高斯函数或“钟形曲线”)进行卷积来完成的,这给了我们一个平滑、连续的放电率估计值 ri(t)r_i(t)ri​(t)。通过将这个随时间变化的放电率代入我们的群体向量公式,我们得到一个向量 V⃗pop(t)\vec{V}_{pop}(t)Vpop​(t),它能实时追踪预期的运动方向。

这种时间分辨的方法也阐明了我们正在解码什么。在很短的时间窗口内计算的群体向量给了我们一个手的​​瞬时速度​​的估计。相反,如果我们在很长一段时间内对活动进行求和,我们实际上是在对速度进行时间积分,从而得到总​​累积位移​​的估计。这揭示了一个基本的权衡:使用短时间窗口可以得到一个响应迅速但可能充满噪声的估计,而较长的时间窗口可以平均掉噪声,但会模糊快速变化,引入平滑偏差。

简约的力量与局限

群体向量算法证明了神经科学中简单而优雅思想的力量。它展示了一个分布式并行系统如何能够稳健地编码信息。这个解码器的性能非常可预测。其准确性随着群体中神经元数量(NNN)和神经元的“热情”(调制深度,kkk)的增加而提高,而随着与方向无关的“喋喋不休”的数量(基线率,bbb)的增加而降低。这为我们提供了一个量化神经信息处理本质的方法。

此外,这些方向调谐响应的稳定性为我们深入理解运动皮层实际编码的内容提供了深刻见解。实验表明,即使手臂的姿势改变或施加外部负载——这些条件完全改变了完成运动所需的特定肌肉力量——神经元的偏好方向也基本保持不变。如果M1神经元仅仅是指令单个肌肉,它们的调谐应该会随着这些动力学需求而改变。它们没有改变这一事实,有力地证明了它们编码的是一个更抽象的运动学计划:空间中的运动方向,而不是实现它所需的特定力量。

然而,尽管群体向量功能强大,但它并非最终定论。它的核心是一种加权平均。虽然有效,但它并不总是解码信息的统计最优方法,尤其是在处理少量神经元或复杂的调谐曲线时。更先进的技术,如贝叶斯推断或最大似然估计,可以通过整合一个更完整的神经元放电概率模型来提供更准确的估计。

尽管如此,群体向量仍然是计算神经科学的基石。它是第一个以优美清晰的方式展示大脑如何通过群体共识实现精确性的模型,揭示了支配心智共和国的民主原则。

应用与跨学科联系

我们已经了解了群体向量的原理,看到了一群广泛调谐的神经元如何作为一个集体,以惊人的精确度来表征一个方向。这个想法如此简单、如此优雅,以至于人们可能会怀疑它是否仅仅是一个巧妙的数学技巧。但似乎大自然也偏爱优雅。群体向量不仅仅是一个模型;它是一个强有力的透镜,通过它我们可以理解大脑如何执行各种各样的任务。它是一条线索,连接着我们四肢的控制、我们的平衡感,甚至是我们用来理解嘈杂数据的统计工具。让我们探索这片领域,看看这个美妙的想法如何在如此多不同的领域中开花结果。

读取心智意图:解码运动

群体向量的故事始于运动皮层,即大脑自主运动的指挥中心。想象一下你决定伸手去拿一杯咖啡。这个“伸手拿杯”的抽象想法是如何转化为引导你手臂所需的精确肌肉指令的?群体向量提供了一个异常简单的答案。

在一个理想化的世界里,就像物理学家的思想实验一样,这个机制是完美无瑕的。想象一下运动皮层中的一群神经元,它们的偏好方向完美且均匀地分布在一个圆周上,就像轮子的辐条。如果每个神经元都以与其放电率成正比的强度为其偏好方向“投票”,那么得到的向量和——即群体向量——将精确地指向预期的伸手方向。对于这样完全对称的排列,解码是精确的,误差为零。这种数学上的完美是这个想法最初如此引人注目的原因:它提出了一个大脑编码方向的简单、万无一失的方法。

当然,大脑是一个生物器官,而不是数学家的理想构造。对这个简洁图景的第一个偏离是,神经元从未真正沉默。它们有一个基线放电率,即使没有运动意图时也存在着持续的活动嗡嗡声。如果我们盲目地将选票相加,这种嗡嗡声会带来噪声和偏差。一个聪明的工程师——或者一个高效的进化过程——会很快意识到,真正的信息不在于总放电率,而在于与基线相比的变化。通过简单地减去每个神经元的基线活动,我们可以分离出信号中真正与运动相关的部分。这个简单的修正使得解码器对这些与刺激无关的偏移不敏感,是构建实用解码器的关键第一步[@problem-id:4010756]。

构建一个现实世界的解码器,比如说用于让瘫痪者控制机械臂的脑机接口(BCI),涉及一个学习和校准的过程。我们不能假设我们知道每个神经元的偏好方向和增益。相反,我们必须从大脑的活动中学习它们。这是通过在受试者(或训练有素的动物)向各种已知方向运动时记录神经元群体来完成的。利用这些“训练数据”,我们可以将余弦调谐模型拟合到每个神经元的响应中,估计其独特的参数。一旦校准完成,解码器就准备就绪了:它可以接收一个新的神经活动模式,应用学习到的模型,并计算群体向量以实时“读出”运动意图。

应对生物学的复杂性

从完美模型到实际应用的旅程总是一场与不完美作斗争的战斗。大脑的生物学特性引入了几个复杂性,挑战了群体向量的简单优雅。

首先,真实的神经元不是抽象的余弦函数。神经元的放电率不能为负——这是一个显而易见但至关重要的约束,称为​​整流​​。此外,一个神经元可能只有在其输入超过某个​​阈值​​后才开始稳定放电。这些非线性打破了原始模型的完美对称性。那些本应有“负”贡献(即在非偏好方向上放电率低于基线)的神经元被简单地沉默了。这种选择性地移除选票会引入系统性偏差,导致解码出的角度与真实方向有轻微偏离。理解这些偏差是改进我们解码器的关键。

其次,神经活动是出了名的嘈杂。一个神经元可能因为与刺激无关的原因突然爆发一连串脉冲,在数据中产生一个异常值。在我们的神经民主制中,异常值就像一个选民比其他所有人都喊得大声得多。经典的群体向量作为一个简单的总和,对这类异常值非常敏感,可能会被远远拉离正轨。在这里,计算神经科学借鉴了稳健统计学的一个强大思想。我们可以不给每张选票同等的信任度,而是使用一个迭代过程来降低异常值的影响。通过使用基于​​Huber​​或​​Tukey双权方差​​等稳健损失函数的方法,我们可以构建一个本质上能够自我修正的解码器。它能识别出那些活动与当前预测出奇不同的神经元,并减少它们的影响,从而得到一个更稳定、更可靠的真实运动方向估计。

对于像BCI这样的实际应用来说,最大的挑战或许在于大脑不是静态的。在数小时和数天内,神经元的特性可能会改变——它们的基线放电率可能会漂移,增益可能会波动。这种“校准漂移”意味着周一训练的解码器到周二可能表现不佳。正是在这里,简单的群体向量演变成一个更复杂的工具。一个优雅的解决方案是​​调制均衡​​,即每个神经元的贡献都通过其自身的估计增益进行归一化。这确保了一个突然变得更“兴奋”的神经元不会获得不公平的过大投票权。对于偏好方向非均匀分布的群体,我们甚至可以使用线性代数来计算一个校正矩阵,以消除由非均匀性引起的偏差。这就产生了所谓的​​最优线性估计器(OLE)​​,它是原始群体向量思想的一个稳健而强大的推广。

面对所有这些复杂性,我们如何判断成功?如果一个解码器在一次试验中偏差5∘5^\circ5∘,在下一次试验中偏差−5∘-5^\circ−5∘,它的平均误差是零吗?在任何有意义的层面上都不是!我们必须区分准确度(平均误差或偏差)和精确度(误差的变异性)。一个解码器可以非常精确,每次都给出几乎相同的答案,但如果那个答案持续错误,它仍然是高度不准确的。为了真正评估解码器的性能,我们需要像​​平均绝对角偏差(MAAD)​​这样的指标,它衡量每次试验中误差的大小,从而给我们一个关于其实用性的真实画面。

一个普适原理:感知三维世界

群体编码的力量远远超出了运动皮层。它似乎是大脑用来表征连续量的一种通用策略。一个惊人的例子来自一个完全不同的领域:我们的平衡感,由内耳的前庭系统所支配。

你的大脑知道哪个方向是下,以及你的头部是如何移动的,不是因为单个传感器,而是因为一群传感器。耳石器官(黄斑)感知线性加速度。它们充满了微小的毛细胞,每个毛细胞都有一个特定的三维最大敏感方向。当你加速时,力会使这些毛细胞偏转,整个群体活动的模式编码了加速度的方向和大小。

我们可以应用完全相同的原则来解码这些信息。通过将每个前庭传入神经元的响应建模为三维加速度向量的线性函数,我们可以从统计学第一性原理推导出最佳的解码器。​​最大似然估计器​​——在给定观察到的放电率的情况下猜测加速度的统计最优方法——结果是一个加权的群体向量!每个神经元的偏好方向向量都由其增益和信号的可靠性(其噪声方差)加权。这使得大脑能够最佳地结合来自不同类型神经元的信息,例如低噪声的“规则”传入神经元和高增益的“不规则”传入神经元,以构建一个稳健的加速度估计。

同样的故事也发生在半规管感知旋转的过程中。这三个大致正交的半规管感知角速度。但生物学从来都不是那么完美;这些半规管并非完全对齐,其中的传感器群体也并非完全均匀。一个假设系统完全均匀的“朴素”解码器会产生有偏差的头部旋转估计。然而,一个“校正后”的解码器,它首先学习传感器轴和增益的真实分布——通过计算一个描述群体整体如何转换角速度向量的系统矩阵——可以实现对运动的完美、无偏的重建。这是一个深刻的教训:大脑不需要按照完美的蓝图来构建。它只需要一个能够学习自身物理特性并对其进行反演的机制。

从控制手臂到感知我们在空间中的运动,群体向量提供了一个统一的框架。它展示了大脑如何能从一群不精确、嘈杂且多样的组件中实现卓越的精确度和稳健性。它证明了分布式表征的力量——即整体真正大于且比其各部分之和更智慧。