群体编码

玻尔百科

核心要点

群体编码通过大量广泛调谐神经元的集体活动来表征信息，其提供的鲁棒性和精确性远超任何单个神经元。
大脑使用群体向量等机制来解码集体神经活动，这种机制近似于最大似然估计等统计最优方法。
群体的活动模式可以表征一个完整的概率分布，为贝叶斯推断和不确定性的编码提供了神经基础。
这一原理是感觉知觉和运动控制的基础，并成为脑机接口和人工神经网络等技术的基石。

引言

大脑是如何用数十亿个充满噪声、不可靠的神经元来构建一个精确而可靠的世界模型的？一个简单的“一个神经元，一个概念”的想法，即所谓的标记线编码，会极其脆弱，并且与临床观察不符。大脑的解决方案远为优雅和鲁棒：群体编码。这一基本原理假定，信息并非由任何单个神经元持有，而是分布在庞大神经元群体的集体活动中。本文探讨了这种神经“群体智慧”的力量。首先，我们将审视“原理与机制”，揭示群体编码如何提供巨大的鲁棒性，实现远超单个神经元的精确度，甚至通过概率计算来表征不确定性。随后，“应用与跨学科联系”一章将展示这些原理的实际应用，阐明它们在塑造我们的感觉、引导我们的运动以及启发脑机接口和人工智能等突破性技术方面的作用。

原理与机制

想象一下，你的任务是制造一个测量温度的设备，但你手上只有一堆非常廉价、不可靠的温度计。每个温度计的调谐范围都很宽：它在某个“偏好”温度附近读数最高，但对其他各种温度也有微弱反应。更糟糕的是，每个温度计都充满噪声，其读数时时刻刻都在随机波动。单个这样的温度计几乎毫无用处。你究竟如何才能获得一个精确可靠的温度读数呢？大脑每时每刻都面临着这个问题，而它的解决方案在鲁棒和高效设计方面堪称典范：群体编码。

群体智慧：分布式与鲁棒的表征

大脑表征世界的一种看似简单诱人的方式是，为它需要识别的每一种特定事物都配备一个专用神经元——一个用于你祖母面孔的“祖母细胞”，一个用于特定音符的“升C调神经元”，或者一个用于21摄氏度这一精确温度的“21度神经元”。这种想法被称为标记线编码 (labeled-line code)。每个神经元就像仪表盘上的一个特定警示灯。它是一个明确无误的信号：当该神经元发放时，刺激就存在。

但自然界很少如此井然有序，而且有其充分的理由。如果“祖母细胞”死亡了会怎样？你会突然无法认出你的祖母吗？如果指尖上某个特定点的神经元在一次微小损伤中丧失了会怎样？你的触觉会因此出现一个永久性的、轮廓清晰的“洞”吗？标记线系统极其脆弱。单个组件的丢失可能导致其编码的特定特征出现灾难性故障。

临床证据表明，大脑并非如此运作。在脑干感觉处理区遭受非常小范围、局部性中风的人，通常不会在某个点上完全丧失感觉。相反，他们可能会发现自己的触觉变得稍欠精确——例如，他们分辨皮肤上两个邻近点的能力可能会受到轻微损害，或者他们可能需要更强的振动才能感觉到。系统会优雅地降级，而不会崩溃。

这种“优雅降级”是分布式群体编码的一个标志。大脑并不依赖于单个专业神经元，而是通过大量神经元的集体活动来表征一个刺激，比如指尖上的触碰。这个群体中的每个神经元都有其自身的调谐曲线：描述其发放率随刺激变化而变化的曲线。关键在于，这些调谐曲线范围很宽，且彼此大量重叠。因此，单次触碰会激活许多神经元，每个神经元的激活程度各不相同。信息并非存在于任何一个神经元中，而是弥散在整个群体中。

这种分布式策略有两个深远的优势。首先，如我们所见，它提供了巨大的鲁棒性。信息被冗余编码，因此丢失几个神经元就像丢失了我们几个廉价的温度计一样——总体平均值仅受轻微影响。冗余是一种特性，而非缺陷。其次，或许更令人惊讶的是，它能实现令人难以置信的精确性。尽管每个神经元都是广泛调谐且充满噪声的，但通过结合来自众多神经元的信息，大脑可以以远超任何单个神经元“分辨率”的精确度来估计刺激。这就是神经群体的智慧。

解读神经天机：解码编码

如果信息弥散在成千上万个神经元中，大脑如何将其读出以做出决定，例如，决定朝哪个方向移动手臂？答案是神经科学中最优雅直观的想法之一：群体向量。

想象初级运动皮层中有一群神经元参与规划手臂的伸展动作。每个神经元都有一个偏好的运动方向；当你即将朝那个特定方向移动手臂时，它会最剧烈地发放。让我们将这个偏好方向表示为一个向量。当你规划一次伸展时，这一整群神经元都会变得活跃。为了解码它们的集体信息，我们可以让每个神经元为其偏好方向“投票”。其投票的权重由其当前的发放率决定。群体向量就是所有这些加权投票的平均值。最终得到的向量以惊人的准确性指向预期的运动方向。

这个简单的民主过程不仅仅是一个巧妙的技巧。事实证明，它是一项卓越的自然工程。在关于神经元如何发放的某些合理假设下，这种简单的群体向量计算是数学上最优的最大似然估计 (Maximum Likelihood estimator) 的一个极佳近似。这是一个展现科学深层统一性的优美范例：一个神经元可以轻松实现的、生物学上合理的简单机制，从统计推断的角度来看，却是一个近乎完美的解决方案。

不只是一个数字：编码不确定性

到目前为止，我们设想大脑从群体活动中解码出一个“最佳猜测”值。但如果大脑在做的事情远比这复杂呢？如果活动模式不仅代表一个值，还代表我们对该值的置信度呢？这就是贝叶斯大脑假说 (Bayesian Brain hypothesis) 的核心思想，该假说认为知觉是一个概率推断的过程。

根据这一观点，大脑不断地将新的感觉证据与其关于世界的先验信念进行权衡，以得出一个更新的后验信念。用概率语言来说，这由贝叶斯定理捕获：

$p(s|o) \propto p(o|s)p(s)$

这里， $p(s)$ 是先验，即我们对刺激 $s$ 已有的信念。 $p(o|s)$ 是似然，即在刺激为 $s$ 的情况下，做出感觉观察 $o$ 的概率。而 $p(s|o)$ 是后验，即看到证据后我们更新的信念。

群体编码是这类计算的完美神经基底。整个群体活动形成的“山丘”可以代表一个完整的概率分布。一个高而尖的活动山丘表示对刺激的高度确定性，对应一个窄的后验分布。一个低而宽的山丘则表示高度的不确定性。

这背后的数学原理极为优雅。想象一下，你的先验信念由一个高斯（钟形曲线）分布表示。然后你从一个神经元接收到感觉证据，其证据也可以用一个类似高斯的似然函数来描述。要结合这两者，你只需将它们相乘。高斯分布的奇妙之处在于，它们的乘积还是一个高斯分布！在群体编码中，这种乘法可以通过简单地将神经活动相加来实现（如果它们代表的是对数概率）。最终信念的精确度（一种衡量其确定性的指标，与方差的倒数相关）实际上就是先验精确度与每个神经元证据精确度的总和。大脑实际上可以累加来自无数来源的信息——先前的经验和成千上万神经元的发放——来不断完善其对世界的模型。

大脑的交响曲：超越简单平均

群体编码的图景实际上更加丰富和复杂。大脑采用多种多样的编码策略，以适应不同的需求。

一个关键的制约因素是能量。发放脉冲在代谢上是昂贵的。稀疏编码是一种节能策略，即对于任何给定的刺激，只有一个庞大群体中极小部分的神经元是活跃的。你看到的不是一个宽阔的活动山丘，而只是几个尖锐的峰值。这类似于描述一个复杂场景时，不是列出每个像素的颜色，而是说出存在的几个关键物体。这种稀疏性带来了巨大的能量节省，而过完备表征（神经元数量多于刺激维度）则保持了对损伤的鲁棒性。

此外，神经元的“噪声”并不总是独立的。有时，神经元会共享波动；它们倾向于在同一时间犯相同的错误。这被称为噪声相关性。一个简单的平均解码器在这种共享噪声面前将无能为力。然而，大脑更聪明。它可以学习噪声的结构。想象两个神经元对某个刺激具有相反的调谐，但它们的噪声是正相关的——它们倾向于同时变得更嘈杂。一个简单地取其发放率之差 ( $r_1 - r_2$ ) 的解码器，将在放大信号的同时抵消掉共享的噪声。这表明大脑的解码机制可以被精巧地定制，以适应其自身回路的统计特性。

从一个简单的平均噪声的方法，到一个用于概率推断的复杂基底，群体编码是脑功能的一个基本原理。它揭示了简单的、不可靠的组件集合如何协同工作，创造出一个具有惊人精确性、鲁棒性和计算能力的系统。这是大自然解决方案优雅与效率的明证。

应用与跨学科联系

在探究了群体编码的基本原理之后，我们现在来到了探索中最激动人心的部分：见证这些思想的实际运作。在抽象层面理解一个原理是一回事；而当它为大脑功能注入生命，并激发技术新前沿时，亲眼目睹其力量和优雅则是另一回事。群体编码的概念不仅仅是一个巧妙的理论技巧；它是一个统一的主题，是自然界为解决各种各样的问题而反复采用的一种总体策略。从最简单的感觉到最复杂的思想，再到我们最先进机器的电路中，集体智慧无处不在。

现在，让我们一同游览这片非凡的景象，看看众多神经元协同工作的简单思想如何催生了我们丰富的体验和精确的行动。

感觉的交响曲

我们对世界的感知并非被动的记录，而是一种主动的建构，是一曲由无数神经元合奏团演奏的充满活力的交响乐。每一种感觉模态都以其独特的方式，利用群体编码将物理刺激转化为心智的私密语言。

想象一下你用手抚过一个有纹理的表面。为什么你的指尖如此敏感，能够分辨最精细的细节，而你背部的皮肤却远不那么敏锐？答案在于一个名为皮层放大的概念。在你大脑的体感皮层——处理触觉的脑区——分配给一块皮肤的神经“不动产”数量与其物理尺寸完全不成比例。你的指尖、嘴唇和舌头占据了广阔的皮层组织区域，充满了神经元，而你的背部或腿部则由小得多的区域代表。这是群体编码最直接的形式。更多的神经元进行监听意味着更高保真度的信号。关于神经群体中信息的理论表明，感觉估计的精确度——我们分辨两个邻近点的能力，即敏锐度——与编码群体中的神经元数量成正比。更多的神经元提供了更多对刺激的独立“样本”，使大脑能够平均掉噪声，实现更精细的分辨率。因此，你指尖的精妙敏感度是专门用于它们的神经群体规模庞大的直接结果。

这种并行处理的原则在最早的阶段就开始了。以视网膜为例，这是你眼后部的感光组织。它不是一个简单的相机传感器。在信号到达大脑之前很久，视网膜就已经将视觉世界分成了多个并行通道。例如，一些被称为ON双极细胞的细胞被光的增加所兴奋，而另一些被称为OFF双极细胞的细胞则被光的减少所兴奋。这两个群体构成了视觉对比度的原始群体编码。它们分层排列，将信息传递给不同组的神经节细胞，后者再向大脑报告。通过为“更亮”和“更暗”分配独立的通道，视觉系统可以以更高的速度和保真度来表征两个方向的变化。一个假想的实验，如果其中一条通路被沉默，其逻辑就会显现：失去OFF通路，大脑对突发阴影的反应能力会显著受损，使整个群体编码偏向于只表征光的增量。这种分工是一个反复出现的主题，它允许群体覆盖更宽的动态范围，并更有效地表征世界。

但是，当没有简单的地图可循时会发生什么呢？当你听到一个声音时，你的耳朵里没有“声音地图”。为了确定声音的位置，大脑必须根据声音到达每只耳朵的微小时间差（双耳时间差，ITD）和声音的响度差（双耳声级差，ILD）进行巧妙的计算。在听觉皮层中，我们找不到对“左侧15度”有尖锐调谐的单个神经元。相反，我们发现的是非常宽泛、重叠的调谐。左半球的神经元倾向于对来自右侧的声音反应更强，反之亦然。大脑定位声音不是通过找到一个“活跃”的单个神经元，而是通过比较两个庞大群体——整个左右听觉皮层——的总活动量。这被称为对抗通道编码。两个半球之间的活动差异提供了一个平滑、连续的信号，指示了声音的方向以及它离中心有多远。这是一个优美的解决方案：大脑没有试图创建一个不可能精确的地图，而是利用两个广泛调谐的群体之间的简单比较，来做出一个鲁棒而准确的判断。

行动的语言

如果说感觉是大脑倾听世界，那么行动就是大脑向世界发声。在这里，群体编码同样提供了语言。也许最具代表性的例子就在于初级运动皮层，即大脑自主运动的指挥中心。当你决定伸手去拿一杯咖啡时，你的大脑是如何告诉你的手臂该往哪个方向去的？

20世纪80年代，Apostolos Georgopoulos 和他的同事们进行的实验揭示了一个惊人简单的机制。他们发现运动皮层中的单个神经元对运动方向有广泛的调谐。一个给定的神经元会在其“偏好方向”的运动中最为活跃，而当运动偏离该方向时，其活动逐渐减弱。没有单个神经元能编码你伸展的精确方向；它的信号是模糊的。但是，当我们倾听整个群体时，谜底就解开了。

大脑会计算一个群体向量。想象每个神经元为其偏好方向“投票”，其投票的强度由其发放率决定。群体向量就是所有这些加权投票的平均值。奇迹般地，这个向量——成千上万个广泛调谐神经元的民主共识——以惊人的准确性指向预期的运动方向。这是一个强有力的证明，说明精确性可以从一群不精确的元素中涌现。这种编码也是抽象的；它代表了运动的运动学意图（其方向和速度），而不是需要收缩的特定肌肉，后者会根据你的姿势或者你是否持有重物而发生巨大变化。

超越感觉与行动

群体编码的力量远不止于简单的感觉地图和运动指令。它在塑造我们经验中更复杂、认知性的方面也起着关键作用。

思考一下痒和痛这两种微妙而又截然不同的感觉。很长一段时间里，科学家们争论痒是否仅仅是轻微形式的疼痛。根据遗传学和神经学研究拼凑出的现代观点，提出了一个更复杂的混合模型。在脊髓层面，似乎存在一个专门的神经元中枢，其作用类似于痒的“标记线”——当它们活跃时，你会感到痒。它们的激活对于产生这种感觉是必要且充分的。然而，这并非故事的全部。感觉的性质和强度——是轻微的搔痒感还是难以忍受的抓挠冲动，以及它是否会转变为灼痛——似乎是由更广泛的感觉神经元群体的活动模式决定的。某些外周神经纤维的稀疏、低频激活倾向于被感知为痒，而一个重叠的纤维群体的广泛、高频激活则被感知为痛。这表明大脑采用了一种巧妙的组合策略：一个特定的通道来定义“是什么”（这是痒），以及一个群体编码来定义“有多少”和“是哪种”。

甚至我们集中注意力的能力也是由群体编码塑造的。 “集中注意力”意味着什么？神经科学家发现，注意力不仅仅是“调高”相关神经元的“音量”。它从根本上改变了它们集体活动的结构。一个神经元在不同试验中的反应变异性可以分解为私有噪声（该神经元独有）和共享噪声，后者导致整个群体的活动一起上下波动。这种共享变异性，或称噪声相关性，尤其具有破坏性，因为它引入了冗余，并限制了可以从群体中提取的信息量。事实证明，注意力就像一位总指挥，抑制了这些共享的噪声波动。通过“让合唱安静下来”并使每个神经元的变异性更加独立，注意力有效地消除了噪声的相关性，从而可以以更高的保真度读出感觉信号。群体编码变得更有效率，知觉也变得更加敏锐。

工程化大脑：从生物学到技术

群体编码的原理是如此强大和普遍，以至于它们已经超越了生物学，成为现代神经技术和人工智能的基石。通过理解大脑的语言，我们自己也开始说这种语言了。

其中最深远的应用之一是在神经义肢学领域。对于瘫痪的个体，脑机接口（BCI）为恢复运动和交流带来了希望。关键在于“窃听”运动皮层中的群体编码。通过植入一个微电极阵列，科学家可以实时记录数百个神经元的活动。然后，一个解码算法，通常是一个复杂的线性模型，扮演大脑自身下游区域的角色：它读取群体的活动模式，并将其转化为机器人手臂或计算机光标的控制信号。一个主要的挑战是弄清楚要听哪些神经元。在数百个记录到的细胞中，哪些信息量最大？工程师们已经转向贝叶斯方法和机器学习，使用能诱导稀疏性的先验，自动识别并为最重要的神经元分配权重，有效地将嘈杂或无关神经元的贡献归零。这种自动选择神经元的过程与大脑自身的有效编码策略直接类似，并且对于构建鲁棒、高性能的义肢设备至关重要。

群体编码的影响也渗透到了人工智能的设计中。在构建更像大脑的学习系统的探索中，研究人员正在开发脉冲神经网络（SNN），它们像生物神经元一样使用离散的脉冲进行通信。这些系统面临着与大脑相同的挑战：如何用这些脉冲来表征信息？答案再一次是使用各种编码方案。一个值，比如在强化学习任务中采取某个动作的概率，可以编码在神经元的平均发放率中、其首次脉冲的精确时间中，或者最鲁棒地，编码在具有重叠调谐曲线的神经元群体的分布式活动模式中。工程师们现在正在使用监督学习算法来训练这些网络，寻找最优的“突触权重”来解码群体的脉冲计数并重构出期望的输出。这个过程反映了我们自己大脑中发生的学习，并利用了我们在整个旅程中所见的相同的分布式表征原理。

从指尖的敏感度到机器人手臂的引导，群体编码的原理证明了集体行动的力量。它向我们展示了，在大脑中，就像在许多其他复杂系统中一样，整体确实大于部分之和。这是大自然发现的一条简单而优美的规则，而我们才刚刚开始掌握它。