
数十亿神经元看似混沌的活动,是如何产生人类思想、感知和行动的精确性的?这个问题是神经科学的核心。答案不在于任何单个细胞的独白,而在于集体的交响乐:神经群体编码。本文将剖析这一深刻概念,弥合单个神经元脉冲与连贯认知之间的鸿沟。它探讨了大脑如何利用“群体的智慧”以惊人的保真度和鲁棒性来表征世界。在接下来的章节中,您将首先深入探讨核心的“原理与机制”,探索信息是如何在神经活动的速率、时序和分布式模式中编码的。我们将审视为何这种集体策略更为优越,以及大脑如何管理其自身的内部噪声。随后,“应用与跨学科联系”部分将展示这些原理的实际应用,从解码玫瑰的香味到引导机器人肢体,再到揭示整个动物王国的普适学习规律。首先,让我们学习如何解读大脑交响乐的乐谱——神经编码的基本语言。
说大脑在进行计算是一个宏大的论断,但这究竟意味着什么?这个由数十亿神经元组成的湿润、杂乱且看似混沌的交响乐团,是如何以如此惊人的精确度来表征世界、做出决策并指挥我们的身体的?秘密不在于任何单个神经元的独奏,而在于神经群体的集体交响。要理解这首交响乐,我们必须首先学会读懂乐谱——神经编码的语言。
想象一下你正在聆听一个神经元。它通过一种“咔哒”声的语言进行交流,即动作电位——短暂的、全或无的电脉冲。这种简单的、断奏式的语言如何能编码我们丰富的体验?神经科学家已经确定了几种潜在的策略。
最直接的是速率编码。在这种方案中,信息被编码在脉冲的频率中。一个对光线亮度做出反应的神经元,在昏暗条件下可能缓慢放电,而在明亮条件下则快速放电。每个单独脉冲的精确时间不如给定时间窗口内的平均速率重要。这是神经科学中最古老、最稳健的观点之一,我们可以在视网膜等地方清楚地看到这一点,其中神经节细胞的放电率忠实地追踪着我们周围视觉世界的对比度。这是故事中简单、有效但或许并非全部的一部分。
但如果时间本身就是信息呢?这就引出了时间编码。在这里,信息不仅在于脉冲有多少,还在于它们精确的发生时间。一个绝佳的例子来自我们的嗅觉。在嗅球中,神经元以复杂的、与我们嗅吸节律锁定的时间模式放电。不同的气味会引发在嗅吸周期的特定相位上定时的不同脉冲序列。这不仅仅是演奏了哪些音符,而是整个节奏和旋律定义了玫瑰与咖啡的香味。
虽然速率编码和时间编码都至关重要,但它们通常描述的是单个细胞的活动。当考虑到大量神经元群体的组合活动时,大脑的真正力量才得以显现。这就是神经群体编码的领域,信息在大量细胞集合的分布式活动模式中得到表征。正是在这里,我们发现了一些最优雅、最深刻的神经计算原理。
让我们进入初级运动皮层(M1),这个协调自主运动的大脑区域。如果你在动物向不同方向进行伸展运动时记录一个M1神经元,你会发现一些有趣的事情。这个神经元并不仅仅是为一个方向“开启”,而为所有其他方向“关闭”。相反,它有一个偏好方向——一个使其放电最剧烈的运动方向。随着运动方向偏离这个偏好,神经元的放电率会平滑而逐渐地下降。一个常见且非常精确描述此行为的模型是余弦调谐,其中一个具有偏好方向向量 的神经元对方向为 的运动做出反应时的放电率 可以描述为 ,其中 是 和 之间的夹角。
因此,每个神经元都有广泛的调谐;它为广泛的相似方向“投票”,只是热情程度不同。那么,大脑是如何从这群模糊、重叠的投票中实现精确运动的呢?答案在于群体向量,一个由 Apostolos Georgopoulos 首创的、既简单又强大的概念。
想象一下,每个神经元都以一个向量的形式投出一票,向量指向其自身的偏好方向,向量的长度由其当前的放电率决定。为了确定预期的运动,大脑只需将所有这些加权投票相加即可。得到的总和——群体向量——以惊人的准确度指向预期的伸展方向。这是一个神经民主的美妙例子,清晰的共识从嘈杂的个体意见中浮现。大脑并非在寻找一个独裁的神经元;它在倾听群体的智慧。
这个原理也解决了一个更深层次的谜题。一个单一的动作,比如伸手去拿杯子,可以用不同的姿势或对抗不同的负荷来完成,这需要完全不同的肌肉力量组合。然而,实验表明,M1神经元的偏好方向在很大程度上保持稳定,编码的是运动的高层运动学计划(“去哪里”),而不是低层的动力学细节(“拉动哪些肌肉”)。群体编码在一个优雅的抽象层面上运作,将执行的繁琐细节留给了其他回路。
这就提出了一个自然的问题:为什么大脑要使用这种由广泛、重叠的调谐曲线组成的系统?为每一种可能的刺激设置一个专门的神经元——一个用于红色,一个用于升C调,一个用于你祖母的记忆——难道不是更简单吗?这种被称为“标记线”或“祖母细胞”编码的想法,因其简单而诱人。然而,自然界绝大多数情况下都偏爱分布式方法,这有其非常充分的理由。
让我们正面比较这两种策略。一个标记线系统,其中最活跃神经元的身份就是估计值,其本质上是离散的。它只能表征与其神经元中心相对应的特定值。对于任何落在这些中心之间的刺激,它都会遭受离散化误差。相比之下,一个具有重叠调谐曲线的分布式编码,将刺激表征为一个连续的模式。通过观察许多神经元的相对活动水平,解码器可以估计刺激值,其精度远超任何单个神经元的“分辨率”,并能平滑地在整个范围内跟踪刺激。
更重要的是,分布式编码提供了巨大的鲁棒性。我们的大脑是由脆弱的生物组件构成的。神经元可能会死亡,也确实会死亡。在标记线编码中,单个神经元的死亡是灾难性的——它会在大脑的世界模型中造成一个永久性的盲点。如果“祖母”神经元死亡,你就再也无法认出你的祖母了。然而,在分布式群体编码中,信息分布在数千个细胞中。一个神经元的损失就像选举日一个选民待在家里;它几乎不影响最终结果。系统表现出的是优雅降级,而非灾难性故障。
这个原理如此强大,以至于工程师们现在正用它来设计下一代容错计算机芯片。通过将计算分布在许多简单的处理单元上,可以使系统对单个组件的故障具有弹性。一种巧妙的解码方案,例如“均值的中位数”估计器,即使在一部分单元完全失效并提供任意、无意义的输出时,也能产生高度准确的结果。通过将单元分组并取其组平均数的中位数,异常值的影响被有效消除。看来,大脑在我们之前很久就发现了稳健工程的原理。
大脑的设计受到强大约束条件的塑造,其中最基本的一个是能量。发放一个动作电位是一个代谢成本高昂的过程。这一现实导致了编码策略之间一个有趣的权衡。是让许多神经元微弱地放电更好,还是让少数神经元强烈地放电更好?
这个问题将我们引向密集编码和稀疏编码之间的区别。密集编码可能涉及对于任何给定刺激,大部分神经群体都处于活跃状态。这可以支持高信息传输率,但代价是巨大的能量消耗。相反,稀疏编码是指只有一小部分、高度选择性的神经元对刺激做出反应。虽然每秒的总脉冲数可能要低得多,但每个脉冲都可能信息量巨大,因为它标志着一个非常具体的特征。当我们以“比特/焦耳”来衡量代谢效率时,稀疏编码通常被证明要经济得多。它们代表了一种节能策略,确保每个脉冲都物有所值。
随着我们深入挖掘,我们发现即便是关于“平均掉噪声”的最简单直觉也需要修正。神经噪声的结构与其大小同样重要。在这里,我们必须区分两种根本不同类型的相关性。
信号相关性描述了不同刺激下神经元平均放电率之间的关系。如果两个神经元有相似的调谐曲线(例如,它们都对红色物体强烈放电),它们就具有正的信号相关性。这是信号本身的一种冗余形式。
噪声相关性,另一方面,描述了相同刺激下神经元逐次试验波动之间的关系。如果在某些试验中,两个神经元倾向于一起比平均水平多放电一点,而在另一些试验中一起少放电一点,它们就具有正的噪声相关性。这是一种共享的变异性,会限制平均化带来的好处。
噪声相关性的影响是一个优美的几何问题。想象一下所有可能的群体响应空间。信号——“刺激A”和“刺激B”响应之间的差异——是这个空间中指向特定方向的一个向量,我们称之为信号方向。噪声相关性在平均响应周围产生一个椭圆形的变异云。如果这个云沿着信号方向伸长,它将模糊两个刺激之间的区别,严重降低编码的质量。但如果噪声主要朝向与信号方向正交的方向,一个聪明的解码器可以有效地忽略它!例如,如果信号被编码在两个神经元活动之差()中,但噪声导致它们一起上下波动(),那么解码器自然就对这种噪声免疫。
这使我们得出一个最终的、惊人的综合:注意力的神经机制。我们如何在一个嘈杂的房间里专注于一个对话?在神经群体层面,注意力的作用似乎是通过主动重塑这种噪声结构来实现的。噪声相关性的一个主要来源被认为是共享的、增益的乘性波动,它会同时影响整个神经元群体。你可以把它想象成一个控制群体音量的“旋钮”,这个旋钮在时刻间被随机地晃动。注意力似乎是大脑稳定这个旋钮的机制。通过减少这些共享增益波动的方差,注意力有效地“去相关”了整个群体的噪声。它不一定改变神经元所调谐的内容,但它通过确保它们的随机波动更加独立来清理信号。这使得大脑能够更可靠地提取信息,从嘈杂的世界中拉出一个清晰的信号。这是一种被称为增益控制的机制,可以由大脑中的抑制性回路实现,以创建非常稳定和鲁棒的表征。
从单个神经元的简单投票到群体范围噪声的复杂几何,神经群体编码的原理揭示了一个无与伦比的优雅和高效的系统。这是一个通过共识实现精确,通过冗余实现鲁棒,并通过主动塑造其自身内部噪声来实现清晰的系统——一曲真正的计算交响乐。
在我们了解了神经元如何表征信息的基本原理之后,您可能会感到惊奇,但也会有一个紧迫的问题:这一切是为了什么?描述大脑的机制——脉冲、速率、群体——是一回事,而看到这些机制如何产生感知、思想和行动则完全是另一回事。要真正欣赏一个科学思想的美,我们必须看到它在实践中如何运作。我们必须看到它如何解决实际问题,如何连接看似不相关的现象,以及如何为我们自己的创造提供蓝图。
群体编码原理并不仅仅是神经生物学家的一个抽象好奇心。它是神经系统所说的一种通用语言,是进化一次又一次偶然发现的一种主要策略。通过将信息分布在一个神经元“委员会”中,而不是委托给单个“天才”,大脑实现了鲁棒性、效率和灵活性的非凡结合。在本节中,我们将探讨这个单一、优雅的思想如何为理解从玫瑰的香味到机器人的逻辑,乃至学习本身的本质提供钥匙。
让我们从我们最古老、最基本的感官之一:嗅觉开始。大脑如何区分咖啡的香气和汽油的臭味?答案是群体编码的杰作,是化学、解剖学和统计学的优美结合。这一切始于嗅上皮,那里有数百万个感觉神经元在等待。第一个天才之举是:这些神经元中的每一个都是专家,只表达一种类型的嗅觉受体。
但群体原则的真正光芒在此闪耀。所有同类型的专家神经元——即所有表达相同受体的神经元——都将它们的信号发送到嗅球中的同一个位置,一个称为嗅小球的结构。想象一家公司,会计部门的每位员工都将他们的报告发送到一个特定的收件箱。结果是一幅壮丽的“化学拓扑图”:气味的身份不是由单个神经元表征的,而是由数千个嗅小球上的空间激活模式表征的。咖啡的气味是在这个嗅小球钢琴上弹奏的一个和弦;汽油的气味是另一个。
为什么自然界要费这么大劲,用数千个神经元仅仅为了报告一个化学特征?答案是可靠性。单个神经元,像任何微观组件一样,是嘈杂和不可靠的。它的放电是一场概率游戏。但是通过平均来自数千个相同神经元的报告,大脑可以过滤掉这种噪声,并提取出一个异常清晰的信号。嗅小球“收件箱”的信噪比大大提高——具体来说,它与参与报告的神经元数量的平方根成正比。这与物理学家对实验进行多次测量或民意调查员调查许多人的原因相同:在嘈杂的人群中寻找隐藏的真相。
这只是第一步。这个清晰的、地图般的表征随后被传递到更高层的大脑区域,如梨状皮层。在这里,大脑面临一个新的问题。它不仅需要知道一种气味是什么;它还需要学习将那种气味与其他事物联系起来——它是食物吗?是危险吗?为了形成无数独特的记忆而又不让它们相互混淆,大脑采用了另一个群体技巧:它将编码转换为一个高维的、稀疏的表征。皮层中的一个庞大神经元群体接收输入,但一个巧妙的抑制网络确保对于任何给定的气味,只有一小部分神经元被激活。
这似乎很浪费,但它是一个深刻的计算策略。通过将信息稀疏地分布在更多的神经元上,大脑确保了两种不同气味的表征几乎没有重叠。这最大限度地减少了干扰,并极大地增加了记忆容量。这是每个复杂大脑都必须面对的一个优化问题的解决方案:如何以最高的保真度表征世界,同时使用最少的能量。事实证明,大脑是高效编码的专家。
而且故事并不仅限于哪些神经元被激活。大脑也使用时序。一种气味的群体编码可以是一个动态的模式,一个随时间展开的活动节律。气味的身份可能被编码在不同神经元相对于一个共享背景振荡的放电精确相位中,就像管弦乐队中的音乐家都参照指挥的节拍演奏一样。气味的强度反过来可能由管弦乐队的同步程度,或由振荡的纯粹“音量”(功率)来编码。这揭示了群体编码不仅仅是一个静态的快照,而是一曲丰富、演变的脉冲交响乐。
那么,大脑拥有了对世界如此丰富、鲁棒和高效的表征。它用它来做什么呢?它做出决策并采取行动。在这里,群体编码同样是计算的通用货币。
考虑在不确定性下做出选择的挑战,这是强化学习的基石。假设你必须在两个行动之间选择,而你的大脑计算出行动A有70%的成功机会。这个抽象的概率,,是如何被神经元物理地表征的呢?虽然单个神经元可以尝试用其放电率来编码这个值,但这种方式既脆弱又缓慢。一个远为鲁棒的解决方案是使用一个群体。概率可以被编码在许多神经元的分布式活动模式中,每个神经元都调谐到不同的概率范围。这种分布式表征速度快,能抵抗噪声,并且很容易被下游区域读出以指导行为。
这直接关联到现代神经科学中最著名的思想之一:奖励预测误差信号,这与多巴胺神经元密切相关。当结果好于预期时,这些神经元会发出一阵脉冲;当结果差于预期时,它们的放电受到抑制。这个信号被认为是驱动学习的“教学信号”。但新的研究表明,这不仅仅是一个单一、整体的“哇!”或“哎呀!”信号。相反,多巴胺神经元群体似乎编码了一个多维的误差向量。群体的不同子集可能在不同维度上发出误差信号——预期大小的误差,预期时间的误差,或预期感官身份的误差(“我以为是果汁,结果是水!”)。通过将误差表征为神经活动空间中的一个向量,大脑可以支持对世界进行更细致、更具体的学习。
这项研究的前沿将这一思想推得更远。也许群体不仅仅是在编码平均的、预期的结果,而是在编码未来可能奖励的整个分布。群体中的一些神经元可能编码分布的均值,而另一些可能对其方差(风险)或其偏度(罕见、极端结果的机会)敏感。这种“分布式编码”将允许动物进行复杂的、对风险敏感的决策,不仅权衡最可能发生的事情,还权衡所有可能性。这就像知道一个城市的平均气温与拥有一份完整的天气预报之间的区别,后者包括晴天、雨天或暴风雪的概率。
至此,似乎大脑的策略很简单:当有疑问时,只需增加更多的神经元。但自然界比这更微妙。群体编码的有效性关键取决于其活动的详细统计结构,特别是不同神经元“噪声”之间的关系。
想象一下一个事件的两个目击者。如果他们都独立地给出相同的报告,我们对这个故事的信心就会增加。但如果我们得知他们事先串通好了,他们的说法一致就远没有那么有意义了。神经元也是如此。神经元反应中的“噪声”是其围绕平均放电率的随机、逐次试验的波动。如果两个神经元的噪声是独立的,它们就提供了关于刺激的两个独立“报告”。但如果它们的噪声是相关的——如果它们倾向于一起上下波动,即使刺激是相同的——它们就不再是独立的目击者了。
这些*噪声相关性*可以对一个群体携带多少信息产生深远的影响。关键的见解是,可解码性取决于信号的几何形状相对于噪声的几何形状。当相关噪声的波动方向与信号本身相同时,其破坏性最大。例如,如果两个神经元都对刺激A比对刺激B放电更多,并且它们的噪声是正相关的,那么一个随机的、共享的活动爆发可能被误认为是刺激从B变为A。解码器无法分辨。因此,仅仅拥有大量有选择性的神经元是不够的。要使群体编码真正有效,其噪声波动的结构绝不能掩盖它试图表征的信号。
群体编码的原理是如此强大和普适,以至于我们现在借用它们来构建我们自己的智能系统也就不足为奇了。
在脑机接口(BCI)领域,目标是直接从大脑中读取思想和意图。早期的尝试可能集中在单个神经元上,但现在清楚的是,从一个群体中读取信息可以提供更丰富、更可靠的信号。要实时解码像脑电图信号特征这样复杂的东西,分布式群体编码是首选方法,它提供了单神经元编码难以企及的速度和保真度的结合。
同样,在神经形态机器人学中,工程师们面临着与生物学亿万年来一直在解决的相同的权衡。在设计一个基于脉冲神经元的机器人控制器时,是应该使用缓慢但准确的速率编码,这可能会使机器人的反应迟钝?还是使用快速的时间编码,这可能会被最轻微的时序抖动所干扰?群体编码提供了一个完美的折衷方案。通过对许多神经元的信号进行平均,可以抑制噪声,而编码的分布式特性仍然允许快速读出。它还提供了优雅的降级:如果少数神经元“死亡”或发生故障,整个群体仍然可以运作,这一特性被称为鲁棒性。这正是我们希望在我们自己设计的系统中拥有的那种弹性。
也许群体编码力量的最惊人证据来自于对广阔进化历史的审视。思考一下昆虫(如蜜蜂)的大脑和哺乳动物(如老鼠)的大脑。它们最后的共同祖先生活在6亿多年前。它们的大脑由不同的组件构成,并以截然不同的方式组织。然而,当我们观察它们用于联想学习的回路时——昆虫的“蕈形体”和哺乳动物的“外套膜”——我们看到了相同的基础设计。
这两个系统都接收感官输入,并使用大规模扩展将其重新编码为更高维度的稀疏表征。两者都使用这种稀疏群体编码来最小化记忆之间的干扰,并且两者都使用像多巴胺这样的神经调质“教学信号”来塑造学习。这是趋同进化的一个惊人例子。两个完全独立的谱系,面对着同样的基本问题——如何灵活地学习一个复杂的世界——独立地得出了相同的计算解决方案:稀疏群体编码。
这告诉我们,群体编码并不仅仅是生物学的偶然。它是一种深刻而基本的信息处理原则。正是通过这种方式,杂乱、嘈杂和缓慢的生物组件可以被组织起来,产生快速、可靠且极其智能的计算。通过学习阅读这种通用语言,我们不仅开始理解我们自己心智的内部运作,而且还在为构建未来的智能系统发现一套强大的规则。神经元委员会还有很多东西要教给我们。