
当神经科学家一次又一次地测量同一个神经元对相同刺激的反应时,结果从来都不是完全相同的。这种神经活动在每次试验间的波动,就是神经变异性的本质。几十年来,一个核心问题始终萦绕不去:这种变异性仅仅是破坏信息、必须被滤除的随机“噪声”,还是大脑计算中不可或缺甚至具有功能性的特征?事实证明,这个问题的答案从根本上改变了我们对大脑如何处理信息、学习和决策的理解。
本文旨在填补这一知识空白,将神经变异性从一个简单的干扰因素重新定义为一种丰富、结构化且根本性的神经设计原则。它全面概述了什么是变异性、它来自哪里以及它有何用途。通过从生物物理来源到认知结果的探索之旅,读者将对神经系统核心中那种美丽而必要的不完美性产生新的认识。
在接下来的章节中,我们将首先深入探讨神经变异性的原理与机制,剖析其来源和统计特性。随后,在应用与跨学科联系部分,我们将探讨大脑如何不仅容忍这种变异性,而且主动利用它来进行感知、认知和学习,从而揭示其深远的功能性后果。
想象一下,你正试图在嘈杂的咖啡馆里听一首微弱的旋律。你听到杯子的碰撞声、远处谈话的嘈杂声、浓缩咖啡机的嘶嘶声,以及在这片喧嚣中你努力追踪的音乐。在许多方面,大脑面临着类似的挑战。一个神经元,试图“倾听”来自外部世界的信号,它不断地沉浸在邻近细胞活动的海洋中,并受到自身内部波动的影响。当我们作为科学家,放置仪器来监听这个神经元时,它对完全相同的刺激的反应在不同时刻之间从来都不是完全一致的。这种每次试验间的波动,就是神经变异性的本质。
这种变异性是否只是像咖啡馆里的嘈杂声一样毫无意义的“噪声”,大脑必须将其滤除?或者,它是大脑功能不可或缺的一部分,甚至可能就是信息本身的一部分?为了回答这个问题,我们必须先当一回侦探。我们必须仔细剖析这种变异性,追溯其来源,并理解其特性。这个解构的过程是理解大脑内部运作的核心。
我们首先怀疑的总是我们自己。当我们在神经记录中看到变异性时,我们如何确定我们测量的不仅仅是放大器和电极的噪声?试图测量单个神经元微小电流的电生理学家会直面这个问题。设备本身会因热噪声和电子噪声而发出嗡嗡声。然而,聪明的科学家知道如何解决这个问题。在将电极连接到珍贵的神经元之前,他们可能会将其连接到一个“模拟细胞”(dummy cell)——一个为模仿真实神经元细胞膜电学特性而构建的简单电子电路。通过记录这个模拟细胞,他们可以捕捉到设备噪声的纯净指纹。之后,利用频谱分析等数学工具,他们可以从真实的神经记录中“减去”这种仪器噪声,从而揭开洋葱的第一层,露出其下真正的生物变异性。
一旦我们确信我们观察的是神经元而不是放大器,一个新的、更深层次的划分就出现了。我们看到的变异性是神经元私有的、内部的事情,还是反映了网络中更广泛、共享的对话?这个区别至关重要。利用统计学中一个称为全方差定律的强大思想,我们可以正式地将总的生物变异性划分为不同的、不重叠的组成部分。
内在变异性是神经元私有的随机性。即使完全与其他细胞隔离,并给予完全稳定的输入,神经元的放电仍然是随机的。这是因为它的基本组成部分——镶嵌在细胞膜上的离子通道——并不像完美的、确定性的门那样开关。它们根据热力学原理以一定概率闪烁开启和关闭。成千上万个这类闪烁通道的集体效应产生了一种波动的“通道噪声”,使神经元的膜电位颤动,并导致其尖峰发放时间出现抖动。这是一种生物机器不可简化的、根本性的噪声。
共享变异性则源于神经元并非孤立存在。它们嵌入在一个由喋喋不休的细胞组成的巨大、循环连接的网络中。这个网络的“状态”——反映了诸如注意力、觉醒状态或近期思绪的余波等因素——本身就在不断波动。这些全局或区域性的波动就像涨落的潮汐,同时影响着大量神经元群体的活动。当我们观察到许多神经元的放电率在不同试验间,即使刺激完全相同,也一同起伏时,我们很可能正在目睹这种共享变异性。这就是产生噪声相关性的原因:一个神经元中的“噪声”与其邻近神经元中的“噪声”相关的趋势。神经科学家使用的一个巧妙技巧是试验重排(trial-shuffling):通过独立地为每个神经元随机打乱试验标签,他们可以在计算上打破共享网络状态在试验间的对齐,从而使噪声相关性消失。剩下的是对每个神经元私有的、内在变异性的更纯粹的估计。
人们很容易将所有这些变异性视为一种缺陷,是生物工程草率的标志。但仔细观察就会发现,大脑似乎会根据神经元的功能来调整变异性的程度。以触觉为例。你的皮肤上分布着不同类型的机械感受器,每种都专司其职。Pacinian小体(或RA2传入神经),对高频振动极其敏感,是精确性的典范。当受到稳定的 Hz振动时,它几乎在刺激的每一个周期都会发放一个尖峰。它在不同试验间的尖峰计数非常可靠,其尖峰之间的时间几乎完美地锁定在刺激周期上。它的变异性极低。
相比之下,用于感知持续压力和纹理的Merkel细胞-神经末梢复合体(或SA1传入神经)则表现得非常不同。在相同的 Hz振动下,其放电要不规则得多。它在不同试验间发放的尖峰数量差异巨大,并且这些尖峰的时间点是杂乱的。它的变异性很高。这并不是因为SA1比RA2“差”;而是因为它们是为了不同的目的而构建的。RA2的工作是高保真地报告:“现在有 Hz的振动正在发生。”而SA1更具随机性的反应可能更适合于在一段时间内编码刺激的更复杂特征。噪声水平不是一个常数;它是一个可调的参数。
在按来源剖析了变异性之后,我们还可以描述其时间结构。它是像调谐不准的收音机那样刺耳、不可预测的静电噪声,还是具有更平滑、更滚动的特性?
这就是“白”噪声和“有色”噪声之间的区别。白噪声在下一刻是完全不可预测的;其功率均匀分布在所有频率上。有色噪声则具有结构。大多数神经变异性是一种常被称为“红”噪声或“布朗”噪声的有色噪声,意味着它在较低频率处具有更多功率。这暗示了一种“记忆”或迟滞性;大脑在某一时刻的状态是其几毫秒后状态的一个很好的预测指标。要开始分析这种结构,我们必须假设噪声的统计性质在我们的测量过程中不发生变化——这一特性被称为广义平稳性。通常,原始神经数据包含由于电极移动或生理变化引起的非常缓慢的漂移,这违反了上述假设。科学家必须首先应用高通滤波器来移除这些非平稳趋势,然后才能进行有意义的频谱分析。
对于这种相关的、低通的噪声,一个优美而简单的模型是Ornstein-Uhlenbeck (OU) 过程。想象一个碗里的弹珠。它不断受到随机、微小的脉冲(白噪声)的撞击,但碗的弧形壁总会将其拉回中心。弹珠的位置不会无限地偏离;它在碗底附近波动。它的运动在时间上是相关的。这正是OU过程所描述的:一个带有均值回归“漂移”项的随机游走。由此产生的过程具有指数衰减的自相关函数和在低频处平坦、在高频处下降的功率谱。这个简单的线性模型为许多神经系统中的背景波动提供了非常好的描述,并且可以被看作是控制大脑在稳定平衡点附近演化的更复杂非线性动力学的局部线性近似。
经过我们所有的剖析和表征,我们常常会留下一些我们无法完全解释的残余“噪声”。我们可能知道它的平均值(均值)和波动幅度(方差),但仅此而已。在我们的模型中,表示这种剩余不确定性的最诚实的方法是什么?
在这里,我们可以借助信息论中的一个深刻思想:最大熵原理。该原理指出,最客观的概率分布选择是那个“最不作承诺”的分布,它包含的信息不超过我们明确约束的范围。对于一个已知均值和方差的连续变量,唯一能使熵最大化的分布就是我们熟悉的高斯分布,即钟形曲线。这为为什么高斯分布经常被用来模拟噪声提供了深刻而有力的理由。这不仅仅是因为中心极限定理(即多个独立随机变量之和趋近于高斯分布的观点)。这是一条智识上的诚实原则:当我们将噪声建模为高斯分布时,我们是在公开承认,除了它的前两阶矩之外,我们对它一无所知。
最后,让我们看看这些不同的原理如何在一个真实的大脑回路中结合起来。基底节是一组对动作选择至关重要的大脑深层结构——例如,决定是去拿一杯咖啡还是一杯水。在一个简化的模型中,代表每个动作证据的皮层输入相互竞争。对某个动作的更强输入应该会使系统倾向于选择它。
但这个过程充满了变异性。突触传递是概率性的。神经元有内在的通道噪声。而且至关重要的是,整个回路都浸润在像多巴胺这样的神经调质中,其水平会波动。这些多巴胺波动可以起到“增益”控制的作用,放大竞争输入之间的差异并增强信号,这应该会提高可靠性。然而,波动本身在整个回路中引入了一个共享噪声源。如果在一次试验中多巴胺水平异常高,它可能会增强所有竞争动作的“执行”(Go)通路,而不仅仅是正确的那个。因此,这些变异性来源——突触的、内在的和神经调质的——共同作用,使得决策过程具有概率性。“更强”的证据并不总是获胜。相反,系统中的变异性确保了有时,较弱的选项会偶然被选中。这表明神经变异性不仅仅是一个测量问题或生物物理学上的好奇心;它对认知和行为有着直接而深远的影响,将一个确定性的“赢者通吃”机器转变为一个概率性的决策者。
理解这些原理和机制是第一步。它将我们对“噪声”的看法从一个简单的麻烦转变为大脑的一种丰富、结构化和根本性的特征,为终极问题——所有这些变异性究竟有何用途?——铺平了道路。
在探究了神经变异性的原理和机制之后,我们可能会留下这样一种印象:它是一种生物学上的疏忽——一种源于大脑温暖、潮湿且混乱的硬件而产生的必要之恶。但这样想就只见树木不见森林了。大自然在亿万年的不懈优化中,不仅仅是容忍了这种“噪声”;它驾驭了它,塑造了它,并在许多情况下,将其变成了感知、认知和学习的基石。神经系统持续的抖动和摇摆不是机器的缺陷;它是一项基本的设计原则。
在本章中,我们将探索这一原则的实际应用。我们将看到变异性如何塑造我们所见所感,它如何支撑我们决策和学习的能力,以及当其微妙的平衡被打破时,如何导致疾病。我们将发现,神经变异性不仅是大脑中一个有待研究的特征,也是我们用来研究大脑的工具的关键组成部分。
我们对世界的体验始于感官,但传入的信息并非完美的高保真信号。世界本身是嘈杂的,而我们的大脑又为其增添了一层静电噪声。一个很好的例子就来自在昏暗房间里看东西这个简单的行为。
想象一下,你正试图在黑暗中发现一个微弱的物体。你探测到它的能力从根本上受到光的量子性质的限制。光子零星地到达你的视网膜,就像小阵雨中的雨滴。它们的到达遵循泊松统计,这意味着你每时每刻捕捉到的光子数量存在固有的随机波动。这种物理变异性,即“量子噪声”,为你所能感知的设定了一个下限。你能探测到的最微弱信号 必须足够强,才能从这种背景噪声中脱颖而出。在这些低光照水平下,你的视觉系统遵循DeVries–Rose定律,即最小可觉差随背景光强的平方根增长,。这是一个受光子散粒噪声限制的系统的特征。
但随着房间变亮,一件非凡的事情发生了。限制因素不再是光子的随机性,而是你自身神经回路的内在变异性。你的视网膜神经元有它们自己的背景嗡嗡声,它们自己的自发放电。这种“神经噪声”开始主导物理噪声。此时,你的感知转而遵循韦伯定律(Weber's law),即最小可觉差是背景光强的一个恒定比例,。这两个机制的交叉点精确地告诉我们,大脑的内部噪声在何处成为比外部世界噪声更大的障碍。因此,我们的感知是刺激的物理变异性与我们自身神经系统的生物变异性之间的一场二重奏。
这种内部变异性能创造出完整的感知体验。思考一下双眼竞争现象,即双眼分别看到不同的图像(例如,一所房子和一张脸),而你的有意识感知在这两者之间来回切换。是什么控制着这些切换的时间点?答案在于竞争性神经元群体的随机动力学。一个知觉保持主导地位的持续时间不是固定的,它本身就是一个随机变量,通常可以用伽马分布很好地描述。理解这一点的一个有力方法是,将这种切换想象成几个更小的、独立的随机事件的顶点——就像一系列“适应”多米诺骨牌,必须在主导的神经表征变得不稳定并让位于其竞争者之前倒下。因此,我们意识体验随时间变化的统计形状,即其本身的变异性,为我们提供了一个窗口,来窥探大脑中产生意识本身的那些隐藏的、充满噪声的过程。
超越简单的感知,让我们来考虑一个更高级的认知功能:做决策。当你在两个选项之间做出选择时,你的大脑并不会进行清晰、瞬时的逻辑推导。相反,它似乎参与了一个渐进的、充满噪声的证据累积过程,就像侦探收集线索一样。
这一过程被漂移-扩散模型(Drift-Diffusion Model, DDM)优雅地捕捉到了。想象一个粒子从代表两个选项的边界之间的中点开始运动。来自外部世界的感觉证据为粒子提供了微小的“推动力”。强大而清晰的证据给予它一个强大而持续的推动力——即一个高的“漂移率”()——使其朝向正确的边界。微弱或模糊的证据则导致一个弱得多的漂移,此时粒子的运动主要受随机颠簸的主导。这个随机成分,即“扩散”(),代表了证据流中每时每刻的神经变异性。
当粒子碰到其中一个边界时,决策就做出了。这个简单的模型出色地解释了为什么我们在做简单决策时(高漂移率)更快更准,而在做困难决策时(低漂移率,此时随机扩散可能将我们推向错误的边界)更慢且更易出错。它还解释了速度-准确性权衡:如果你需要更准确,你只需将边界设置得更远(),在做出承诺前要求更多的证据。如果你赶时间,你就把边界设得更近。这个抽象模型中的每个参数都有一个合理的神经关联物,将证据累积的过程映射到顶叶皮层等区域神经元活动的逐渐增强上。神经变异性,即扩散项 ,在这个模型中并非一个缺陷;它正是决策过程本身的引擎,解释了思维的概率性和耗时性。
同样的噪声破坏神经表征的原理也适用于记忆和导航。大脑的位置感被认为是由一个神经元网络中的活动“凸起”来维持的,比如内嗅皮层中的网格细胞。这个凸起代表了你在内部地图上的当前位置。当你移动时,这个凸起应该随你移动,这个过程被称为路径整合。然而,网络内的内在噪声——神经元的随机放电——会导致这个凸起随时间发生抖动和随机漂移。这类似于你汽车GPS中的一个微小、持续的错误。在短时间内,这个错误可以忽略不计。但如果在没有外部地标来重置系统的长途旅行中,这种随机漂移会累积起来,导致对你真实位置的不确定性越来越大。我们最基本的神经表征的稳定性,正处于一场对抗噪声耗散力的持续战斗中。
如果变异性会破坏记忆并导致判断错误,你可能会好奇大脑究竟如何学习。正是在这里,我们看到了神经噪声最深刻和最具建设性的作用。一个有机体要学习,首先必须探索。一个纯粹确定性的机器,在给定相同输入的情况下,总是会产生相同的输出。它被困在一个循环中,无法发现不同的行动可能会带来更好的结果。变异性是解锁这个循环的钥匙。
在强化学习理论中,这一点被明确提出。智能体通过尝试行动并观察由此产生的奖励来学习。随机策略——即在行动选择中内置了随机性的策略——是天生的探索者。运动输出中的微小、随机的变化,一种“运动咿呀语”,让智能体能够偶然发现更有回报的行为。真正了不起的是大脑可能如何实现这一点。REINFORCE算法是现代人工智能的基石,它表明学习可以由一个简单的“三因子”突触可塑性规则驱动:对突触的更新取决于(1)突触前活动,(2)突触后活动,以及(3)一个全局广播的“奖励”信号(如多巴胺)。这个规则自然地利用了策略的随机性来推动其走向更好的性能。变异性不仅仅是有帮助的;它是学习规则运作所必需的关键成分。
这种观点——即大脑利用自身的随机性进行计算——是“贝叶斯大脑”假说的核心。该理论假设大脑构建了世界的概率模型,而学习和感知是统计推断的过程。要执行这类推断,通常需要从概率分布中抽取样本。一个生物网络如何能做到这一点?一个引人注目的想法是通过一种在机器学习中被称为“重参数化技巧”的机制来实现。一个神经元的输出可以被看作是一个确定性部分(它接收的平均输入,)和一个随机部分(一个噪声分量,)的总和。这种结构,,完美地将可学习的参数与随机性来源分离开来。它允许学习信号(梯度)“流经”随机单元,使网络不仅能学习平均响应,还能学习不确定性或变异性的适当水平。在这种观点下,神经噪声不是一个需要通过平均来消除的麻烦,而是一个至关重要的计算资源,一个为复杂学习算法提供动力的内置随机数生成器。
变异性的建设性作用依赖于一种微妙的平衡。当这种平衡被破坏时,后果可能很严重,导致神经和精神障碍。
在某些情况下,一次单一的、随机的波动就可能是灾难性的。考虑一个易患癫痫的大脑。它的动力学可以是“双稳态”的,既有一个健康的、低活动状态,也有一个病理性的、高活动度的癫痫发作状态。即使健康状态是稳定的,它也更像是一个停在浅谷中的球,而不是深坑底部的球。内在的神经噪声提供了一连串持续的微小推动。通常情况下,它们是无害的。但偶然间,一个足够大的随机波动汇合可能会将系统“踢”过山丘,进入癫痫状态。这被称为“噪声诱导的转换”。它有助于解释为什么癫痫发作有时看起来是自发产生的,没有任何明显的外部触发因素。因此,理解大脑噪声的统计特性对于评估此类转换的风险至关重要。
在其他疾病中,问题不在于单一的异常波动,而在于大脑变异性本身的特性发生了变化。在帕金森病中,运动系统受到β频段( Hz)病理性振荡的困扰。这些节律与运动的迟缓和僵硬有关。人们可能认为这种病理状态是脆弱的,但与直觉相反,某种变异性实际上可以使其更强。大脑不是一个同质网络;其神经元和突触的特性各不相同。这种“淬灭无序”或异质性,通常是计算丰富性和弹性的来源,却可能串通起来扩大病理回路的共振范围。这使得β振荡更加稳健,对扰动的敏感性降低,从而有效地将系统锁定在其病理状态。
但如果变异性可以是病理的来源,那么控制它也可以是治疗的来源。许多人都体验过集中注意力如何能减轻疼痛感。经典的疼痛“门控理论”可以通过信号处理的视角来理解其工作原理。该理论假设在脊髓中有一个“门”,在那里疼痛信号可以在到达大脑之前被抑制性中间神经元阻断。我们可以从信噪比的角度来思考这个门的有效性。一个嘈杂、不可靠的抑制信号可能会闪烁,让疼痛信号泄露出去。由注意力等认知过程激活的来自大脑的下行通路,可以强有力地调节这些脊髓回路。它们可以起到减少抑制信号方差的作用,也许是通过分流随机输入来实现的。这提高了信噪比,使抑制性“门”更加稳定和鲁棒,从而有效地对上行的疼痛信号关闭。这是一个深刻的例子,说明大脑为了功能和治疗效果而主动管理自身的变异性。
我们的旅程终结于起点:观察行为。变异性的概念不仅对于理解大脑如何工作至关重要,对于构建观察大脑的工具也同样重要。当我们用电极或显微镜记录神经活动时,信号总是充满噪声。从这团乱麻中理出有意义的动力学是一个巨大的挑战。
状态空间模型,特别是卡尔曼滤波器(Kalman filter),为这项任务提供了一个强大的框架。这种方法明确承认,我们记录中的变异性来自两个不同的来源。首先是“过程噪声”(),它代表了我们试图追踪的底层神经动力学中真实的、内在的随机性。其次是“测量噪声”(),这是由我们不完美的传感器和记录过程引入的变异性。通过建立一个包含这两种噪声项的模型,卡尔曼滤波器可以最优地权衡来自我们测量的新证据与其内部模型的预测。它提供了对“隐藏”神经状态的最佳估计,有效地“看穿”了噪声。在这里,对变异性的明确数学描述正是使我们能够获得清晰度的关键。
从光的量子抖动到意识的统计特性,从决策的随机游走到学习的创造引擎,从癫痫的触发器到镇痛的目标,神经变异性是一条贯穿神经科学各个层面的线索。它既是挑战,也是资源,既是罪魁祸首,也是治疗良方。要理解大脑,就要拥抱它那美丽、实用且必不可少的不完美性。