
大脑通常被想象成一台精确、确定性的计算机,但现实要混乱得多。任何单个神经元的活动都非常不可预测,这种现象被称为神经元变异性。几十年来,这种“噪声”被认为是一个根本性的缺陷,是大脑必须通过平均来消除以实现可靠计算的一种不精确性。然而,这一观点忽略了一个更深层次的真相:如果这种变异性不是一个缺陷,而是大脑设计的核心特性呢?本文深入探讨了神经元变异性的复杂世界,旨在解决其在神经系统中的目的这一核心问题。
为了解开这个谜题,我们将开启一段分为两部分的旅程。第一章,原理与机制,将从根本上解构变异性,探索其物理和生物学起源,从单个离子通道的随机闪烁到整个神经元群体的相关波动。我们将考察神经科学家用来量化这种不稳定性的数学工具。随后,应用与跨学科联系一章将探讨这种变异性所带来的深刻且常常是矛盾的后果,研究其作为信息破坏者和学习、决策乃至神经系统疾病引擎的双重角色。到最后,大脑中看似随机的噪声将被揭示为一个结构化、多层面的现象,对其功能至关重要。
如果你向一个神经元问同一个问题两次,你几乎永远不会得到相同的答案。给它看同一张图片,播放同一个声音,它的电响应——一串断奏般的脉冲——每次试验都会有所不同。很长一段时间里,这种不一致性被视为一个缺陷,一种大脑必须通过平均许多神经元的响应来克服的“噪声”。但当我们看得更仔细时,一幅远为优美和复杂的图景浮现出来。这种变异性不是单一的迷雾;它是由神经系统各个尺度的过程编织而成的一幅丰富的织锦。而且,它远非仅仅是一种滋扰,它可能是大脑计算策略的一个基本特性。要理解大脑,我们必须首先理解它的“噪声”。
所有这些变异性从何而来?它不是单一的事物,而是各种各样的波动,每一种都有其自身的特性和数学描述。想象一下,一层层地剥开单个神经元。
在最基本的层面上,我们遇到了物理定律。神经元是由物质构成的,处于温暖、湿润的温度下。神经元膜对离子流动的电阻本身就会引起热噪声,这与在无线电接收器中产生静电干扰的约翰逊-奈奎斯特噪声相同。这是电荷载流子持续不断的随机抖动,是一种功率谱平坦的宽带电流嘶嘶声。当这种“白噪声”电流被注入到充当电容器的细胞膜中时,产生的膜电压不会瞬时跳跃,而是遵循一种更平滑、时间上相关的随机游走,称为奥恩斯坦-乌伦贝克过程。
放大来看,我们看到了神经元自身的分子机器。细胞膜上布满了成千上万个称为离子通道的微小蛋白质门。这些不是平滑的阀门;它们是随机的机器,根据量子力学和热骚动的定律随机打开和关闭。每个通道的状态可以建模为一个简单的两态马尔可夫过程。决定神经元电学特性的开放通道总数,是所有这些微小、独立闪烁的总和。这是一个经典的生灭过程,也是我们所说的通道噪声的主要来源。当通道数量非常大时,中心极限定理就来拯救我们了,开放通道数量的波动可以很好地用一个更平滑的扩散过程来近似。
神经元在称为突触的连接点进行通信。这种通信本质上也是概率性的。当一个信号到达突触前末梢时,它会触发神经递质包,或称“量子”的释放。一个量子是否被释放是一场机遇游戏。突触后神经元中产生的电流是在随机时间到达的一系列离散、刻板的微小信号。这正是散粒噪声的定义。在放电率较低的情况下,事件稀少且独立,到达时间可以用泊松过程很好地描述,由此产生的输入被称为泊松散粒噪声。
现在,让我们把视野拉远。一个典型的皮层神经元不是在听一个朋友说话;它身处一个体育场,听着成千上万观众的喧嚣。这就是突触轰击的情景。如果许多微弱、独立的突触以高频率放电,单个散粒事件的嘈杂声就会模糊在一起。再次感谢中心极限定理,这场输入的弹幕可以近似为一个连续的高斯过程——一个稳定的平均电流加上一个波动的噪声项。这再次驱动神经元的膜电位进行随机游走,该过程可以很好地用奥恩斯坦-乌伦贝克过程来建模。这揭示了一个优美的统一性:看似不同的噪声源,经过细胞膜的过滤后,常常产生相同数学形式的电压波动。
面对这五花八门的噪声源,我们如何才能以一种有用的方式来表征神经元的变异性呢?神经科学家已经开发出一个强大的工具包,其中两个量度脱颖而出,成为该领域的主力:变异系数和法诺因子。
变异系数 (CV) 是衡量局部时间规律性的指标。它要问的是:相对于脉冲之间的平均时间,那个时间的变化有多大?它是峰间期 (ISI) 的标准差除以其均值。一个完全规则、像节拍器一样的神经元的 。一个作为泊松过程放电的神经元,其脉冲是无记忆和随机的,其 CV 为 1。CV 是探测脉冲序列精细时间结构的理想选择,例如神经元不应期所施加的规律性或簇发放的不规律性。
相比之下,法诺因子 (FF) 衡量的是多次试验中脉冲计数的变异性。你定义一个时间窗口,比如说一秒长,然后一遍又一遍地呈现相同的刺激。你计算每次试验中该窗口内的脉冲数,然后问:这些计数的方差与其均值相比如何?法诺因子就是 。对于泊松过程,方差等于均值,所以 。一个比泊松过程更可靠的神经元将有 (亚泊松分布),而一个变异性更大的神经元将有 (超泊松分布)。
这两个量度捕捉了变异性的不同方面。一个神经元可能具有非常规则的局部时间 (),但在多次试验中其总脉冲计数可能非常不可靠 (),例如,如果其整体兴奋性在不同试验之间缓慢波动。这突显了两种随机性之间的关键区别:脉冲生成过程本身的内在随机性,以及支配该过程的参数的异质性。大于 1 的法诺因子是一个强有力的线索,表明某个基础参数,比如神经元的放电率,不是固定的,而本身在试验间是一个随机变量。
一个绝佳的例证来自我们的触觉。一个快速适应性机械感受器(帕西尼小体,或RA2纤维)对一个 Hz 的振动作出反应,发出一串极其规则的脉冲序列,几乎每个周期放电一次。其在多次试验中的脉冲计数几乎相同,得出的法诺因子接近于零 ()。其峰间期也高度规则,CV 较低 ()。相比之下,一个慢速适应性感受器(默克尔复合体,或SA1纤维)对相同刺激的反应则是一串不规则得多的脉冲。其脉冲计数在试验间波动剧烈 (),且其脉冲时间变异性更大 ()。RA2纤维的规律性是其专门化机械结构的直接结果,该结构充当一个滤波器,使其响应与刺激锁相。SA1纤维的变异性则反映了其更直接、也更随机的转导过程。
变异性并非总是无形的。神经元的生物物理机制对其自身的噪声施加了独特的结构。一个经典的泊松过程是“无记忆的”——下一个脉冲的时间完全独立于前一个脉冲发生的时间。真实的神经元完全不是这样。
首先,每个神经元在发放一个脉冲后都有一个不应期,这是一段短暂的“死区时间”,在此期间很难或不可能再次放电。这个简单的事实带来了一个深远的结果:它使得神经元比泊松过程更规则。它消除了非常短的ISI,将 CV 推到 1 以下。一个其 ISI 是独立同分布的过程,就像这个一样,被称为更新过程。
其次,许多神经元表现出脉冲频率适应。在放电后,由于慢作用离子通道或其他代谢过程,它们会暂时变得不那么兴奋。这意味着一个短的 ISI(高瞬时率)往往会跟随着一个更长的 ISI,因为神经元在恢复。这在脉冲序列中引入了记忆:间隔不再是独立的。这在连续的 ISI 之间产生了负序列相关,并使过程成为非更新的。这种历史依赖性动力学通常用广义线性模型 (GLM) 等工具来建模,GLM 可以捕捉到任何时刻的脉冲概率如何依赖于整个之前的脉冲历史。
到目前为止,我们都集中在单个神经元上。但神经元不是孤立行动的;它们是巨大群体的一部分。当我们同时从许多神经元记录时,我们发现了另一层结构:它们的噪声是相关的。即使在我们考虑了每个神经元对刺激的平均响应方式之后,它们在试验间的波动也不是独立的。如果在某次试验中,神经元A的放电比其平均水平多一点,神经元B也可能倾向于多放电。这被称为共享变异性或噪声相关。
我们可以用噪声协方差矩阵 来形式化这一点。对于每次试验,我们减去神经元在该条件下的平均响应,留下一个残差向量 。噪声协方差矩阵就是这些残差在所有条件下的协方差的平均值,。非对角线项 精确地告诉我们神经元 和神经元 的“噪声”是如何协同波动的。
这种共享变异性从何而来?一个强大而优雅的观点是,它反映了未观测到的、共享输入的影响。想象一下,有少数几个“潜变量”在试验间波动——或许代表动物的注意力或觉醒状态——它们为一大群被记录的神经元提供共同输入。如果两个神经元都接收到来自同一个波动的潜变量源的输入,它们自身的波动就会变得相关。这是像因子分析这样的潜变量模型背后的核心思想。一个大群体看似复杂、高维的协方差矩阵,通常可以由一个更简单、低维的潜结构来解释。这个框架允许我们将观察到的总变异性分解为三个不同的部分:(1) 共享的、网络驱动的变异性,(2) 每个神经元独有的私有、内在变异性,以及 (3) 来自我们记录设备的测量噪声。
这就把我们带到了最引人入胜的问题。几十年来,主流观点认为变异性是一个缺陷,是导致不精确的根源,是大脑努力通过平均来消除的东西。但如果它是一个特性呢?如果我们观察到的变异性不是掩盖信号的噪声,而是信号本身的重要组成部分呢?这就是贝叶斯大脑假说的核心。
该假说提出,大脑不仅表征了对世界状态的一个最佳猜测,而且表征了一个反映其不确定性的完整概率分布。在这种观点下,神经活动的“嘈杂”波动不是随机误差,而是一个从这个内部后验概率分布中进行采样的过程。一个随时间游走的神经状态可以探索不同的可能性,其状态空间中特定区域所花费的时间量对应于该假设的概率。因此,一个高度可变的响应将表示高度的不确定性,而一个非常精确的响应将表示高度的置信。
这个强大的思想引出了关于大脑如何编码信息的具体的、可检验的假设。
令人惊讶的是,我们可以设计实验来区分这些想法。通过精心设计刺激,保持后验均值不变,同时调节后验方差(不确定性),我们可以做出不同的预测。一个均值编码网络不应该改变其平均响应模式。但一个基于采样的网络应该表现出其方差直接跟踪后验方差的波动。
这重塑了我们的整个视角。源于物理世界基本随机性的神经元那不安分、不可预测的本性,可能已被进化利用来执行复杂的概率计算。“噪声”并非机器的缺陷;它可能正是理性思维的语言。
在上一章中,我们深入了解了神经元变异性的来源和结构。我们看到,大脑并非一块瑞士手表,每个齿轮都以完美、确定性的同步方式转动。相反,它是一个由不稳定、波动的活动构成的大漩涡。现在我们面临一个重大的问题:这种变异性是缺陷还是特性?它仅仅是大脑为了清晰思考而必须不断对抗的“噪声”,还是计算策略中不可或缺的一部分,一种有目的的工具?正如我们将看到的,答案是响亮的“两者皆是”,而大脑如何管理这种双重性的故事,将我们从思想的引擎带到疾病的幽灵,从机器学习的宏大原则带到能量守恒的严酷现实。
让我们首先考虑最直接的观点:变异性是一种滋扰。想象一下运动皮层的一组神经元正试图就一个特定的指令进行投票,比如说,‘手腕弯曲30度’。如果每个神经元的投票都是嘈杂的,最终的计票结果将是不精确的。这不仅仅是一个比喻。在初级运动皮层中,神经元群体编码着运动参数。当这些神经元的试验间变异性以一种特定的方式相关时——具体来说,当偏好相同运动方向的神经元倾向于一起上下波动时——它能够极其有效地掩盖信号。这种共享噪声,或称‘噪声相关’,就像无线电频道中的静电干扰,直接减少了神经元群体能够承载的关于预期运动的信息量。从这个角度看,变异性是神经编码保真度的一个根本限制。
但是,将变异性仅仅视为噪声,就是只见树木不见森林。考虑一下做决策的行为。当你面临一个选择时,你的大脑不会立即做出结论。会有一段深思熟虑、权衡证据的时期。神经科学家已经用优美的数学模型捕捉到了这个过程,比如漂移扩散模型。在这些模型中,一个决策变量——由顶叶皮层等区域的神经元放电率表示——随着证据的积累而随时间逐渐上升。但这种上升并非一条平滑的直线;它是一个锯齿状的随机游走。模型名称中的‘扩散’就是神经变异性。这种固有的随机性解释了为什么即使面对相同的证据,你的反应时间也会变化,你甚至可能做出不同的选择。噪声不是决策的障碍;它就是深思熟虑的机制。
这个想法深刻地延伸到学习和行动选择的领域。动物如何学会探索世界以寻找奖励?它必须探索。它不能简单地重复它所知道的唯一行动;它必须尝试新事物。这是经典的‘探索-利用’权衡。这种探索的驱动力从何而来?一个引人注目的假说将其与神经变异性直接联系起来。在强化学习(一种来自人工智能的强大技术)中,可以通过在目标函数中增加一个奖励策略‘熵’(一种随机性的度量)的项来鼓励算法进行探索。人们认为,大脑可能实施了类似的策略,其中像基底神经节(大脑的动作选择中枢)这样的神经回路中的变异性,为尝试新动作提供了必要的随机性。突触传递的波动、脉冲发放的内在不规律性,甚至像多巴胺这样的神经调质的涨落,都促成了一个动作的概率景观,使大脑能够摆脱习惯的束缚,发现更好的策略。在这种观点下,变异性不仅仅是噪声;它是创造力和适应性的引擎。
变异性的故事始于神经元本身最基本的层面。离子通道特性的微小差异,或轴突起始段(动作电位的‘触发区’)的精确位置,都可能使神经元的行为产生质的不同。这种‘淬火’变异性,或称异质性,意味着神经元群体不是一支由相同士兵组成的单一军队,而是一个由专家组成的多样化团队。一些神经元可能充当简单的积分器,随时间累积其输入,而另一些则可能成为谐振器,优先响应特定频率的输入。这种源于生物物理变异性的多样性,对神经元网络如何同步和处理信息可能产生巨大影响。
当这些精细的动力学出现问题时,其后果可以在临床上看到。例如,在帕金森病中,基底神经节陷入了病理性的β波段 (13–30 Hz) 振荡。这些振荡是该疾病的标志,与启动运动的困难有关。对该回路的模型揭示,这些振荡是一种源于兴奋、抑制和通信延迟相互作用的网络现象。有趣的是变异性所扮演的角色。人们可能认为,一个更统一、同质的网络会更容易出现这种病理性同步。然而,模型显示,一定程度的神经特性‘淬火’异质性实际上可以使β振荡更加稳健和持久。与此同时,‘动态’变异性——即时时刻刻的噪声——即使在网络技术上稳定时也能维持这些振荡。这表明,变异性不是一个标有‘好’或‘坏’的简单旋钮;它是一个塑造健康功能和疾病状态的关键参数。
大脑还必须执行一些似乎需要几乎不可能达到的精确度的计算。以内嗅皮层的网格细胞为例,它们构成了一种用于空间导航的内部GPS。关于它们工作原理的主流理论,即连续吸引子模型,依赖于一个具有完美晶体对称性的网络。在这样一个理论网络中,一个活动的‘山丘’可以平滑地滑动以跟踪动物的位置。但真实的大脑是混乱的。我们刚才讨论的淬火变异性——突触连接和神经元特性的异质性——打破了这种完美的对称性。这种无序为活动山丘创造了一种‘块状’的能量景观,导致它在某些位置卡住,或称‘钉扎’。这降低了网络本应执行的路径整合功能。在这里,我们看到一个例子,大脑必须采用机制来积极对抗其自身内在混乱性的有害影响。
变异性的效用与危害之间的这种张力指向了一个更深层次的设计原则:约束下的优化。大脑不是一台拥有无限电源的超级计算机;它是一个在巨大代谢压力下进化的生物器官。它必须是节能的。在这里,我们发现了变异性最美的应用之一。想象一个下游解码器只关心慢信号。上游神经元群体中的任何高频噪声都将被过滤掉和忽略。大脑似乎利用了这一点。通过巧妙的电路设计,它可以‘塑造’其噪声,将其内在变异性的功率从对给定任务重要的频段推向不重要的频段。通过这样做,它可以用更少的脉冲维持相同的编码精度,从而节省宝贵的能量。它甚至可以使用具有反相关噪声的平行通路,这样当它们的信号相加时,噪声就会相互抵消。这不仅仅是降噪;这是智能的噪声管理,这一原则使大脑既有效又异常高效。
最后,我们从大脑本身转向我们理解它的尝试。神经元变异性的故事也是我们努力测量它的故事。当神经科学家使用功能性磁共振成像 (fMRI) 等工具来研究大脑连接时,他们记录的信号是一个复杂的混合体。它包含了我们希望研究的神经活动的美丽、结构化的波动,但它也受到了测量误差、头部运动、心跳导致的血液搏动以及呼吸节律的污染。
现代神经科学的一个核心挑战是解开这些方差来源。像动态因果模型 (DCM) 这样的复杂统计方法明确地试图通过创建一个包含两种噪声的生成模型来做到这一点:代表大脑真实、内源性生理变异性的‘状态噪声’,以及代表测量过程引入的垃圾的‘观测噪声’。但是,研究人员在试图清理数据时做出的选择——如何过滤数据,是否回归掉整个大脑的平均信号,如何处理大的头部运动时刻——都可能对最终结果产生深远影响。这种‘处理流程变异性’意味着,两个不同的实验室,从相同的原始数据开始,可能会因为在分析流程中做出了不同但同样合理的选择而得出关于大脑连接的不同结论。这是一个令人谦卑的提醒,我们观察大脑嘈杂动力学的窗口本身就是模糊的。理解神经元变异性不仅是大脑面临的挑战,也是研究它的科学家面临的挑战。