发放时相位编码

玻尔百科

核心要点

与仅使用脉冲频率的速率编码相比，发放时相位编码利用神经元脉冲相对于背景脑振荡的精确时间来编码信息。
这种时间编码机制比传统的速率编码速度快得多，能量效率也高得多，能以更少的代谢昂贵脉冲实现快速信息处理。
相位编码的精度随大脑背景振荡频率的增加而提高，像伽马节律这样的更高频率为编码提供了更精细的时间分辨率。
这种编码方案是感觉知觉、记忆和注意力等认知功能的基础，并启发了神经修复术和神经形态计算等先进技术。

引言

大脑是如何以如此惊人的速度和效率处理信息的？几十年来，主流理论——速率编码（rate coding）——认为神经元通过其信号的绝对数量，即它们的发放速率，来进行交流。这个模型虽然强大，却忽略了一个关键维度：时间。它将神经脉冲的精确时间点视为纯粹的噪音，这就提出了一个问题：大脑是否忽略了一种更丰富、更细致的语言？本文通过探索一种更复杂的机制——发放时相位编码（phase-of-firing coding），挑战了这一假设。在这种编码中，脉冲发生的时间与脉冲的内容同等重要。

首先，在“原理与机制”一节中，我们将剖析这种时间编码，审视神经元如何利用大脑的自然节律作为时钟，以非凡的精度编码信息。我们将揭示这在速度和能量效率方面带来的深远优势，并探索支配和限制这一精妙系统的物理原理。接下来，“应用与跨学科联系”一节将揭示这种编码并非小众现象，而是一种通用语言，是感觉知觉、记忆、注意力的基础，甚至启发了下一代智能机器的设计。这段旅程将揭示，大脑的交响乐不仅由音符构成，更由完美的时机谱写。

原理与机制

要理解大脑，我们必须学习它的语言。很长一段时间里，我们以为我们已经用一个极其简单的想法破解了密码。我们想当然地认为，大脑使用的是一种音量语言。神经元的信息就是其发放速率——在给定时间内发放的脉冲或动作电位的数量。一个强烈的刺激，如亮光或巨响，会让神经元以高发放速率“大喊”。一个微弱的刺激则只引发低发放速率的“低语”。这就是速率编码。这好比用一个桶来测量降雨量；到头来，重要的只是收集到的总水量，而不是每一滴雨水落下的精确时刻。在这种观点下，单个脉冲的精确时间只是噪音，是雨滴随机的嗒嗒声。如果你在测量窗口内打乱所有脉冲的到达时间，只要总数保持不变，信息也不会改变。

这个想法很有说服力，也解释了神经系统的很多现象。但大自然很少如此简单。如果大脑不只用一个桶，还用一个高精度秒表呢？如果一个脉冲发生的精确时刻不是噪音，而是信息本身的关键部分呢？这就是时间编码的精髓，第二种更微妙的语言。在这种语言中，意义由脉冲的节律、模式和精确时间来传达。

大脑的时钟：思想的节律

如果时间就是信息，那么必须有一个时钟。一个脉冲发生在“时间 $t$ ”本身是毫无意义的。它必须是相对于某物的时间。事实证明，这个“某物”就是大脑自身的内部音乐：由成千上万神经元集体嗡鸣产生的节律性、波浪状的电活动。这种背景节律，我们可以测量为局部场电位 (LFP)，它就像整个神经元乐团的共享时钟或节拍器。

这就是发放时相位编码的基础。神经元的信息不仅在于它是否发放了脉冲，还在于它在持续振荡的周期中何时发放。它是在波峰、波谷，还是在上升沿发放的？这个“何时”就是它的相位。

想象一个简单的假设性实验，我们向听者呈现两种声音中的一种， $s_1$ 或 $s_2$ 。我们发现一个神经元，无论播放哪种声音，它在每个显著的脑节律周期内都恰好发放一个脉冲。如果我们只听“速率”语言，我们会一筹莫展。对于两种声音，该神经元以相同的平均速率发放脉冲；它以相同的音量在喊叫。这里的速率编码所携带的信息精确为零。

但如果我们拿出秒表，一个优美的模式便浮现出来。当播放声音 $s_1$ 时，脉冲总是在周期的前半部分发生（比如说，相位在 $0$ 和 $\pi$ 之间）。当播放声音 $s_2$ 时，脉冲总是在后半部分发生（相位在 $\pi$ 和 $2\pi$ 之间）。速率没有提供信息，但相位告诉了我们一切。观察单个脉冲相对于背景节律的时间就足以完美解码听到了哪种声音。信息不在于脉冲的数量，而在于它们的时间。这表明速率和相位可以是独立、互补的信息通道；即使其中一个沉默，另一个也可以传递信息。

时间的方言：潜伏期、间期和相位

发放时相位编码是时间语言中一种强大的方言，但大脑是多语种的。基本原则是，任何可复现的脉冲时间特征都可以被用来携带信息。让我们考虑另一种情况，一个神经元对一个刺激总是精确地发放两个脉冲，因此简单的脉冲计数同样什么也告诉不了我们。假设有三种可能的刺激：A、B和C。

神经元如何区分它们呢？它可以使用潜伏期编码。对于刺激 A 和 C，第一个脉冲可能在刺激出现后约 $10$ ms 出现。但对于刺激 B，它可能稳定地在稍晚的时候出现，约 $20$ ms。到第一个脉冲的延迟或潜伏期，就是信息。把它想象成赛跑的开始；发令枪响和赛跑者离开起跑线之间的时间，告诉了你一些关于赛跑者准备状态的信息。

或者，神经元可以使用脉冲间期 (ISI) 编码。对于刺激 A 和 B，第二个脉冲可能在第一个脉冲后以固定的 $10$ ms 间隔出现。但对于刺激 C，这个间隔可能是 $20$ ms。信息在于脉冲之间的特定节律，就像一个秘密敲门暗号，其中的停顿与敲击本身同等重要。

当然，它也可以使用我们讨论过的相位编码。对于刺激 B 的第一个脉冲可能在一个背景振荡的特定相位上发生，这个相位与刺激 A 和 C 的脉冲相位稳定地不同。这些编码并非相互排斥；一个单一的脉冲序列可以同时在其速率、潜伏期、内部模式以及与网络节律的相位关系中携带信息。

时间编码的优势：为何需要时钟？

这种时间语言似乎比简单的速率编码更复杂。大脑为何会进化出如此精密的机制？至少有两个深远的优势：速度和效率。

首先是速度。要获得神经元发放速率的可靠估计，你必须在一个时间窗口内计算脉冲。如果发放速率很低，这个窗口可能需要相当长，才能将速率的微小变化与随机波动区分开来。如果你有的是时间，这没问题，但如果你是一只想躲避苍蝇拍的苍蝇，那就另当别论了。时间编码可以快得多得多。一个精确定时的首个脉冲的潜伏期可以几乎瞬间地发出信号，表明刺激的存在和身份。当速率编码还在慢慢地装满它的桶时，时间编码已经读取了秒表并发送了信息。速率编码需要几十或几百毫秒才能积累的信息，可以通过单个脉冲在单个短暂振荡周期内的相位来传达。

其次是能量效率。脉冲是大脑中代谢最昂贵的事件。每一个脉冲都需要大量的钠离子涌入，然后必须通过钠钾泵努力地泵出，消耗大量的ATP——细胞的能量货币。用高发放速率的编码在工作记忆中维持信息，就像为了保持静止而让你的汽车引擎以 5000 RPM 的转速空转；这是极其浪费的。振荡相位编码提供了一个更优雅的解决方案。通过在少数稀疏发生的脉冲的时间中编码信息，大脑可以用低得多的平均发放速率维持相同的信息。这就像熊熊燃烧的篝火（速率编码）与灯塔发出一系列定时、信息丰富的闪光（相位编码）之间的区别。它以一小部分燃料实现了相同的目标。

精度的物理学：锐化时钟

要使相位编码起作用，它必须是精确的。这种精度是如何实现的，又受什么支配？答案在于一个优美的物理原理：你计时的质量取决于你时钟的速度。

想象一下，用一个每秒只嘀嗒一次的钟来为百米短跑计时。你的测量将会粗糙且不可靠。现在，用一个能测量百分之一秒的秒表。你的精度会飙升。大脑的振荡时钟也以同样的方式工作。脉冲的时间抖动 $\sigma_t$ 与相位抖动 $\sigma_{\phi}$ 以及振荡频率 $\omega$ 有关。如果振荡很快，相位上的微小不确定性会被映射到时间上更小的不确定性。这种关系可以近似表示为：

\sigma_t^2 \approx \frac{\sigma_{\phi}^2}{\omega^2}

这告诉我们一些深刻的道理：更高频率的振荡（如大脑的伽马节律，在 $30-80$ Hz）提供了更高分辨率的时钟，允许比更慢的节律（如 theta 节律，在 $4-8$ Hz）进行更精细的时间编码。精度还取决于神经元将其发放“锁定”到节律的强度，这个因素称为集中度 $\kappa$ 。更强的锁定（更大的 $\kappa$ ）和更快的时钟（更大的 $\omega$ ）共同作用，以锐化编码的时间精度。下游的解码器随后可以通过计算所有传入脉冲的平均相位来读取此代码，从而获得对刺激的稳健估计。

时间的极限：当时钟运行过快

这个机制很优雅，但并非没有极限。自然界的组件总有其约束。是什么阻止大脑使用无限快的振荡来实现完美的时间精度呢？

一个基本限制是神经元自身的重置时间。在发放一个脉冲后，神经元进入一个绝对不应期——一段短暂的死寂时间，在此期间不可能再发放另一个脉冲。如果这个不应期是，比如说， $1.2$ ms，那么该单个神经元的绝对最大发放速率就是 $1 / (0.0012 \text{ s}) \approx 833$ Hz。它根本无法跟上任何比这更快的节律。

那么，听觉系统是如何设法编码远高于 $1000$ Hz 的频率的呢？它使用了一种聪明的群体策略，称为齐射原则。想象一队鼓手试图演奏一个快得不可能的节奏。没有一个鼓手能敲出每一个节拍，但通过精确地轮流，整个团队作为一个整体可以完美地再现这个节奏。听觉神经元也是如此。每个神经元都与声波同相位发放脉冲，但只在一部分周期上发放。通过交错发放，神经元群体“填补”了空白，共同提供了一个对声波的忠实时间表征，其频率是任何单个神经元都无法跟随的。

第二个“较软”的限制来自神经元的模拟特性。神经元的膜及其突触不是完美的、瞬时的设备。它们具有内在的时间常数，使其表现得像低通滤波器；它们天生就有些“迟钝”。当一个神经元被一个非常高频率的信号驱动时，它的膜电位无法足够快地波动来跟随单个周期。快速的振荡被平滑和模糊掉了，冲淡了神经元需要锁定其上的时间特征。这种生物物理上的迟钝性常常为一个给定系统中的相位锁定设定了实际的频率上限，这个上限甚至可能低于由不应期设定的硬性天花板。

在这场节律与脉冲的复杂舞蹈中，我们看到了一种极其复杂的神经编码。这是一种为速度和效率而优化的语言，由大脑的内部振荡启用，并以由基本生物物理原理和约束支配的精度来执行。它证明了大自然为用湿润、缓慢且耗能的组件构建强大计算机这一复杂问题所找到的优雅解决方案。

应用与跨学科联系：脉冲时间的交响乐

在探索了发放时相位编码的基本机制——神经元如何将其脉冲时间与持续的脑电波节律同步——之后，我们现在转向一个更深刻的问题：为什么？这种复杂的神经时钟机制有何用途？如果我们将神经元的平均发放速率看作其声音的音量，那么其发放的相位就是乐团节奏中精确的时机。一个交响乐团的所有乐器都以最大音量演奏，但没有节奏感，那只是噪音。音乐、信息、美——这一切都源于时机。

在本章中，我们将踏上一段旅程，看看这种时间精度原则并非某种孤立的奇特现象，而是神经系统的一种基本语言。我们将看到它在我们通过感官感知世界的方式中发挥作用，在我们思想、记忆和注意力的结构中发挥作用，并最终作为未来计算的灵感。我们将发现，大脑以其无穷的创造力，使用同样的基本技巧——在脉冲的相位中编码信息——来解决一系列令人眼花缭乱的问题。

节奏性镜头下的世界：感觉系统中的相位编码

我们与世界最直接的联系是通过我们的感觉，而正是在这里，时间编码的力量首次变得惊人地明显。大脑不只是计算感觉输入；它倾听它们的节奏。

思考听觉行为。我们的听觉系统面临着解码连续声压波流的巨大挑战。它如何区分大提琴的音高和树叶的沙沙声？对于较低频率的声音（高达几千赫兹），这个范围涵盖了语音和音乐的关键部分，大脑采用了一种极其简单而精确的策略：相位锁定。听觉神经中的神经元与传入声波的波峰和波谷同步发放脉冲。它们相位锁定的速率直接表明了声音的频率或音高。对于非常高的频率，单个神经元无法跟上，大脑巧妙地使用其他策略，例如依赖耳蜗上哪个位置振动最剧烈（位置编码），或结合许多神经元的努力以“齐射”方式共同表征节奏。

当这种时间编码失效时，其关键重要性便被悲剧性地揭示出来。想象一位病人，其听觉神经仍能发出声音存在和强度的信号，但其神经元已丧失了微秒级精度的发放能力。他们没有外周性听力损失；他们能“听到”人们在说话。然而，他们发现在一个拥挤的房间里几乎不可能跟上一个人的谈话——经典的“鸡尾酒会问题”。为什么？因为大脑使用由相位锁定脉冲携带的声音的时间精细结构来分离不同的声源。正是两耳之间精确的时间差异告诉我们声音来自何方，也正是说话人声带的精确周期性特征 ( $F_0$ ) 帮助我们锁定他们的声音。没有这些时间信息，世界就消融成一片难以辨认的声学糊状物。声音的包络线还在，但赋予其清晰度并允许分离的精细结构却消失了。

这个原则并非听觉所独有。以触觉为例。当你的手指划过一个表面时，你是在感知振动。你皮肤中特化的机械感受器，例如快速适应的 Pacinian 和 Meissner 小体，通过发放与纹理振动频率相位锁定的动作电位来响应。电动工具产生的高频嗡嗡声由神经元以紧密、高频的时间锁定方式编码，而书页的较低频率颤动则由一个较慢的、相应的节律编码。当频率变得太高，神经元无法在每个周期都发放脉冲时，它会从纯粹的时间（相位）编码转变为速率编码，此时发放速率仍然反映刺激强度，但一对一的时间关系丢失了。这揭示了一个优美的设计原则：神经系统在可能的情况下使用快速、高效的相位编码，当达到物理极限时，则退回到较不精确的速率编码。

即使是看似化学性的嗅觉也依赖于时间动态。大脑不只是得到一张“检测到的气味分子”列表。相反，嗅球中的神经元相对于嗅探周期的节律以及更快的嵌套伽马振荡，以特定的时间发放脉冲。两种非常相似的气味可能会以大致相同的总速率激活同一组神经元。大脑可以通过观察它们在这些振荡周期内发放的相位来区分它们。通过在几次嗅探中整合这种精确的时间信息，大脑可以构建一个更丰富、更易于辨别的嗅觉世界表征，这是仅用简单的速率编码无法完成的壮举。

思想的架构：认知中的相位编码

如果说时间编码是我们感觉的语言，那么它也是我们思想的句法。当我们从知觉转向更高层次的认知功能，如记忆、导航和注意力时，我们发现相位编码扮演着一个更加复杂和核心的角色。

也许最富诗意的例子是在海马体中找到的，那里是大脑记忆和空间导航的所在地。在这里，所谓的“位置细胞”在动物处于其环境中的特定位置时发放脉冲。但这只是故事的一半。当一只老鼠穿过一个位置细胞的偏好位置（其“位置野”）时，该神经元不仅发放得更多；它的脉冲发生在持续的 theta 振荡（一种约 6–10 Hz 的慢脑波）中越来越早的相位上。这种现象被称为相位进动。想象一个时钟，当你穿过一个房间时，它的指针会向后扫。在房间的起点，脉冲可能在 theta 周期的晚期发生（比如，在 $300^{\circ}$ ），而当你到达终点时，它发生在早期（比如，在 $160^{\circ}$ ）。这是一个极其强大的编码。在单个脑波内，大脑不仅知道你在房间里，还知道你在房间的哪个位置。它将空间表征转化为一个压缩在毫秒时间尺度上的时间编码。

大脑能用这样的编码做什么？一个诱人的可能性是，它利用相位进动来生成思想或记忆的序列。想象一下，不同的下游大脑区域被“调整”为监听在不同相位到达的脉冲，这种调整取决于从海马体出发的物理传播时间（传导延迟）。当动物奔跑且相位发生进动时，脉冲信号将依次激活这些不同的下游监听者。通过这种方式，源头处相位的平滑扫过被转换成神经回路的离散、有序的激活。这可能就是我们回忆一连串事件或规划未来路径能力的基础机制，将空间编码转化为时间编码。

相位编码还为另一个基本的认知挑战——工作记忆——提供了一个优雅的解决方案。我们如何将一条信息，比如一个电话号码，在脑海中保持几秒钟？一种方法是让一组神经元以高频率持续发放脉冲，但这在能量上非常昂贵。一个更巧妙的机制是将信息存储在发放的相位中。一组神经元可能都以相同的平均速率有节律地发放脉冲，但它们持有的具体信息由它们相对于共享网络振荡的发放相位来编码。例如，一个在相位 $\phi_1$ 发放的神经元可以代表数字“7”，而另一个在相位 $\phi_2$ 发放的神经元代表“3”。因为速率是恒定的，所以能量成本很低，但信息却稳健地维持在脉冲的精确时间中。下游的解码器随后可以通过将传入的脉冲序列与其自身的参考节律相关联来读出此信息。

最后，要使这些编码中的任何一种起作用，它们都必须是可靠的。时间必须精确。这就是注意力的用武之地。注意力远非一个神秘的“聚光灯”，它有一个清晰的生理相关物：它能稳定神经发放。当你注意到一个刺激时，相应的神经元发放的脉冲在试验间的变异性会减小（法诺因子更低），并且关键的是，时间抖动也更小。脉冲相对于刺激的时间变得更加精确，脉冲之间的间隔也变得更加规律。注意力就像神经乐团的总指挥，抑制无关的噪音，并确保每个“乐器”都以完美的时机演奏其部分。通过这样做，它锐化了大脑用来表征世界的时间编码，使它们更加稳健，更易于下游区域读取。

从生物学到硅基：利用脉冲进行工程设计

神经编码的原理不仅是科学好奇的对象；它们还是新一代技术的蓝图。大脑是已知的最高效、最强大的信息处理设备，工程师们越来越多地从其操作原理中寻找灵感。

这一点在神经修复术和脑机接口 (BCIs) 领域最为明显。其目标是直接从大脑读取运动意图来控制一个机器人肢体。一个简单的解码器可能只计算来自运动皮层神经元的脉冲数量——一种纯粹的速率编码方法。然而，如果大脑编码运动的母语涉及时间模式，那么这样的解码器将丢弃关键信息。一个更复杂的解码器还会关注脉冲相对于持续振荡的时间。通过构建能理解时间编码的解码器，我们可以创造出更快、更准确、对用户更直观的假肢。

展望未来，相位编码的原理正在塑造未来计算机的架构。神经形态计算领域的研究人员正在硅芯片上构建“脉冲神经网络” (SNNs)，它们不像二进制的1和0那样通信，而是像大脑一样用脉冲通信。这迫使他们面对进化已经处理过的相同权衡。一个值，比如一个像素的亮度，应该如何编码？

速率编码：用一个时间窗口内的脉冲数量来表示。这对时间误差具有鲁棒性，但速度慢，需要许多脉冲，消耗大量能量。
潜伏期编码：用单个脉冲的时间来表示（例如，更亮的像素导致更早的脉冲）。这非常快速且节能，但对时间抖动非常敏感。
相位编码：用一个脉冲相对于全局时钟信号（片上振荡器）的相位来表示。这提供了一种平衡：它比速率编码更快、更高效，并且可能比纯粹的潜伏期编码更具鲁棒性。

工程师们正在发现，每种方案都有其适用之处，最佳选择取决于问题的具体约束——功率、速度和噪音的约束，而大脑已经对这些约束优化了数百万年。

从声音和质感到路径的记忆和注意力的焦点，再到智能机器的设计，发放时相位编码的原理提供了一条统一的线索。它提醒我们，大脑卓越的计算能力不仅源于其神经元的数量或其连接的复杂性，还源于其对话中精确到毫秒的复杂节律——一曲名副其实的脉冲时间交响乐。