脉冲分选

玻尔百科

定义

脉冲分选是神经科学中的一种计算处理过程，旨在从含有噪声的多单元细胞外记录中分离出单个神经元的动作电位。该方法通过滤波、脉冲检测、降维及聚类等步骤，根据波形特征对神经信号进行归类。作为连接电生理学与机器学习的基础手段，脉冲分选对于准确解读大脑连接及编码机制至关重要。

核心要点

脉冲分选是一种计算过程，旨在从嘈杂的多单元胞外记录中分离出单个神经元的动作电位（脉冲）。
标准工作流程包括带通滤波、脉冲检测、使用PCA等技术进行降维，以及通过聚类根据波形形状对脉冲进行分组。
一个关键的验证步骤是检查脉冲间期直方图是否存在不应期，因为一个真正的单个神经元不可能在1-2毫秒内连续放电两次。
分选误差，如合并或分裂单元，会产生重大的科学伪影，导致关于神经编码、连接性和放电统计的错误结论。
脉冲分选是神经科学中的一种基础方法，它将电生理学与信号处理、机器学习和统计分析联系起来，以解码大脑的语言。

引言

要理解大脑，我们必须首先学会破译它的语言——由单个神经元发放的电脉冲，即“脉冲”。然而，用电极记录大脑活动就像在拥挤的房间里放一个麦克风；原始信号是重叠的对话、背景噪音和低频嗡嗡声的混乱混合体。本文要解决的核心挑战，也是核心问题，就是如何从这种嘈杂声中可靠地分离出每个神经元的“声音”。这个过程被称为脉冲分选，是现代神经科学研究的基石。

本文为这项关键技术提供了指南。在第一章原理与机制中，我们将深入探讨脉冲分选流程的核心。您将学习如何通过滤波增强脉冲信号，如何检测和表征脉冲，以及聚类算法如何根据脉冲独特的波形“特征”对其进行分组。我们还将介绍一些关键的生物学规则，如不应期，这些规则能帮助我们验证结果。随后的应用与跨学科联系一章将探讨正确分选的数据所带来的深远科学影响。我们将研究分选后的脉冲如何促成神经编码的研究，讨论不同记录技术之间的权衡，并至关重要的是，揭示细微的分选误差如何制造出“机器中的幽灵”——这些科学假象可能将研究人员引入歧途。读完本文，您将不仅全面了解脉冲分选的工作原理，还将明白为什么正确地进行脉冲分选对于倾听大脑至关重要。

原理与机制

要破译大脑复杂的语言，我们必须首先学会倾听。想象一下，在一个熙熙攘攘的鸡尾酒会中央放置一个高灵敏度的麦克风。您会听到一片嘈杂：背景对话的嗡嗡声、玻璃杯的碰撞声，以及在喧嚣之上，个别人讨论时清晰的声音。用胞外电极倾听神经元的声音与此非常相似。电极能拾取到数千个细胞突触活动总和产生的缓慢、起伏的波，这被称为局部场电位（LFP），就像派对的背景嗡嗡声。它还能记录到热噪声和电子噪声的嘶嘶声。但我们真正要寻找的是个体的声音——单个神经元发出的尖锐的电“词语”。这些就是动作电位，或称脉冲。

神经元的全或无式声音

神经元的一个迷人特性是，它以全或无的方式“说话”，这一点由 Edgar Douglas Adrian 在 20 世纪 20 年代的开创性工作中确立。当一个神经元决定放电时，它会产生一个具有特定形状和振幅的脉冲。它不会为了传达更紧急的信息而提高音量；相反，它会说得更快，即提高放电频率。对于一个给定的神经元，在距离我们电极“麦克风”固定距离处，这种脉冲波形是其独特的声学特征或音色。然而，我们记录到的原始电压是所有这些信号的线性叠加：来自不同神经元的脉冲在时间上重叠混杂，所有这些都叠加在缓慢的 LFP 波上，并夹杂着噪声。因此，首要的艰巨任务是清理这种混乱的记录，以分离出脉冲。

调谐：滤波以求清晰

我们如何将快速、噼啪作响的脉冲与缓慢、起伏的 LFP 分开呢？答案在于频率域。就像音符有音高一样，电信号也有频率。脉冲是非常短暂的事件，仅持续一到两毫秒。物理学和信号处理的一个基本原理告诉我们，时间上尖锐、短暂的事件由高频分量构成。相比之下，LFP 是缓慢的波动，由低频主导。电子噪声通常是宽带的，但在非常高的频率下问题最严重。

频谱内容的这种差异为我们提供了绝佳的机会。我们可以应用一个带通滤波器，这是一种电子或数字工具，其作用类似于复杂的音频均衡器。它由两部分组成：

一个高通滤波器，切断低于某个阈值（比如 $300 \mathrm{Hz}$ ）的频率。这能有效地消除 LFP 和任何运动伪影产生的响亮、低频的隆隆声。
一个低通滤波器，去除高于一个更高阈值（比如 $3000 \mathrm{Hz}$ ）的频率。这能消除大部分高频电子噪声，而不会显著扭曲脉冲的核心形状。

剩下的是一个主要包含脉冲波形的信号，现在它变得更干净、更容易观察。当然，天下没有免费的午餐；这个滤波过程会引入一个微小的时间延迟，这是工程师在脑机接口等实时应用中必须仔细管理的关键参数。

从嗡嗡声到词语：检测与分选

有了滤波后的信号，我们现在可以开始挑出单个脉冲。这第一步称为脉冲检测。最简单的方法就是振幅阈值法：每当电压穿过某个负阈值时，我们就宣布检测到一个脉冲。虽然简单，但这是一种粗糙的工具，类似于假设任何超过特定音量的声音都是一个词语。一种更优雅的方法是匹配滤波器。如果我们对一个典型脉冲的形状有一个很好的了解（我们的模板），那么匹配滤波器是在随机的类高斯噪声中找到该形状出现次数的数学最优方法。它的工作原理是在信号上滑动模板，寻找高相关性的时刻，这极大地提高了信噪比。

检测之后，我们得到了一组波形，每个都是一个候选脉冲。但核心问题依然存在：谁说了什么？这就是被称为脉冲分选的关键逆问题。我们的目标是处理这一堆杂乱的已检测脉冲，将每一个分配给其来源神经元，实际上就是按说话者对词语进行分类。

为此，我们需要表征每个脉冲的“音色”。我们不能每次都比较整个复杂的波形。相反，我们进行降维。一种强大而常用的技术是主成分分析（PCA）。PCA 会观察所有收集到的波形，并找出它们变化最大的维度。例如，第一个主成分可能捕捉脉冲的峰值振幅，第二个可能捕捉其宽度。通过将每个波形投影到少数几个主成分上，我们可以将每个脉冲表示为低维“特征空间”中的一个点。

比较波形形状这个棘手的问题现在变成了一个优美的几何问题：聚类。我们在这个特征空间中寻找点云或簇。假设是来自同一神经元的脉冲会有相似的形状，因此会聚集在一起，形成一个独特的簇，而来自不同神经元的脉冲会形成不同的簇。

游戏规则：验证簇

假设我们的聚类算法找到了几个看起来很整齐的点云。我们完成了吗？我们成功地识别出神经元了吗？还没有。我们现在必须扮演侦探的角色，验证这些假定的“单元”是否像真正的神经元一样活动。这是验证的关键步骤。

我们侦探工具包中最强大的工具是神经生物学的一个基本法则：绝对不应期。当一个神经元发放一个动作电位后，会有一个短暂的时期——通常约为 $1$ 到 $2$ 毫秒——在此期间，无论刺激多强，它都无法再次发放动作电位。这是因为其钠离子通道上的分子门会暂时失活并需要时间恢复，而这些通道是脉冲爆发性上升的原因 [@problem_-id:4189787]。

这个生物物理定律给了我们一个简单而铁证如山的测试方法。我们可以取分配给单个簇的所有脉冲，并计算连续脉冲之间的时间间隔——即脉冲间期（ISIs）。如果我们绘制这些 ISI 的直方图，一个真正的单个神经元必须在开头显示一个“空洞”：不应有短于绝对不应期 $\tau_{\mathrm{abs}}$ 的 ISI（或接近于零）。

在这个禁区内发现的任何脉冲（例如，ISI 为 $0.5 \mathrm{ms}$ ）都称为不应期违例。它们是簇受污染的确凿证据。获得如此短的 ISI 的唯一方法是，我们错误地将来自两个或多个不同神经元的脉冲合并到了同一个簇中；神经元本身不共享不应期，所以它们可以紧密地相继放电。检查这个 ISI 特征也许是验证一个分选单元的最重要标准。

当好的分选变坏时：现实的危险

在理想世界中，每个神经元都有一个独特、稳定的波形，分选会很容易。但大脑是一个混乱、动态的地方，两个主要挑战不断威胁着我们的努力：重叠脉冲和非平稳性。

重叠脉冲：如果电极附近的两个神经元几乎同时放电会发生什么？我们的电极只会记录它们两个波形的总和。这个新的复合波形具有不属于任何一个神经元的形状。当它被投影到我们的特征空间时，它不会落入任何一个父簇中。相反，它表现为一个离群点，一个漂浮在簇之间空间中的点。标准的聚类算法假定每个点都属于单一来源，因此会被这些“碰撞”事件搞糊涂，常常导致错误分类。

非平稳性与漂移：认为神经元的波形是一个稳定特征的假设，不幸的是，是一种过度简化。在数分钟和数小时内，电极可能会在脑组织中发生物理漂移，从而改变其相对于神经元的位置。这会导致记录到的脉冲形状和振幅随时间变化。此外，神经元本身也可能改变其放电特性。这种现象被称为非平稳性，意味着一个最初紧密而清晰的簇可能会在特征空间中慢慢游走和弥散，甚至可能与其邻居合并。

我们为什么如此执着于这些错误？因为它们可能对我们理解大脑编码的能力造成灾难性的后果。让我们考虑一个来自脑机接口的简单而优雅的场景，该接口试图解码运动意图。

想象一个错误合并：我们错误地将两个具有相反调谐特性的神经元组合在一起。当用户打算向右移动时，神经元 1 放电更多；当用户打算向左移动时，神经元 2 放电更多。如果我们正确地分选它们，活动差异会告诉我们方向。但如果我们合并它们，它们的信号会平均掉。合并后的“单元”的放电率变得恒定，无论意图如何。信息被完全摧毁。我们的解码器变得盲目。
现在想象一个错误分裂：我们取一个单个神经元，错误地将其脉冲分裂成两个独立的簇。从纯理论的角度来看，信息仍然存在，只是被分到了两个通道。然而，一个试图从这些数据中学习的实用解码算法现在看到两个几乎完全相关的输入。这种情况被称为多重共线性，使得在统计上难以学习到一个稳定可靠的映射。解码器会感到困惑并表现不佳。

因此，脉冲分选远不止是一项技术性的琐事。它是将大脑原始、混乱的电学低语转化为一组清晰、有意义的对话的基本过程。从过滤原始轨迹到验证最终的簇，每一步都是物理学、生物学和统计推断的美妙结合。做好它，几乎是我们希望在理解和与神经系统交互方面实现所有其他目标的前提。

应用与跨学科联系

在了解了脉冲分选的原理和机制之后，您可能会认为这是一项相当复杂，甚至有些乏味的数据整理工作。从某种程度上说，确实如此。但这是最光荣的一种整理，就像擦拭一架将要观测新世界的望远镜的镜片。因为一旦脉冲被分选——一旦我们能在大脑永不停歇的对话中自信地说出谁在何时说了什么——真正的科学冒险就开始了。分选后的脉冲序列并非最终产品；它是我们构建对记忆、感知和行动理解的原材料。

在本章中，我们将探讨如何利用这些分选后的脉冲。我们将看到它们如何成为破译神经编码和绘制大脑环路图的基石。但我们也会采纳一位优秀物理学家应有的健康怀疑态度。我们将看到这个基石可能很脆弱，以及我们分选过程中微小、几乎难以察觉的裂缝如何可能引导我们建造出宏伟、美丽但完全虚幻的空中楼阁。这段旅程将带我们从实验设计的务实细节走向数学的深邃、抽象之美，揭示脉冲分选是一个汇集了众多科学领域的迷人十字路口。

科学家的首要职责：信任，但要验证

在我们用分选数据对大脑做出宏大论断之前，我们必须首先说服自己分选是正确的。我们怎么知道我们的算法不只是在凭空捏造神经元呢？

最优雅的方法之一是控制局面。想象一下，我们可以伸入大脑，对一个特定的神经元说：“你，只有你，现在放电！”如果我们的脉冲分选算法随后报告了来自该神经元的一个脉冲，而没有其他，我们就可以给它一个肯定。这正是现代技术光遗传学所能做到的。通过基因改造特定的神经元使其对光做出反应，我们可以用激光作为傀儡师，强迫一个神经元按指令发放动作电位。这为我们提供了“基准真相”——一组我们确定无疑来自特定来源的脉冲。

然后，我们可以像考学生一样测试我们的分选器。对于我们算法标记为“神经元A”的脉冲，有多少确实来自被光激活的神经元A？这是它的精确率。在我们知道神经元A发放的所有脉冲中，我们的算法成功找到了多少？这是它的召回率。通过系统地用这些已知的基准真相测试我们的算法，我们可以量化它们的性能并理解它们的偏见，从而将脉冲分选从一门玄学转变为一门严谨、可测量的科学。

一旦我们对数据有了信心，我们还会面临另一个更具社会性的挑战。科学是一项协作性事业。如果我根据我分选的脉冲有了一项发现，另一位科学家必须能够获取我的数据，理解我的处理方式，并验证我的结果。这促成了标准化数据格式的发展，这是一种神经科学的数字通用语。一个著名的例子是 Neurodata Without Borders (NWB)。以 NWB 这样的格式存储数据不仅仅是保存一个脉冲时间列表。它是为了创建一个完整的、自描述的产物。这不仅包括脉冲时间，还包括所有关键的元数据：原始记录的采样率 $f_s$ ，电极的确切物理位置，所用脉冲分选软件的名称和版本，所选的参数，甚至每个分选单元的质量指标。这种严谨的方法确保了数据能够比实验甚至实验者本身存在得更久，为我们的集体知识奠定一个稳固且可复现的基础。

回报：倾听大脑的编码

有了我们可以信任和分享的数据，我们终于可以得到回报：倾听神经元在告诉我们什么。隐藏在它们脉冲序列中的模式被认为是构成大脑语言本身的东西——神经编码。

然而，我们窃听这场对话的能力深受我们选择的“麦克风”的影响。想象一下，试图理解内嗅皮层中网格细胞的空间编码，这是大脑的内部 GPS。我们可以使用经典的四极电极（四根细金属丝束），现代的Neuropixels探针（带有数百个密集记录位点的硅探针），或双光子钙成像（一种观察神经元放电时荧光的显微镜）。每种选择都涉及到一个根本的权衡。

四极电极和 Neuropixels 都能直接倾听神经元的电信号，让我们能以亚毫秒级的精度计时脉冲。这足以分辨脑电波周期内的精细时间结构，比如著名的 theta 节律（ $T_{\theta} \approx 125 \, \mathrm{ms}$ ），这是网格细胞编码的一个关键方面。另一方面，钙成像观察的是神经活动的一个缓慢的代理指标——钙离子的流入。钙指示剂本身的衰减时间（ $\tau \approx 200 \, \mathrm{ms}$ ）比一个 theta 周期还要长。这就像试图透过一堵厚厚的泥墙听清钢琴清脆的音符；所有尖锐的时间细节都被抹平了。

但当我们问及空间位置时，情况就反过来了。电生理学告诉你一个神经元是否放电了，但很难精确知道是哪个神经元。这就像在拥挤的房间里听到一个声音却看不到是谁在说话。相比之下，钙成像是显微镜。它给我们一幅美丽、直接的神经元图像，以微米级的精度分辨它们的细胞体。

最后，还有观察者的偏见。四极电极可能偏向于声音响亮、活跃的神经元（那些电信号大的神经元）。Neuropixels 探针凭借其长长的探针，可以同时监听许多“房间”——同时记录所有皮层层——但它仍然偏爱声音更大的神经元。钙成像则偏向于我们能看到的靠近表面的神经元，而且仅限于那些我们已成功改造使其发光的神经元。没有完美的麦克风。神经科学的艺术在于为手头的问题选择正确的工具——并理解其局限性。

一旦我们有了分选后的脉冲，我们就可以开始检验神经编码的理论。是平均放电率携带信息（速率编码），还是单个脉冲的精确时间携带信息（时间编码）？一个分选后的脉冲序列是必不可少的证据。例如，通过分析一个神经元的脉冲相对于持续的 theta 节律的时间，我们可以计算一个矢量强度，这是一个衡量神经元与振荡“相位锁定”紧密程度的指标。这使我们能够量化神经元放电的时间精度，并确定这种精度是否携带了简单速率编码会忽略的信息。

机器中的幽灵：分选误差如何制造科学假象

自然是微妙的，但她并非恶意。然而，如果我们不小心，我们的工具却可能如此。脉冲分选器是一个强大的工具，但和任何工具一样，它可能制造出看起来像是重大发现的伪影。脉冲分选的世界就充满了这样的幽灵。

考虑一个简单的错误：我们的算法意外地将一个脉冲分裂成两个，将它们记录为两个由极小延迟分隔的独立事件。或者它将两个不同但靠得很近的脉冲合并成一个。我们的分析会发生什么？如果我们测量神经元放电的变异性，这些错误可能是毁灭性的。分裂一个脉冲会引入一个人为的短脉冲间期。这会夸大脉冲序列的测量方差，使一个非常规则、像节拍器一样的神经元显得嘈杂和随机。合并则有相反的效果，删除了短间隔，使一个神经元显得比它实际更规则。我们代码中的一个技术故障可能导致我们发表一个与事实完全相反的生物学结论。这些幽灵的主要诊断工具是自相关图，即一个神经元自身脉冲间期的直方图。一个健康、被良好分离的神经元应该显示出一个“不应期”——在一次脉冲后的一两毫秒内再次放电的概率接近于零。自相关图在零延迟附近出现一个尖峰，是分裂错误的明显警示信号。

这些假象可能变得更加微妙和诱人。想象一下，我们正在研究两个神经元 A 和 B，看它们是否相连。假设我们的分选器犯了一个错误：有时，来自神经元 A 的一个大脉冲也被错误地分配给了神经元 B。当我们计算互相关图以寻找同步放电时，我们会在零时间延迟处发现一个又大又尖的峰。我们可能会兴奋地得出结论，我们发现了一个强大的、零延迟的同步连接，这是神经回路的基石。但这是一个幽灵——是“重复计算”同一事件的伪影。

虚假连接的幽灵甚至可能更吓人。假设由于算法模板匹配中的某些怪癖，来自神经元 A 的脉冲被系统性地误分配给神经元 B，但带有一个一致的小时间延迟 $\Delta$ 。如果我们然后使用像格兰杰因果关系这样复杂的统计方法来检验 A 的活动是否能预测 B 的活动，我们会发现一个显著的因果联系！算法会高可信度地报告，A 的一次脉冲之后，可预测地会跟着 B 的一次脉冲。我们将会“发现”大脑中一条有向的因果通路，这是一个具有重大意义的发现。但这同样会是一个彻头彻尾的假象，一个源于处理错误的幽灵。这就是为什么仔细的诊断性检查，比如打乱试验数据或抖动脉冲时间以观察所声称的效果是否消失，不是可有可无的奢侈品；它们是我们必须执行的必要驱魔仪式，以确保我们研究的是大脑，而不是我们机器中的幽灵。

更深层次的联系：作为科学缩影的脉冲分选

如果我们退后一步看，我们会发现脉冲分选的挑战不仅仅是技术问题；它们是科学和数学中更广泛主题的缩影。

整个事业都建立在一个优美的数学理论之上：点过程理论。在理想化的世界里，每个神经元都是一个独立的泊松过程，以一定的平均速率随机发放脉冲。电极记录到的总活动是所有这些过程的叠加。脉冲分选的目标就是对这个叠加过程进行完美的“分解”或稀疏化，利用脉冲的形状（它的“标记”）将其送回其原始来源。这只有在条件理想时才能完美实现：神经元确实是独立的泊松源，并且它们的脉冲形状非常独特，以至于它们生活在“特征空间”中完全分离、不重叠的区域。

当然，现实从不如此干净。神经元并不总是独立的。它们的脉冲形状也常常重叠。这就是简单理想模型崩溃、我们进入现代机器学习领域的地方。脉冲分选就是一个聚类问题。我们可以将每个脉冲的特征——它的振幅、宽度——看作高维空间中的一个点。来自单个神经元的脉冲应该在这个空间中形成一个密集的云，即簇。像 DBSCAN（基于密度的含噪声应用空间聚类）这样的算法正是为此设计的：寻找密集的点云，并将它们与其他云以及稀疏的背景噪声分离开来。这个视角立即将脉冲分选与计算机科学中一个庞大而强大的工具箱联系起来。

最难的问题是，当两个或多个脉冲同时发生并且它们的电场相加，形成一个新的复合波形时该怎么办。我们如何解开这团乱麻？这个“拥挤房间”问题催生了一些最美丽和抽象的联系。我们可以这样构建问题：我们有一个观测波形 $y$ ，我们想将其解释为我们字典中几个“模板”波形的总和， $y = \sum c_i r_i$ 。因为放电率不能为负，所以我们正在寻找系数 $c_i$ 的一个非负、稀疏解。这个问题，被称为非负最小二乘法（NNLS），在凸优化和几何学领域有深厚的根源。我们是否能唯一地识别出两个重叠脉冲的问题，结果等价于一个关于高维锥几何的问题。当且仅当存在一个“视角”——一个位于称为对偶锥的特殊空间中的向量 $u$ ——从这个角度看，两个真实的模板位于地平线上（ $u^{\top} r_i = 0$ ），而所有其他不正确的模板都清晰可见（ $u^{\top} r_j > 0$ ）时，恢复才有可能。一个神经生理学中的实际问题，在凸锥的抽象几何中找到了它的最终答案，这是数学推理统一性和力量的惊人例证。

因此，脉冲分选远不止是一项技术性的琐事。它是将来自大脑的原始电信号转化为关于心智的有意义数据的关键节点。这是一个实用电生理学、统计推断、机器学习和纯数学汇聚的领域。理解它的应用——更重要的是，它的陷阱——就是理解现代数据驱动发现的本质。对完美脉冲分选器的持续追求，无异于对一个更清晰、更诚实、更美丽的大脑视图的追求。