
生物信号是生命本身的语言,承载着来自身体内部运作的信息——从单个神经元的电脉冲到心脏的节律性搏动。然而,这些生命体征很少是清晰的;它们往往很微弱,淹没在噪声中,并与其他生理过程纠缠在一起。生物信号处理的挑战和艺术在于破译这种复杂的语言,从周围的静电干扰中分离出有意义的旋律,从而为诊断、监测和基础科学发现解锁洞见。本文将作为这一迷人学科的指南。文章首先在“原理与机制”一章中奠定坚实的基础,我们将探讨生物信号的性质、频率分析的力量,以及滤波器在净化数据中的关键作用,同时理解其隐藏的成本。然后,“应用与跨学科联系”一章将展示这些工具在现实世界中的应用——从嘈杂的记录中恢复心跳、构建智能诊断系统,到推动现代遗传学的边界——揭示信号处理在整个生命科学领域的深远影响。
要理解生物信号的世界,我们必须首先学习它的语言。这并非教科书中完美、干净的波形语言,而是充满噪声、复杂且常常不可预测的数据语言,它随着生命本身的节律而脉动。我们的任务是成为解读员,在表面的混乱中找到隐藏的信息。这段旅程并非始于复杂的机器,而是始于一个简单的问题:从根本上说,信号是什么?
想象一下你在听一个人的心跳。有一种稳定、可预测的节律——咚-咚,咚-咚。这是信号中的“秩序”,一个由心脏的天然起搏器控制的近周期性过程。如果心脏是一个完美的时钟,那么每次心跳之间的间隔都将是相同的。但事实并非如此。如果你高精度地测量每次连续心跳之间的时间(R-R间期),你会发现这些间期是波动的。它们围绕一个平均值跳动。这种波动被称为心率变异性 (HRV)。
那么,这个信号是确定性的还是随机的?事实,正如生物学中常见的那样,介于两者之间。这个信号最好被描述为两者的结合:一个占主导地位的可预测分量(平均心率)和一个叠加其上的较小的、不可预测的随机分量。我们可以用一个简单的数学和式来表示它:,其中 是稳定、确定性的平均间期,而 是随机、波动的部份。这个“随机”部分不仅仅是要被丢弃的噪声;它是关于身体状态的丰富信息来源,反映了自主神经系统的持续推拉作用。
这种用简单的数学形式来建模复杂事件的思想是我们工作的基石。考虑单个神经元的爆发性放电——一个称为动作电位的电压快速尖峰。这种离子通道的复杂舞蹈可以用一个简单的函数完美地近似,比如一个微分高斯脉冲。一个简单的公式,,可以捕捉到该事件的本质:快速上升(去极化)和随后的下降(复极化)。通过找到这个函数的最大值和最小值,我们甚至可以测量关键特征,比如尖峰的正负峰值之间的时间间隔,结果证明它就是一个简单的 。这是我们的第一个线索:在生物学惊人的复杂性背后,常常隐藏着一种等待被发现的优雅的数学简洁性。
将信号看作随时间展开——一种时域视角——是直观的,但这并不能说明全部情况。要真正理解一个信号,我们还必须倾听其潜在的节律。想象一下钢琴上弹奏的一个和弦。你听到的是一个单一、丰富的声音,但它实际上是由几个独立的音符或频率组成的。生物信号与此非常相似。
通过脑电图 (EEG) 测量的脑电活动提供了一个完美的例子。一个稳态的EEG记录可以被看作是许多不同正弦波的叠加,每个正弦波都有自己的频率和振幅,它们全部加在一起。这就是大脑的“交响乐”。
这个观点提出了一个新问题。这样一个理论上永远持续下去的信号,其能量是有限的吗?信号的能量是其在所有时间上平方值的总和。由于正弦波永不消失,其能量是无限的。这似乎是个问题,但它引导我们走向一个更有用的概念:平均功率。虽然总能量是无限的,但单位时间内传递的能量是有限且恒定的。像这样的信号——周期性信号或周期性信号之和——被称为功率信号。相比之下,像我们单个神经元尖峰那样的瞬态事件,出现后即消失,具有有限的总能量,被称为能量信号。这种区分是根本性的。它告诉我们我们处理的是一个持续不断的过程还是一个短暂的事件。
如果一个信号是不同频率的交响乐,我们如何才能将小提琴与大提琴分离开来?我们如何只听低频节律或高频喋喋不休?答案是一个功能强大且优雅的工具:滤波器。
在其核心,滤波器是一个改变信号的系统。对于一大类有用的滤波器,即线性时不变 (LTI) 系统,它们的行为具有一种近乎神奇的特性。让我们从第一性原理出发,看看为什么。LTI系统的输出 通过与系统的“冲激响应” 进行卷积运算与输入 相关。现在,如果我们向系统输入一个纯粹的复正弦波,,会发生什么?
卷积积分告诉我们: 我们可以拆分指数项: 项 不依赖于积分变量 ,所以我们可以把它提出来:
仔细观察这个结果。输出是原始输入信号 乘以括号中的一个复数。这个数,我们称之为频率响应 ,它依赖于频率 但不依赖于时间。这是一个深刻的发现。它意味着对于LTI系统,正弦波是特殊的:它们是特征函数。它们通过滤波器时频率保持不变。滤波器只能对它们做两件事:改变它们的振幅(乘以一个因子 ,即增益)和在时间上移动它们(通过增加一个相移 )。
这一个事实是所有滤波的关键。它让我们通过观察滤波器如何独立对待每个频率来理解它。例如,一个简单的操作,如取当前样本与前一个样本之差,,就构成了一个滤波器。它做了什么?对于缓慢的低频信号, 和 非常相似,所以它们的差很小。对于快速的高频信号,差值很大。这个简单的操作是一个高通滤波器;它“通过”高频并衰减低频。其频率响应 的幅度为 ,在零频率处为零,在高频处最大。
有了滤波的概念,我们现在可以执行生物信号处理中最关键的任务之一:将我们关心的信号与不必要的干扰或伪影分离开来。
一个典型的例子是心电图中的基线漂移,通常由患者的呼吸引起。呼吸会产生一个缓慢的低频波,叠加在心电图上,使其上下漂移。这会干扰对表示心室收缩的、速度快得多的QRS波群的分析。解决方案很简单:应用一个高通滤波器。滤波器阻挡低频的呼吸伪影,同时让QRS波群的高频分量通过。通过正确设计滤波器,我们可以大幅降低不必要的漂移的功率——例如,一个简单的滤波器可以将一个 Hz的漂移信号衰减到其原始功率的6%以下,从而有效地清理记录以进行更好的诊断。
对于现代可穿戴传感器,伪影的世界变得更加复杂。光电容积脉搏波 (PPG) 从腕戴设备测量血容量变化,它极易受到运动伪影的影响。想象一下你戴着智能手表慢跑。PPG信号会被与你的心脏无关的大而突然的尖峰所污染。我们如何处理这个问题?关键在于认识到并非所有的“噪声”都是相同的。
一个关键的洞见是,机械运动也可以被测量,通常由板载的加速度计来测量。当我们在PPG中看到一个噪声爆发,同时加速度计也有一个大信号时,我们就有强有力的证据表明这是一个机械运动伪影。这种伪影通常是瞬态的(短暂的)和非平稳的(其统计特性随时间变化)。通过使用加速度计作为指导,我们可以开发出复杂的算法来识别和移除这些运动伪影,从而挽救底层的生理信号。
滤波似乎是一个完美的工具,但有一个微妙的、隐藏的成本,如果被忽视,可能会是灾难性的:相位失真。正如我们所见,滤波器会改变正弦波的振幅和相位(对应于时间上的移位)。如果滤波器将所有频率移动相同的时间量,信号的形状得以保留。但如果它对不同频率的延迟不同呢?
这就引出了群延迟的概念,,它衡量一个窄频带经历的时间延迟。如果相位响应 不是一条直线,那么不同频率的群延迟就会不同。
考虑一位神经科学家试图将眼球运动 (EOG) 与大脑活动 (EEG) 相关联。精确的时间是关键。如果他们使用具有非线性相位的标准滤波器来去除EOG中的噪声,构成眼球运动波形的不同频率分量将被移动不同的量。结果呢?波形被涂抹和扭曲,其表观时间被改变,使得与EEG的精确关联变得不可能。
这种影响可能出人意料地显著。想象一个“全通”滤波器——一个设计为对所有频率增益都为1的滤波器,所以它根本不改变信号的频率内容。你可能会认为它什么也不做!但如果它具有非线性相位,它可能会造成严重破坏。一个完美的对称ECG QRS波群,建模为一个高斯脉冲,在通过这样的滤波器后可能会变得倾斜和扭曲。尽管每个频率分量仍然以其原始振幅存在,但它们在时间上的相对排列已被打乱。计算群延迟表明,低频可能被延迟,比如说,10毫秒,而高频只被延迟4毫秒。这6毫秒的差异足以明显地破坏波形的对称性。
那么解决方案是什么?对于已经记录的数据(离线处理),我们可以使用一个聪明的技巧:零相位滤波。我们先在正向应用一次滤波器,然后对时间反转的输出应用同一个滤波器。两次滤波的相移会精确地相互抵消,从而产生零净相位失真。诀窍在于这个过程是非因果的:要计算时间 的滤波输出,你需要访问未来的输入值(这是可行的,因为信号已经被记录下来了)。这种优雅的技术让我们能够两全其美:既能进行频率选择性滤波,又没有任何时间失真。
大部分这种神奇的处理都发生在计算机上。我们从传感器获取一个连续的模拟信号,并对其进行采样,以创建一串数字——一个离散时间信号。然后我们将我们的滤波器构建为算法,或数字滤波器。一个关键问题出现了:如果我们有一个好的、稳定的模拟滤波器,我们如何能确定其数字对应物也会表现良好?
一个系统是稳定的,如果一个有界输入总是产生一个有界输出。一个不稳定的滤波器是无用的;即使对于一个很小的输入,其输出也可能爆炸到无穷大。滤波器的稳定性可以用复数的语言优美地描述。对于连续时间滤波器,稳定性要求其所有的“极点”——表征其行为的复s平面中的特殊值——都必须位于平面的左半部分,即实部为负。
当我们使用像冲激不变法这样的方法从模拟滤波器创建数字滤波器时,存在一个直接的映射。s平面中的每个极点 通过关系 被映射到离散时间z平面中的一个极点 ,其中 是采样周期。为了使数字滤波器稳定,其所有的极点都必须位于z平面的单位圆内,即 。
让我们检查一下这个映射。数字极点的幅度是 。由于原始的模拟滤波器是稳定的,我们知道 。因为 是正的,所以指数是负的,这保证了 。一个稳定的模拟滤波器在这种变换下总能产生一个稳定的数字滤波器。这种连接连续世界和数字世界的优雅数学联系为我们所有的数字信号处理提供了坚实的基础,确保我们强大的工具不仅巧妙,而且稳健可靠。
对于物理学家来说,宇宙是由优雅定律支配的波与粒子的交响曲。对于生物学家来说,身体是一个同样复杂的管弦乐队,但它的音乐往往用一种我们才刚刚开始破译的语言演奏。这种音乐承载于生物信号之中:心肌细胞的电颤动、肌肉的微妙震颤、血液在动脉中的涌动、组织中基因开关的合唱。这些信号是来自生命内部运作的信息。然而,它们常常微弱,淹没在噪声中,并交织在一幅复杂的织锦中。生物信号处理的艺术与科学是我们聆听这支乐曲、从静电干扰中分离旋律、并将生物学的语言翻译成洞察与发现的语言的方法。
在探讨了基本原理之后,现在让我们踏上一段旅程,穿越这些思想得以实现的广阔领域。我们将看到数学和工程的抽象工具如何成为观察和理解生命世界的强大透镜,从单颗心脏的跳动到大脑的遗传结构。
身体中最基本的信号也许就是心脏的节律。它产生的声音,即熟悉的“lub-dub”,可以记录为心音图 (PCG)。在安静的房间里,用好的传感器,这个信号是清晰的。但在现实世界中,记录不可避免地会被呼吸、肌肉运动或环境的噪声所破坏。当心脏的稳定搏动被淹没在随机的海洋中时,我们如何找到它?
答案在于一个极其简单而强大的思想:自相关。想象一下你有一段嘈杂的心音记录。你复制一份,然后将这份副本沿着原始记录滑动,在每一步测量两者对齐的程度。如果原始信号包含一个重复的模式——比如心跳——那么每当你将副本滑动一个该模式的完整周期时,信号将会几乎完美地对齐,产生一个大的相关性。而随机噪声,就其本质而言,没有这样的重复结构。当你将一个嘈杂的信号与自身滑动时,它只在时间偏移为零时完美对齐;在其他任何地方,起伏都会相互抵消。
因此,一个嘈杂周期信号的自相关具有一个显著的特性:它在与底层信号周期相对应的时间偏移处呈现出尖锐的峰值,这些峰值从一个在其他地方基本为零的背景中凸显出来。通过找到这些峰值之间的间距,我们可以精确地确定心脏节律的周期,即使我们在原始记录中无法清晰地看到它。这使得算法能够从嘈杂的音频流中计算出患者的心率,揭示了混沌中隐藏的秩序。
生物信号不仅仅是节律;它们特定的形状或形态学,承载着丰富的信息。健康心跳的心电图 (ECG) 形状与处于困境中的心脏不同。动脉血压脉搏的波形会随着年龄和心血管疾病而改变。为了构建自动化的诊断系统,我们需要教计算机如何“看”和量化这些形状。
一种强大的方法借鉴了几何学的世界。考虑在分娩过程中使用胎心监护 (CTG) 监测婴儿心率的挑战。有时,心率会暂时下降,这一事件称为减速。临床医生根据这些减速的形状对它们进行分类——有些是逐渐而圆滑的,而另一些则是尖锐而突然的。这种区分对于评估胎儿的健康状况至关重要。但你如何教一台机器“突然”的含义?我们可以使用曲率的概念。对于曲线上任何一点,曲率是一个数字,告诉你曲线在该点弯曲的剧烈程度。一条直线有零曲率,一个平缓的弧线有低曲率,一个急转弯有高曲率。通过用一个简单的数学函数(如抛物线)局部地建模减速的谷底(最低点),我们可以计算其最大曲率。这个单一的数字成为“突然性”的量化度量,机器学习算法可以用这个特征来自动分类减速,并提醒医务人员注意潜在问题。
除了量化单个信号的形状,我们常常需要比较两个不同信号的形状。例如,我们可能想知道一个病人今天的动脉血压波形是否与去年具有相同的特征形状,即使他们的平均血压已经改变。由于绝对水平的变化,简单的逐点比较会失败。需要一种更复杂的工具,一种对形状敏感但对基线偏移不敏感的工具。这就是导数动态时间规整 (DDTW) 背后的动机。我们不是比较两个波形的原始值,而是首先计算它们的导数——即每个点的变化率。导数捕捉了“起伏”,即形状的本质。然后,我们使用动态时间规整的强大技术来找到这两个导数序列之间的最佳对齐。结果是一个距离度量,告诉我们这两个形状有多么不同,通过关注信号的动态特性而非其绝对值,提供了一种稳健的方法来跟踪生理状态随时间的变化。
生物信号处理中最大的挑战之一是,我们几乎从不同时只听一件事。我们想要的信号被伪影——来自其他生物过程或测量设备本身的不需要信号——所污染。将这些信号分离开来的过程是一种艺术。
有时,我们自己的工具会欺骗我们。想象一下记录前庭诱发肌源性电位 (VEMP),这是一种用于测试内耳功能的微小神经反应。信号通过一个电子高通滤波器以去除缓慢的漂移。实验者可能会注意到,如果他们增加滤波器的截止频率(例如,从 Hz 增加到 Hz),VEMP峰值在时间上出现得更早。他们可能会兴奋地得出结论,他们发现了一种加速神经传导的生理效应。但这个结论是错误的。任何真实世界的、因果的滤波器——一个无法看到未来的滤波器——都不可避免地会给通过它的信号引入一个相移。特别是高通滤波器,会引入一个相位超前,这对应于时间提前。通过改变滤波器的截止频率,实验者改变了其相位响应,并人为地移动了信号的峰值。生物学没有改变;是测量本身造成了变化的假象。这是一个关于理解我们测量链中每个组成部分的重要性的深刻警示故事。
即使是看似良性的处理步骤也可能有意想不到的后果。在神经科学中,记录来自大脑的、被非常缓慢的漂移所污染的电位是很常见的。去除这种漂移的一个标准方法是拟合一个低阶多项式到信号上,然后减去它,这个过程称为去趋势。但是我们应该选择多少阶的多项式呢?一个 阶多项式可能出人意料地灵活;它可以上下摆动,描绘出大约有 个周期的形状。如果我们试图研究某个频率的大脑振荡,并且我们选择了一个过于灵活的多项式,那么去趋势过程将不仅仅是去除缓慢的漂移——它会“拟合掉”我们整个感兴趣的信号,只留下噪声。选择正确的处理参数需要微妙的平衡,并需要对我们工具的数学特性有深刻的理解。
然而,在某些情况下,我们可以更加直接。当我们有多通道记录时,例如多导联ECG,我们可以利用线性代数的力量来“外科手术式”地去除噪声。想象一个噪声源,比如来自电力线的60赫兹嗡嗡声,它污染了所有的ECG导联,但在每个导联中的强度不同但固定。这个噪声在所有可能的传感器读数的高维空间中定义了一个特定的方向。美妙的洞见在于,我们可以使用一个正交变换——本质上是对这个空间的坐标系进行刚性旋转——来将这个噪声方向与其中一个新的坐标轴对齐。在这个旋转后的视图中,所有的噪声现在都被隔离在一个单一的“通道”中。我们可以简单地将这个通道设置为零,然后将坐标系旋转回原始方向。结果就是被清洁的信号,噪声源被完美地去除,这一切都通过吉文斯旋转的纯粹几何学完成 [@problem-id:3236259]。
处理生物信号的最终目标通常是做出决策——诊断疾病、评估治疗或监测一个人的健康。这需要将我们所有的工具集成到复杂的智能系统中。
考虑一个挑战:仅通过测量运动的简单腕带,自动确定一个人的睡眠阶段(例如,浅睡、深睡、快速眼动期)。潜在的睡眠阶段是一个“隐藏”状态;我们无法直接观察它。我们只有一个嘈杂的观测序列——低、中或高运动水平。这是一个非常适合隐马尔可夫模型 (HMM) 的问题。HMM包括在隐藏状态之间转换的概率(例如,从浅睡到深睡的机会)和在给定状态下看到特定观测的概率(例如,在深睡期间观察到低运动的机会)。给定一整夜睡眠的运动数据序列,卓越的维特比算法可以有效地筛选所有可能的隐藏睡眠阶段序列,并找到最可能产生观测数据的那个单一序列。这就是许多消费者睡眠追踪设备背后的原理,为我们睡眠的隐藏结构提供了一个窗口。
我们可以构建更复杂的系统,不仅能解释世界,还能实时适应它。想象一下在运动期间使用可穿戴光学 (PPG) 传感器跟踪一个人的心率。当人跑步时,他们的手臂运动会产生巨大的运动伪影,从而破坏PPG信号,使得测量变得不那么可靠。一个简单的估计器会失败。但一个自适应系统,比如卡尔曼滤波器,可以在运行中学习。卡尔曼滤波器维持着对真实心率的估计以及它如何演变的模型。在每一刻,它都会预测下一个测量值。然后它将这个预测与它接收到的实际的、嘈杂的测量值进行比较。这个差异称为新息。当运动伪影很大时,实际测量值会远离预测值,新息就会很大。滤波器将这种“意外”解释为它的测量噪声模型是错误的证据——噪声显然比它想象的要大。作为回应,它会自动增加其内部对测量噪声协方差 的估计。这使得它减少对嘈杂测量的信任,而更多地依赖于自身的内部预测。当运动停止时,新息再次变小,滤波器减少其对 的估计,再次信任干净的测量值。这是一个通过与数据持续对话来智能地调整自身信心的系统。
这类系统的巅峰是同时融合来自许多不同信号的信息。诊断阻塞性睡眠呼吸暂停 (OSA) 就是一个典型的例子。在一夜的睡眠研究中,医生记录了整个“管弦乐队”的信号:来自鼻子的气流、胸部和腹部带的起伏,以及血液中的氧饱和度。一个稳健的自动化系统必须像一个熟练的临床医生一样,寻找一系列特定的事件。首先,它识别出气流信号的下降。然后,它检查呼吸带。呼吸的努力停止了吗?如果是,那可能是中枢性呼吸暂停。但如果呼吸带显示持续甚至增加的努力,胸部和腹部异相运动(矛盾运动),就像人在对抗阻塞的气道挣扎一样,这是阻塞性事件的强有力证据。最后,作为确认,系统会查看氧气信号,寻找呼吸停止后出现的标志性的、延迟的饱和度下降。通过结合滤波、包络检测、相位分析和一套基于生理学的逻辑规则,该算法可以整合这些多重证据流,从而做出高度准确的诊断。
信号处理的概念是如此基础,以至于它们现在正从传统的时间序列数据扩展到全新的领域。最令人兴奋的前沿之一是空间转录组学,这是一项革命性的技术,使我们能够测量组织内不同位置(如大脑皮层)数千个基因的表达水平。结果不是时间上的信号,而是空间中的数千个“信号”。
这些数据极其丰富,但也充满噪声。我们如何对其进行去噪,同时保留复杂的生物结构,比如由不同基因表达模式定义的皮层不同层次?答案再次来自于调整我们的核心原则。我们可以将空间位置表示为图中的节点,用边连接附近的点。但我们可以使图变得“智能”:每条边的权重不仅可以反映空间邻近性,还可以反映整体基因表达谱的相似性。皮层内部的边将具有高权重,而少数跨越层次之间边界的边将具有低权重。
构建好这个图之后,我们可以使用图拉普拉斯算子的概念来对单个基因的表达图谱进行去噪。图拉普拉斯正则化器作为一种平滑度惩罚,鼓励连接节点上的估计信号值相似。因为一个区域内的边权重很大,所以那里差异的惩罚很高,导致平均化和降噪。但因为跨越区域边界的权重很小,所以基因表达在该边界上发生大跳跃的惩罚很低。因此,该过程在生物学定义的区域内部进行平滑,同时保留了它们之间的清晰、有意义的边界。这是信号处理思想普适性的一个美丽例证——帮助清理嘈杂心跳的相同正则化概念,可以用来揭示大脑的遗传结构。
从在噪声中寻找节拍的简单行为,到在基因组空间景观中导航的复杂任务,生物信号处理提供了一个统一的框架,用于聆听、理解和与生命的机器互动。这是一个数学的优雅与生物学的复杂性相遇的领域,不仅产生了拯救生命的技术,也让我们对我们体内上演的复杂交响乐有了更深的欣赏。