try ai
科普
编辑
分享
反馈
  • 无标记技术

无标记技术

SciencePedia玻尔百科
核心要点
  • 无标记技术测量分子和细胞的内在物理性质,消除了由人工标记物引起的伪影。
  • SPR和BLI等方法通过检测质量浓度或光学厚度的变化,实现分子相互作用的实时分析。
  • 无标记蛋白质组学利用质谱技术,无需同位素标记即可对数千种蛋白质进行定量,从而构建“细胞普查”。
  • 相差显微镜和冷冻电子断层扫描等技术能够在天然状态下对活细胞和分子机器进行可视化。
  • 整合多种无标记方法可以对复杂的生物系统进行稳健、多维度的理解。

引言

我们如何才能在不干扰所观察过程的前提下,研究生命复杂的机器呢?几十年来,生物学研究一直依赖于给分子贴上标记物,但这种方法存在一个固有风险:标记物本身可能会改变分子的自然行为,产生掩盖生物学真相的伪影。这一根本性挑战推动了一种精妙替代方案的发展:​​无标记技术​​。这些方法旨在基于分子和细胞的内在物理性质对其进行观察,从而提供一个更真实的生命视角。

本文全面概述了无标记技术的世界。第一章“原理与机制”深入探讨了我们如何在无标记的情况下“看见”和“称量”分子的巧妙物理学原理,探索了检测分子结合、进行细胞蛋白质普查以及对透明细胞成像的方法。第二章“应用与跨学科联系”则展示了这些原理在实践中如何应用,革新了我们对从细胞运动到疾病分子基础等一切事物的理解。通过探索这些技术的理论及其强大应用,您将深刻体会到,遵循自然本身的法则进行观察,如何引向更准确、更深刻的生物学见解。

原理与机制

不加修饰的真相:为何采用无标记方法?

想象一下,你是一位试图研究蜜蜂复杂舞蹈的生物学家。一个合理的初步想法可能是让蜜蜂更容易被看到。也许你可以在它的背上绑一个微小的、颜色鲜艳的旗帜。现在你可以轻松地追踪它了!但一个恼人的问题随之而来:这只蜜蜂的舞蹈是否还和没有这个额外负担时一样?这面旗帜是否改变了它的飞行路径、它与其他蜜蜂的互动,或者它采集花蜜的能力?

这个简单的思想实验概括了​​无标记技术​​背后的全部哲学。在分子和细胞生物学中,几十年来我们一直依赖“标记物”——荧光染料、放射性同位素或重标签——来使我们感兴趣的分子可见。虽然这种方法非常强大,但它始终伴随着一个风险:标记物本身,这个分子的“旗帜”,可能会改变我们希望观察的行为。它可能会阻碍两个蛋白质的相遇,改变分子的形状,或微妙地改变其性质,导致我们测量到的是方法的伪影,而非生物学的真相。

相比之下,无标记方法建立在一个极其精妙的原则之上:我们不再追踪人工标签,而是学会观察分子本身的内在物理性质。我们成为专业的窃听者,倾听分子相互作用或细胞弯曲光线时产生的微弱物理私语。这些技术形式多样,从实时观察蛋白质结合,到对细胞中所有蛋白质进行普查,乃至可视化活体组织的精细结构。它们的共同点是致力于在自然本身的条件下,不加修饰、不加改变地进行观察。为了领会这种方法的精妙之处,将其与复杂的标记方法(如SILAC,即用“重”氨基酸培养细胞;或TMT,即将化学标签附着于肽段)进行对比会很有帮助。这些都是强大的策略,但它们的运作方式是引入一个报告基团。无标记的世界则勇于在没有报告基团的情况下寻找信号。

窃听分子对话:相互作用分析

那么,如果我们不寻找预先附着的标记物,我们到底在寻找什么呢?当分子相遇并结合时,它们的相互作用会产生真实的物理后果。它们可能会释放出一小股热量,或者它们在一个地方的积聚可能会改变光的行为。无标记相互作用分析需要构建极其灵敏的仪器来检测这些微小的变化。让我们来探讨两种最精妙的光学技巧。

表面等离激元共振 (SPR):感受金膜表面的“嗡嗡声”

想象一下能够实时“称量”降落在某个表面上的分子。这就是​​表面等离激元共振 (SPR)​​ 的魔力。其实验装置包含一个置于玻璃棱镜上的金薄膜。你不能随便用任何光照射它。在非常特定的条件下——使用物理学家所称的p偏振光,以一个精确的、超过全内反射临界角入射——奇妙的事情发生了。光的能量被完美地转移到金膜表面的自由电子上,使它们以一种集体的、同步的波形式振荡。这个波就是​​表面等离激元​​。在这个被称为共振角的完美角度上,光被等离激元有效吸收,只有极少量光被反射。

这种共振是一个极其精细的状态。等离激元波由一个​​倏逝场​​产生,该场并不仅仅停留在金膜内,它会“泄漏”到流过表面的溶液中一小段距离。共振所需的确切角度对这个近表面区域的​​折射率​​——本质上是光密度——非常敏感。

技巧在于:我们首先用一种分子(“配体”)包被金膜表面。然后,我们将含有其结合伴侣(“分析物”)的溶液流过表面。当分析物分子与固定的配体结合时,它们在表面积聚。这种蛋白质质量的积聚改变了倏逝场内的局部折射率。精细的平衡被打破,共振所需的角度发生偏移。探测器以极高的精度测量这一偏移。仪器的输出以​​响应单位 (RU)​​ 给出,这只是一个校准过的度量单位,与传感器表面质量浓度的变化成正比。

通过随时间监测RU信号,我们可以观察到整个分子故事的展开。当分析物流过时,我们看到信号随着分子的结合而上升。当我们换回普通缓冲溶液时,我们看到信号随着它们的解离而下降。拟合这些曲线使我们能够计算出结合速率 (konk_{\text{on}}kon​) 和解离速率 (koffk_{\text{off}}koff​),从而获得相互作用的完整动力学图谱——所有这一切都无需任何标记物。

生物膜干涉技术 (BLI):在生物传感器上看到彩虹

​​生物膜干涉技术 (BLI)​​ 是另一种巧妙的光学方法,它通过不同的物理原理实现了类似的目标。想象一下你在肥皂泡表面看到的闪烁的彩虹色。这些颜色源于​​薄膜干涉​​。从皂膜外表面反射的白光与从内表面反射的光发生干涉。根据薄膜的厚度,某些颜色(波长)的光会发生相长干涉(变得更亮),而另一些则发生相消干涉(消失),从而产生多彩的图案。

BLI在微观尺度上运用了完全相同的原理。将一个尖端有两个反射面的光纤生物传感器浸入样品中。第一个是内部参考层,第二个是传感器的外表面,其上包被着我们的配体分子。白光沿光纤向下传输,来自这两个表面的反射光发生干涉。

当溶液中的分析物分子与传感器尖端的配体结合时,它们形成一个新的分子层,增加了外表面的​​光学厚度​​。这种厚度变化改变了两束反射光之间的光程差。结果,干涉图样发生偏移,这意味着发生最强相长干涉的光的特定波长发生了变化。仪器实时检测这种波长偏移。就像SPR中的RU一样,这种偏移与积聚在传感器尖端的质量成正比。也像SPR一样,通过随时间追踪这种偏移,我们生成结合和解离曲线来了解结合动力学。

有趣的是,虽然SPR和BLI都能有效地“称量”分子,但它们对结合事件的不同方面略有不同的敏感性。SPR主要对质量浓度(折射率)的变化敏感,而BLI则直接对物理厚度的变化敏感。这不是矛盾,而是一个机遇。假设通过两种技术测量同一事件,人们可以结合单位面积质量(来自SPR)和厚度(来自BLI)的测量值,来推断其他性质,例如结合分子层的有效密度。这是一个绝佳的例子,说明了不同的物理视角如何能为一个分子事件提供更丰富、更完整的图景。

进行普查:无标记蛋白质组学

​​蛋白质组学​​是鉴定和定量复杂生物样品(如细胞或组织)中所有蛋白质的宏大挑战。无标记方法已成为该领域的基石,使我们能够进行“蛋白质普查”,并观察其在健康与疾病状态之间的变化。

这通常使用​​液相色谱-质谱联用技术 (LC-MS)​​ 完成。在此过程中,复杂的蛋白质混合物首先被消化成称为肽段的较小片段。然后,这些肽段通过色谱法分离,并送入质谱仪。质谱仪测量它们的质荷比,并根据其碎裂模式来识别它们。为实现无标记定量,已出现了两种主要的计算策略。

会计师的账本:基于强度的定量

想象一下,你想测量一个复杂溪流网络中的总水量。一种方法是测量每条溪流的流速并对其随时间积分。这就是​​基于强度的无标记定量 (LFQ)​​ 背后的逻辑。当一个肽段从色谱柱上洗脱出来时,质谱仪测量它产生的离子流。该肽段的总量与这个信号峰的积分面积成正比。

现在,这里有一个微妙之处:并非所有肽段都以相同的“音量歌唱”。由于其化学性质,一些肽段的电离效率比其他肽段更高,因此在相同物质的量下会产生更强的信号。这就是肽段的“响应因子”。然而,对于给定的肽段,只要仪器条件稳定,这个响应因子就是恒定的。因此,通过比较同一肽段在不同样品(例如,样品A与样品B)中的峰面积,我们可以准确地确定其丰度的相对变化。

这种方法以其高精度和宽​​动态范围​​而闻名——它能够测量非常稀有和非常丰富的蛋白质,范围常常跨越四个数量级。它是检测蛋白质水平细微变化的金标准。其主要局限性在于丰度的极高端,此时过多的离子会使检测器饱和,导致信号不再与丰度成正比。

检票员:谱图计数

还有另一种更简单的人口普查方法:​​谱图计数​​。我们不仔细测量每个肽段信号的强度,而只是计算质谱仪成功鉴定每个肽段的次数。在最常用的“数据依赖”模式下,仪器在任何给定时刻扫描最强烈的肽段前体,并选择它们通过碎裂进行鉴定。一个肽段越丰富,其信号就越强烈,在洗脱过程中被选中进行鉴定的次数就越多。

可以把它想象成估算森林中不同鸟类的种群数量。你可能无法数清每一只鸟,但通过记录你发现每个物种的次数,你可以大致了解哪些是常见的,哪些是稀有的。这是一个​​随机抽样​​过程。它的美在于其简单性,但它也具有独特的统计特性。

这种计数过程可以用泊松过程很好地描述,其中方差等于均值。这意味着对于计数很少(例如1、2或3次)的低丰度蛋白质,相对误差巨大,使其成为一种测量稀有分子的嘈杂方法。在另一极端,对于非常丰富的蛋白质,该方法会​​饱和​​。仪器已经在每个可能的循环中选择该肽段进行鉴定。即使其实际丰度加倍,谱图计数也无法增加。这种饱和不是由检测器物理性质引起的,而是方法本身的根本抽样限制所致。由于这些原因,谱图计数最适合用于识别蛋白质丰度的巨大、粗略变化,特别是对于样品中较常见的蛋白质。

从相对到绝对:追求真实数量

一个关键点需要理解,那就是大多数无标记方法本身提供的是相对定量。它们可以告诉你蛋白质X在癌细胞中的丰度是健康细胞的两倍,但它们不能告诉你那个细胞中实际有多少个蛋白质X分子。要得到一个​​绝对数量​​,我们需要一个标尺。

实现这一目标最精妙的方法是使用内标,这是一种称为​​同位素稀释质谱​​的技术。假设我们想计算单个脑突触中PSD-95蛋白的数量——一项看似不可能的任务。我们可以合成少量来自PSD-95的肽段,但在其中用重稳定同位素替换了一些原子。这种“重”肽段在化学上与天然的“轻”肽段相同,但质量略有不同。

我们可以在分析前,将精确已知摩尔量的这种重标准品掺入我们的神经元制备物中。在质谱仪中,仪器既能看到来自突触的轻肽段,也能看到我们添加的重肽段。因为它们在化学上是相同的,我们可以假设它们的飞行和检测效率也相同。因此,它们的峰面积之比等于它们的摩尔量之比。由于我们知道添加的重标准品的量,并且测量了峰面积比,我们就可以计算出内源性轻肽段的精确摩尔量。有了这个数据,再加上样品中的突触数量(通过显微镜得知),我们就可以计算出每个突触的平均蛋白质分子数。这个巧妙的技巧使我们能够将相对的、无标记的测量值转化为绝对的分子计数。

无需着色的观察:无标记成像

无需标记的观察原理延伸到了分子世界之外,进入细胞层面,使我们能够在不染色活细胞的情况下对其进行可视化。我们的眼睛能检测亮度和颜色的差异,但对光波​​相位​​的偏移是盲目的。活细胞主要由水构成,基本上是透明的。然而,其内部结构——细胞核、线粒体、细胞质——具有略微不同的折射率。当光穿过它们时,光波被减慢的程度不同,从而引起相位偏移。

​​相差显微镜​​是一项巧妙的光学发明,它将这些不可见的相位差转换为可见的强度差异。它在聚光镜中使用一个特殊的光阑,在物镜中使用一个“相板”,来操纵穿过样品的光与绕过样品的光。结果是透明物体的高对比度图像,使我们能够实时观察活细胞的爬行、分裂和互动。

但与任何技术一样,它也有其局限性,而这些局限性本身就具有启发意义。相差显微镜的一个关键伪影是物体边缘出现的明亮​​光晕​​。对于载玻片上的单层细胞来说,这是可以处理的。但如果你正在研究一个厚的、致密的样品,比如细菌生物膜,其中有多层细胞堆叠在一起呢?来自你观察平面上方和下方所有失焦细胞的光晕开始重叠。它们会产生一种混淆视听的光学薄雾,完全掩盖了你试图在焦平面内分辨的细胞的精细细节。这揭示了科学中的一个普遍原则:每一种工具,无论多么巧妙,都有其擅长的领域和失效的领域。理解这些边界与理解原理本身同样重要。

应用与跨学科联系

在上一章中,我们揭示了一个统一的原则:无需“描绘”即可观察的艺术。我们学习了物理学家和化学家如何设计出巧妙的方法,根据分子的内在属性来检测它们——它们如何弯曲光线,它们的重量,它们如何散射光子——从而使我们摆脱了附着荧光标签或重标签的需要。这本身就是一个极其精妙的想法,但其真正的力量,其真正的美,并非仅体现在原理中,而在于它让我们能够做什么。

拥有一种新的观察世界的方式,就像获得了一种新的感觉。它开辟了全新的领域,让我们能够提出以前甚至无法构思的问题。因此,让我们踏上探索这些新前沿的旅程。我们将看到这个简单的想法——无标记——如何彻底改变了从细胞生物学到药物发现的各个领域,从而对生命的机器有了更深入、更真实的理解。

观察运动中的无形世界

也许无标记方法最直观的应用是在显微镜学中——一门使不可见之物变得可见的艺术。几个世纪以来,生物学家面临着一个令人沮丧的两难境地。为了看到细胞内部复杂的结构,他们不得不用染料浸泡它。但这些染料通常是毒药,会杀死细胞,将其定格在一幅静态的、毫无生气的肖像中。如果你想观察生命发生的过程呢?

以卑微的变形虫 (Amoeba) 为例。在标准的明场显微镜下,一个活的变形虫就像一个幽灵,一个透明的斑点,几乎与它游泳的水无法区分。它就在那里,但我们的眼睛和显微镜都对它视而不见。这是因为它不吸收太多光线;它主要改变穿过它的光的相位。相差显微镜的原理,一种基础的无标记技术,就是为了解决这个问题而发明的。它用一个巧妙的光学技巧将这些不可见的相位转变为可见的亮度差异。突然之间,这个幽灵变成了一个动态的生物。我们可以看到它的细胞膜在波动,细胞质在流动,伪足在伸出。我们可以观察它爬行、捕食和分裂,所有这一切都无需添加任何一个染色分子。我们在按照生命自己的方式观察它。

这种希望看到事物真实、动态、天然状态的愿望,驱使我们不断挑战可能性的边界。看到整个细胞移动是一回事;观察单个蛋白质分子在细胞表面上舞动,则是另一项令人惊叹的挑战。这就是像干涉散射显微镜 (iSCAT) 这样的现代技术发挥作用的地方。想象一下,尝试测量一个未标记的单个蛋白质在膜上快速移动时的扩散情况,而这个膜本身就是由不同环境(如“液相有序”(LoL_oLo​)和“液相无序”(LdL_dLd​)结构域)组成的拼凑物。这些区域有不同的粘度,就像试图走过一片片水域和一片片蜂蜜。蛋白质的运动告诉我们它所处的局部环境。

但要正确地做到这一点,需要极端的科学严谨性。为此目的设计的iSCAT实验是控制的杰作。为了模拟细胞膜,同时避免真实细胞的复杂性干扰,人们可能会在支撑表面上构建一个模型膜。但表面本身会对蛋白质产生“拖拽”作用,使其减速。因此,一个聪明的生物物理学家会把膜放在一个柔软、含水的聚合物垫上,有效地使其漂浮以最小化这种摩擦力。为了在没有标记的情况下区分“蜂蜜”区域和“水”区域,人们可以利用iSCAT信号本身,因为它对不同区域之间微小的厚度差异很敏感——这个差异首先使用另一种强大技术如原子力显微镜 (AFM) 进行校准。当你最终追踪蛋白质时,你必须对仪器的微小抖动和每个相机帧期间发生的模糊进行数学校正。只有经过这个艰苦的过程,你才能声称测量到了蛋白质的真实扩散。这是一个有力的教训:看到真相往往不仅需要一个巧妙的技巧,还需要对消除每一种可能的误差来源的执着。

当我们试图可视化生命的基本机器时,这种对纯粹视角的追求达到了顶峰。在神经元进行交流的化学突触处,充满神经递质的微小囊泡必须在几分之一秒内与细胞膜对接并融合。这个过程由一组蛋白质机器精心协调,包括像分子拉链一样工作的SNARE复合体和将囊泡固定在原位的系链。这些结构的尺寸极小,大约在 555 到 252525 纳米之间。

几十年来,我们成像这类物体的最佳工具是荧光显微镜。通过“超分辨率”技术,我们可以以大约 151515 纳米的精度定位单个荧光标记的位置。但在这里,我们遇到了一个并非关于分辨率,而是关于标记物本身的障碍。首先,用于附着标记的抗体是一个庞大的分子,尺寸通常在 101010 到 202020 纳米之间。这种“连接误差”意味着标记物并不精确地在蛋白质所在的位置,而是漂浮在附近某处——当标记物与你试图观察的结构一样大时,这是一个致命的缺陷。其次,你无法标记每一个蛋白质;它们排列得太紧密了。这种欠采样意味着你正试图通过几个稀疏且错位的光点来推断一个连续机器的形状。

这就是像冷冻电子断层扫描 (cryo-ET) 这样真正的无标记方法变得具有变革性的地方。通过瞬间快速冷冻突触——将其玻璃化到一种类似玻璃的天然状态——并用电子对其成像,我们可以生成每个分子的三维重建。没有标记物。对比度来自蛋白质本身的内在密度。通过cryo-ET,SNAREs和系链直接显现,它们的形状和排列在其自然栖息地中被揭示出来。我们已经从一幅模糊的、连点成线的漫画,转向了一张直接的、高保真的分子世界照片。

进行分子普查与测量分子拥抱

看到东西在哪里是谜题的一部分。另一部分同样重要,那就是知道那里有什么以及有多少。想象一下,你正在管理一个庞大的工厂(一个细胞),并且想知道它如何应对突发紧急情况,比如热浪。哪些工人被召集?哪些被遣散?这就是定量蛋白质组学的挑战:对细胞中所有蛋白质进行一次完整的普查,并观察它们的水平如何变化。

对此的无标记方法非常简单。使用质谱仪,我们可以从细胞裂解物中鉴定出数千种蛋白质。为了对它们进行定量,一种名为“谱图计数”的方法基于一个简单的前提:蛋白质越丰富,其肽段被机器检测和鉴定的频率就越高。这就像听一场管弦乐:声音最大的乐器是你最常听到的。这种方法的巨大优势在于其简单性。你避免了用重同位素对整个细胞进行代谢标记这一复杂、昂贵且可能具有干扰性的过程。你只是在分析细胞本来的样子。

然而,随着我们变得越来越精细,我们发现需要更精妙的工具。让我们完善一下管弦乐的比喻。谱图计数就像是计算你听到小提琴与大提琴可识别片段的次数。但如果某个特定的乐器,比如短笛,只吹奏几个非常微弱的音符呢?你可能在一次聆听中完全错过它,即使它就在那里。你会数到零,这是一个非常不精确且常常误导人的结果。对于低丰度蛋白质,或像磷酸化这样的罕见修饰,“零值膨胀”是一个主要问题。

一种更先进的无标记方法,称为基于MS1强度的定量,解决了这个问题。它不是计算离散的鉴定“事件”(音乐片段),而是测量每个肽段在流经仪器时随时间变化的总的、连续的信号强度(整个演出中短笛声部的总音量)。对于低丰度分子,这种模拟信号要稳健和精确得多。对于磷酸化蛋白质组学实验,其中关键的磷酸化肽段通常很稀有,这种差异是巨大的。连续强度测量在你得到可靠信号的地方,而谱图计数大多给出零。这说明了测量中的一个美妙原则:信号的性质决定了倾听它的最佳方式。

除了计数分子,我们还想知道它们如何相互作用。这几乎是细胞中所有过程的核心,也是现代药物发现的基础。在寻找新药时,科学家可能会筛选一个包含数千个小“片段”的库,看是否有任何片段与目标蛋白结合。在这里,无标记方法再次变得不可或缺。

表面等离激元共振 (SPR) 是一种技术,它让我们能够实时观察这种分子的“握手”过程。目标蛋白被拴在一个镀金的传感器表面上。当片段流过表面并结合时,它们改变了局域折射率,这被检测为光学信号。通过信号随时间变化的形状,我们不仅可以确定一个片段是否结合,还可以确切地知道它是如何结合的:它结合得多快 (konk_{\text{on}}kon​),解离得多快 (koffk_{\text{off}}koff​),以及其结合力的总体强度(亲和力,KDK_DKD​)。它为你提供了相互作用动力学的完整故事。

但SPR不会告诉你片段结合在蛋白质的哪个位置,或者在拥抱过程中蛋白质的结构发生了什么。为此,你需要另一个无标记工具:X射线晶体学。如果你能让蛋白质-片段复合物形成晶体,你就可以用X射线穿过它,并确定复合物的精确原子结构。这可以揭示,例如,一个片段的结合导致蛋白质中一个关键的“激活环”翻转到一个新位置——这是单独使用SPR无法获得的结构性见解。这两种技术是完美的互补;一个提供了电影,另一个提供了关键时刻的高分辨率照片。

这些方法的实用性也是一个关键考虑因素。有些蛋白质是出了名的脆弱或“害羞”——它们只在非常低的浓度下稳定,如果你试图让它们聚集在一起,它们就会聚集。这使得需要高蛋白浓度的技术,如多种形式的X射线晶体学或等温滴定量热法 (ITC),变得不可能。但正是在这里,其它无标记技术的才华得以闪耀。像SPR、微尺度热泳 (MST) 以及一种称为饱和转移差谱-核磁共振 (STD-NMR) 的核磁共振波谱学形式,都是为在目标蛋白浓度非常低的情况下工作而设计的。它们为研究这些“困难”但通常具有重要治疗价值的分子提供了生命线,打开了否则将紧闭的大门。

宏大综合:从零件列表到生命系统

生物学的最终目标不仅仅是创建零件列表或表征单一相互作用,而是理解所有这些组件如何协同工作,创造一个活生生的、功能正常的系统。这需要一个宏大的综合——在一个严谨、定量的框架中结合不同的技术和数据类型。

考虑一下创建一份完整的“细胞地图”的挑战,将成千上万种蛋白质中的每一种都分配到其正确的细胞器家园——细胞核、线粒体、高尔基体等等。这是空间蛋白质组学的目标。这里的无标记策略既优雅又强大。这个过程始于温和的细胞裂解,试图保持细胞器的完整性。然后,这些细胞器根据它们的物理特性(通常是密度),通过在蔗糖梯度中离心进行分离。这将细胞组分分配到不同的组分中。真正的魔法发生在下一步:定量质谱用于获取每个组分的完整蛋白质普查。一个蛋白质的“地址”不是由单个数据点决定的,而是由其在整个梯度中的定量分布图谱决定的。生活在一起的蛋白质,会一起移动。它们的图谱会聚类。然后,复杂的算法可以利用众所周知的“标记”蛋白质的图谱,为成千上万的其他蛋白质分配地址。但你如何知道这张地图是可信的呢?答案是正交验证。你必须使用完全独立的方法——比如针对特定标记的免疫印迹、酶活性测定,甚至电子显微镜来目视检查组分——以确认你的分离奏效并且细胞器是完整的。这种自我校正和交叉验证是严谨科学的标志。

这种综合的哲学一直延伸到数据分析的数字领域。来自无标记蛋白质组学实验的数据具有与例如RNA测序数据不同的统计“特征”。RNA-seq产生离散计数,而质谱仪产生带有乘性噪声和一种特殊形式缺失值的连续强度,这种缺失值在信号太低而无法检测时出现(左删失)。你不能天真地将相同的统计流程应用于两者。一个恰当的分析需要一个“讲数据语言”的工作流程:应用对数变换来稳定方差,使用明确考虑删失机制的模型,并采用像经验贝叶斯统计这样的方法来在重复次数少的实验中获得统计功效。无标记原则并不止于仪器;它还指导我们必须如何思考它所产生的数字本身。

最终,我们到达了前沿:整合多个独立的证据线索,以解决那些抵制了简单方法的谜题。一个经典的例子是脂筏,一种假设存在于细胞膜中的纳米级区域,富含胆固醇和某些脂质。它是一个真实的、稳定的结构,还是一个短暂的伪影?为了回答这个问题,我们需要同时满足多个标准。我们需要证明一个候选蛋白质不仅在生物化学上与“类脂筏”物质相关,而且它还在活细胞的膜中形成物理的、纳米级的簇。

要解决这个问题,一个真正全面的工作流程将是对技术的巨大整合。一方面,你会在生理温度下对活细胞使用超分辨率成像(如STORM或PALM)来分析内源性蛋白质的空间分布,使用严谨的统计数据来证明聚类并校正任何光学伪影。另一方面,你会使用定量蛋白质组学(如SILAC或TMT)来表明,这些相同的蛋白质在来自非去污剂分离的高密度组分中富集——这是避免伪影的关键控制。至关重要的是,你还应证明这种富集和聚类对胆固醇耗竭敏感。任何一条证据本身都不充分。成像可能显示与脂筏无关的簇,而生物化学分离可以产生人为的聚集体。真正的力量来自于将它们与一个复杂的统计模型相结合,比如贝叶斯框架,该框架正式地将来自显微镜和质谱仪的证据结合起来,并按其各自的不确定性加权。这使你能够计算出每个蛋白质与脂筏关联的后验概率,并控制整个数据集的假发现率。

这就是最前沿的技术水平。我们从仅仅想看一个变形虫开始这段旅程。它带领我们开发了测量分子握手、进行细胞普查和绘制细胞结构的工具。并最终使我们能够将这些 disparate 的观点融合成一个单一的、统计上稳健的复杂生物系统图景。贯穿始终的共同线索是尽可能少地干扰自然进行观察的承诺——这就是无标记方法的简单而深刻的力量。