b离子和y离子：通过串联质谱法进行肽段测序

玻尔百科

核心要点

串联质谱利用碰撞诱导解离 (CID) 可预测地打断肽键，产生称为b离子（包含N端）和y离子（包含C端）的带电碎片。
b离子或y离子“阶梯”中连续离子之间的质量差对应于单个氨基酸的质量，从而使科学家能够读取肽段的序列。
通过分析b离子和y离子阶梯中的质量偏移，研究人员可以精确定位蛋白质上翻译后修饰 (PTM) 的确切位置。
强碱性氨基酸（如Arginine）的位置可以固定电荷，并决定在裂解谱中主要观察到的是b离子还是y离子。
基于标准CID测序的一个关键局限是其无法区分同重氨基酸，例如Leucine和Isoleucine，因为它们的质量相同。

引言

蛋白质是生命的机能机器，由氨基酸序列构成，这些序列如同一种分子语言。解读这种语言——确定蛋白质的一级序列——是现代生物学和医学的核心挑战。但是，我们如何才能读取一条由小到无法看见的分子链书写的信息呢？答案不在于观察完整的分子链，而在于通过一种名为串联质谱的精妙技术，将其逐个拆解的艺术。

本文通过探索其最基本产物——b离子和y离子——的产生和解读，深入探讨了肽段测序的核心。我们将揭示控制性的分子破碎如何让我们能够从其碎片的质量中读取肽段的序列。

首先，在原理与机制一章中，我们将探讨利用碰撞诱导解离 (CID) 将肽段打碎的物理学原理，以及这一过程如何产生互补的b离子和y离子阶梯。您将了解到这些阶梯如何形成一个“质量拼图”，解开这个拼图便能逐步揭示氨基酸序列。然后，我们将转到应用与跨学科联系一章，在这里，这些基本原理将被付诸实践。我们将见证这项技术如何应用于解决复杂的生物学问题，从鉴定与疾病相关的蛋白质修饰到量化蛋白质水平的变化，从而将物理学、化学和医学的世界联系在一起。

原理与机制

想象一下，您发现一条用未知语言写成的信息，刻在一条长而精致的珠链上。要破译它，您不能只看着它。您需要把它逐个拆开，以理解珠子的序列。这就是蛋白质测序的挑战，而我们使用的工具堪称巧夺天工。这种语言就是氨基酸的序列，珠子是单个的氨基酸残基，而链就是肽段。我们拆解它的方法是一种被称为串联质谱的、在分子尺度上进行的可控“暴力”技术。

可控破碎的艺术

在阅读了引言章节后，您现在知道我们想要弄清楚一个肽段的序列。第一步是让单一类型的肽离子在真空中飞行。然后是有趣的部分：我们需要打碎它。但我们不能只是把它砸得粉碎；那就像把我们的珠链信息撕成粉末。我们需要干净利落且可预测地打碎它。

最常见的方法被称为碰撞诱导解离 (CID)。这个名字听起来很复杂，但想法却非常简单。我们将肽离子送入一个充满中性惰性气体（如氩气或氮气）的腔室中。可以把它想象成一场分子台球游戏。肽离子是母球，气体原子是静止的球。当肽离子与气体原子碰撞时，其部分动能会转化为内部分子振动能。肽段开始振动，如果振动得足够剧烈，其最薄弱的连接就会断裂。

如果我们忘记在碰撞室中放入气体，会发生什么？什么都不会发生！肽离子会原封不动地直接飞过，我们的分析器里只剩下未断裂的母离子。这证明了这不是魔法，而是物理。我们需要这些碰撞来“激发”分子并诱导其裂解。

那么，肽链中最薄弱的环节是什么？这种方法的美妙之处在于，对于肽段来说，最脆弱的化学键正是连接氨基酸“珠子”的那些键：构成蛋白质骨架的肽键（ $C-N$ 键）。通过仔细调节碰撞能量，我们可以促使肽段在这些关键的连接点上断裂，而且大多数情况下都是如此。

认识碎片：两个末端的故事

当一个肽键断裂时，链会断成两段。但请记住，质谱仪只能看到和测量带电荷的粒子。原肽段上的单个正电荷（一个质子， $H^+$ ）必须留在两个碎片中的一个上。另一个碎片则变为电中性并漂走，我们的检测器无法看到它。

这便产生了两个互补的碎片家族，它们被赋予了简洁而优雅的名称。

如果包含链的原始“前端”——N端——的碎片保留了电荷，我们称之为b离子。
如果包含链的原始“后端”——C端——的碎片保留了电荷，我们称之为y离子。

这是游戏的基本规则。一次断裂会产生一个潜在的b离子和一个潜在的y离子。我们实际看到哪一个，取决于哪块碎片带走了电荷。

想象一条简单的三珠链，即我们思想实验中的三肽 Ala-Gly-Val。

N-terminus -- [Ala] -- [Gly] -- [Val] -- C-terminus

如果我们在Glycine之后打断肽键，我们会得到两个潜在的碎片：[Ala]-[Gly] 和 [Val]。

如果 [Ala]-[Gly] 保留了电荷，我们将其检测为  $b_2$ 离子（一个由两个残基组成的b离子）。
如果 [Val] 保留了电荷，我们将其检测为  $y_1$ 离子（一个由一个残基组成的y离子）。

通过在每个可能的肽键处打断链，我们可以生成一整个b离子“阶梯”（ $b_1, b_2, b_3, \dots$ ）和一个互补的y离子阶梯（ $y_1, y_2, y_3, \dots$ ）。

质量阶梯：读取密码

测序的魔力就在这里发生。质谱仪本质上是一台极其灵敏的天平。它测量每个离子的质荷比（ $m/z$ ）。对于单电荷离子，这实际上就是它们的质量。

我们来看看b离子阶梯。 $b_1$ 离子就是第一个氨基酸。 $b_2$ 离子是前两个氨基酸的组合。 $b_3$ 离子是前三个，依此类推。在我们的质谱图中， $b_2$ 和 $b_1$ 峰之间的质量差恰好是链中第二个氨基酸的质量。 $b_3$ 和 $b_2$ 之间的差值给出了第三个氨基酸的质量。通过沿着这个“质量阶梯”向上走，我们可以从N端到C端读取氨基酸的序列。

我们可以用y离子阶梯玩同样的游戏，但这次我们是从另一个方向，即从C端向N端读取序列。这是一个优美而逻辑性强的谜题。

这里有一个有趣的转折：假设您决定从能找到的最重的b离子开始分析您的质谱图，然后逐步向下到最轻的。您在做什么呢？对于一个由n个氨基酸组成的肽段，最重的b离子，比如说 $b_{n-1}$ ，几乎包含了整个序列。次轻的 $b_{n-2}$ 则缺少了第 $(n-1)$ 个氨基酸。因此，通过沿着b离子的质量阶梯向下走，您实际上是在反向读取肽段序列，即从C端末端朝向N端起始端。这有点像从最后一章开始倒着读一本书。

质子的舞蹈：为何电荷决定了质谱图

一个引人入胜的问题出现了：为什么我们有时会看到一系列漂亮、完整的y离子，却几乎没有b离子？这一观察揭示了更深层次的化学作用。正电荷——我们的质子——并不仅仅是随机地停留在肽段上。它被最碱性的位点所吸引，通常是像Arginine (Arg)或Lysine (Lys)这类氨基酸的侧链。

如果一个肽段在其C端附近有一个Arginine残基，质子就会被“固定”在那里，被高碱性的侧链紧紧抓住。现在，当肽段骨架断裂时，含有Arginine的碎片极有可能保留质子并保持带电。由于Arginine在C端，这意味着我们将主要看到y离子。N端的碎片（b离子）则没有电荷，变得不可见。

这个原理甚至可以为我们所用。考虑一个带有两个Arginine残基的肽段。如果我们将它电离成二价带电状态， $[M+2H]^{2+}$ ，每个Arginine都会抓住一个质子。两个质子现在都被固定了，没有“可移动的”质子在骨架上游走以促使其断裂。结果就是一个质量差、信号稀疏的裂解谱。

但是，如果我们将它电离成三价带电状态， $[M+3H]^{3+}$ ，会怎么样呢？现在，两个质子仍然被Arginine锁定，但第三个是可移动的！这第三个质子可以在肽段骨架上移动，促进在许多不同位置的断裂。结果是一套更丰富、更完整的碎片离子，使得序列的解读变得容易得多。这是一个杰出的例子，说明了理解其内在化学原理如何让我们能够设计出更好的实验。

难题与局限：当密码模棱两可时

尽管这项技术非常强大，但它并非万无一失。它通过测量质量差异来解读序列。当两种不同的氨基酸“珠子”具有完全相同的质量时，会发生什么？Leucine (L) 和 Isoleucine (I) 就是这种情况。它们是同分异构体，原子相同，只是排列方式不同。

因为标准的CID只打断骨架并测量所得碎片的质量，所以它对这种差异是“盲目”的。任何含有Leucine的b离子或y离子的质量都将与含有Isoleucine的情况完全相同。质量阶梯将是相同的，我们无法将它们区分开来。这是该方法的一个根本局限，提醒我们每一种科学技术都有其边界。

另一个复杂情况来自于不那么“干净”的裂解事件。虽然在肽键处的单次断裂是最常见的，但有时骨架会同时在两个地方断裂。这会产生一个内部碎片——一段来自链中间的部分，既不包含原始的N端也不包含C端。这些碎片不属于整齐的b离子或y离子阶梯。它们在质谱图中表现为不符合规律的额外峰，就像混入了来自不同盒子的拼图块，扰乱了读取序列阶梯这一优雅的过程。

即使存在这些挑战，能够以可控的方式粉碎一个分子，然后从其碎片的质量中重构其身份，仍然是一项意义深远的成就。它将抽象的蛋白质序列转化为图表上一系列切实的峰，让我们能够读取生物机器的语言本身。

应用与跨学科联系

在我们完成了对肽段裂解基本原理的探索之后，您可能会有一种类似于学习国际象棋规则的感觉。您了解棋子的移动方式——b离子如何从一端增长，y离子如何从另一端增长——但您尚未见证可以进行的丰富、复杂而美妙的对局。现在是时候观看实战了。这场离子在真空中破碎和飞行的优雅舞蹈，是如何让我们能够读取生命的语言呢？这些应用不仅仅是技术练习；它们是洞察生物学机器的深刻窗口，将物理学和化学的抽象世界与医学、遗传学和计算科学的现实联系起来。

终极谜题：解读生命蓝图

想象一下，您偶然发现一份用您不认识的语言写成的古老手稿。文本由一个20个字母的字母表构成。您的首要任务就是读取字母的序列。这是蛋白质组学中最根本的挑战：确定肽段的一级序列。串联质谱及其产生的b离子和y离子，便是解读这种语言的罗塞塔石碑。

它是如何工作的呢？把肽段想象成一串珠子，每个珠子是一个具有特定重量的氨基酸。裂解过程在珠子之间打断链条，形成一个碎片“阶梯”。质谱仪测量每个梯级的重量。假设您在b离子系列中有两个相邻的碎片，比如 $b_3$ 和 $b_4$ 。它们之间唯一的区别是第四个氨基酸。因此，它们的质量差 $\Delta m = m(b_4) - m(b_3)$ ，必然是那第四个氨基酸残基的质量！通过测量b离子阶梯（或y离子阶梯）上连续梯级之间的质量差异，我们可以逐个字母地读取序列。这是一个简单原理的美妙而直接的应用。给定一个未知肽段的全套碎片质量，人们可以像拼图一样将序列拼接起来，将质量间隙与20种氨基酸残基的已知质量进行匹配。

寻找自然的注释：翻译后修饰

蛋白质的故事在其序列合成后并未结束。细胞是一个不知疲倦的编辑，不断地为蛋白质添加注释——即所谓的翻译后修饰 (PTMs)。它可能会附上一个磷酸基团作为开/关开关，或者一个糖分子作为地址标签。这些修饰是细胞调控的核心，而疾病往往是注释出错的故事。我们如何在一个巨大的蛋白质分子上找到这些微小的变化呢？

再一次，我们的b离子和y离子阶梯提供了答案。想象一下，我们肽段中的一个氨基酸被修饰了，比如说，增加了一个磷酸基团。这会给那个残基增加一个特定的质量（ $+80$ Da）。现在，我们的碎片离子阶梯会发生什么变化？任何包含被修饰残基的碎片都会重 $80$ Da。任何不包含它的碎片则会具有其正常的、预期的质量。

这非常巧妙。通过观察b系列和y系列中哪些离子的质量发生了偏移，我们可以三角定位修饰的确切位置。如果 $b_1$ 和 $b_2$ 离子正常，但从 $b_3$ 开始的所有b离子都变重了，那么修饰必定在第三个氨基酸上！这个逻辑适用于任何修饰，从磷酸化到N端谷氨酰胺的自发环化，后者会导致特征性的质量损失，使整个b离子系列发生偏移。

这种方法非常精确，可以区分有意的化学修饰和自然的巧合。例如，天冬酰胺向天冬氨酸的转化（脱氨作用）会导致约 $0.984$ Da的质量增加。这与常见的碳-13同位素和碳-12之间的质量差（约 $1.003$ Da）非常接近。没有经验的观察者可能会混淆两者。但裂解分析解决了这个模糊性。如果质量偏移是由于位点特异性的脱氨作用，那么只有包含该特定残基的碎片会发生偏移。如果这是一个随机的天然同位素，重原子的位置将是不可预测的，也就不会出现已偏移和未偏移碎片的清晰分离。模式本身说明了问题。

从“是什么”到“有多少”：定量蛋白质组学

知道细胞中有哪些蛋白质只是成功的一半。要理解健康与疾病，我们需要知道它们的数量。在肿瘤细胞中，一种抑癌蛋白的丰度是否较低？一种关键酶是否因药物反应而过量产生？这就是定量蛋白质组学的领域。

一种名为SILAC（细胞培养中氨基酸稳定同位素标记）的精妙技术让我们能够做到这一点。想象一下，您有两组细胞：“对照”组和“处理”组。您在正常培养基中培养对照细胞。您在一种特殊的培养基中培养处理过的细胞，其中一种特定的氨基酸，比如Arginine，被替换为含有 $^{13}$ C同位素的“重”版本。这种重的Arginine在化学上与正常的完全相同，所以细胞在不知不觉中使用了它。唯一的区别是它重了一个已知的量（例如， $+6$ Da）。

现在，您将两组细胞群的蛋白质混合并进行分析。每一个含有Arginine的肽段在质谱仪中都会显示为一对峰——一个双峰——相隔恰好 $6$ Da。“轻”峰与“重”峰的高度比告诉您该蛋白质在对照组与处理组细胞中的相对丰度。

但是，b离子和y离子在这里也扮演着至关重要的角色。当您裂解一个显示出这种双峰的肽段时，哪些碎片也会是双峰呢？只有那些含有被标记的Arginine残基的碎片！这证实了定量的正确性，并提供了另一层确定性。这是细胞生物学、同位素化学和质谱物理学的奇妙结合。通过碎片离子追踪同位素标记的同样原理，也让科学家能够以前所未有的细节追踪代谢途径和理解蛋白质动力学。

超越线性链：结构线索与计算难题

到目前为止，我们一直将肽段视为简单、柔性的链。但它们的现实更为复杂。例如，氨基酸Proline在结构上是刚性的，会在肽段骨架中形成一个“扭结”。Proline前面的肽键要强得多，在裂解过程中更难断裂。结果是什么？我们的b离子和y离子阶梯中会缺少与这些含Proline位置相对应的梯级。这不是技术的失败！这是新的信息。缺失碎片的特定模式为我们提供了关于肽段局部构象的线索。

对于环肽，一个更有趣的难题出现了，它们形成一个没有N端或C端的闭环。我们整个基于这些末端定义的b离子和y离子框架似乎都失效了。我们能做什么呢？在这里，实验物理学和理论计算机科学的合作前来救场。我们不能直接应用我们的线性模型。所以，我们改变模型。我们可以在计算上于每个可能的键处“切开”环肽，生成所有可能的线性版本集合。然后，我们为每一个虚拟线性肽生成理论上的碎片离子，并看哪一个完整集合与我们的实验数据最匹配。这是一个美丽的例子，说明一个看似棘手的问题如何通过重新定义参照系来解决。

前沿：用方法的交响乐驾驭复杂性

蛋白质组学的世界不断向更复杂的领域推进，糖蛋白的分析就是一个典型的例子。聚糖（Glycans）是附着在蛋白质上的大型、分支的糖结构，它们极其重要，但也极其脆弱——通常比肽段骨架本身还要脆弱。

如果您使用像碰撞诱导解离 (CID) 这样的标准裂解方法，能量的温和级联往往会首先打断脆弱的糖苷键。糖就像秋叶一样脱落，这对于告诉您有哪些糖类很有用，但您会失去用于测序和了解聚糖附着位置所需的肽段骨架裂解信息。

为了解决这个问题，科学家们开发了一系列巧妙的裂解技术。其中一种方法，电子转移解离 (ETD)，是完全不同的。它涉及将一个电子转移到肽段上，这会引发一个由自由基驱动的、沿着骨架裂解成c离子和z离子的过程。这个过程就像一次精准的空手道劈砍——速度如此之快，以至于精细的聚糖修饰在产生的碎片上通常能保持完全完整。因此，ETD非常适合精确定位聚糖的确切位置。

目前最先进的技术通常是一种混合方法。例如，EThcD结合了两者的优点：一个初始的ETD步骤提供用于定位修饰的c离子和z离子，随后是一个碰撞激活（HCD）步骤，该步骤裂解所有物质——包括完整的聚糖——以揭示其组成。这是一场方法的交响乐，每种方法都旨在提出一个不同的问题，协同工作以破译自然界所能提供的最复杂的分子结构。

从一个简单的原理——打断一条链并称量其碎片——我们建立了一座触及现代生物学几乎每一个角落的知识大厦。这证明了一个事实，即在科学中，最深刻的洞见往往来自于用一种新的方式看待世界，并提问：“如果我能把它拆开，看看这些碎片，我能学到什么？”