桑格测序工作流程

玻尔百科

定义

桑格测序工作流程是一种基于链终止原理的基因分析方法，通过使用改良的脱氧核糖核苷酸来中止DNA合成。现代流程利用荧光染料标记不同的片段，通过色谱图进行大小排序与识别，并使用 Phred 分值来量化碱基识别的准确性。该流程目前仍是靶向测序的金标准，广泛应用于验证遗传构建体、校验二代测序结果以及临床诊断。

核心要点

桑格测序基于链终止原理，利用修饰过的核苷酸 (ddNTPs) 在特定碱基处中止 DNA 合成。
现代工作流程使用荧光染料对四种 ddNTPs 进行不同标记，从而可以在色谱图中按片段大小排序并通过颜色识别。
数据质量通过 Phred 分数来量化，这是一个表示碱基识别错误概率的对数标度，可实现稳健的数据分析。
它仍然是靶向测序的金标准，对于验证基因构建体、确认 NGS 发现以及在临床诊断中提供确定性至关重要。

引言

科学家们如何读取生命的密码——即定义一个生物体的 A、C、G、T 的精确序列？几十年来，桑格测序一直是这个问题的权威答案。这一奠基性的方法概念优雅，通过提供一种可靠而精确的工具来解读遗传信息，彻底改变了分子生物学。尽管新技术层出不穷，桑格测序依然扮演着至关重要的角色，在无数科学和临床环境中充当着准确性的金标准。但是，这项强大的技术是如何将一条看不见的 DNA 链变成可读文本的呢？

本文将揭开桑格测序工作流程的神秘面纱。在“原理与机制”一章中，我们将剖析巧妙的链终止策略，探索荧光染料和毛细管电泳如何产生可读信号，并理解数据质量是如何被严格量化的。随后，“应用与跨学科联系”一章将阐明为何该方法在验证基因编辑、诊断疾病以及在基因组时代充当最终真理仲裁者方面仍然不可或缺。

原理与机制

想象一下，你正在尝试读一本书，但有一个奇特的障碍：你只能读到每个句子的最后一个字母。你该如何解读全文呢？你可能会尝试一个聪明但带有破坏性的技巧。如果你能制作数千份这一页的副本，并在每个副本上随机地在不同位置中止句子，会怎么样？你会得到一个在第一个字母后结束的副本，另一个在第二个字母后结束的副本，以此类推。通过收集所有这些被中止的句子，并按长度排列，你就可以依次读出每个句子的最后一个字母，从而重建整个页面。这，在本质上，就是桑格测序核心的美妙策略。

巧妙的终止信号：链终止

从核心上讲，DNA 测序是一个受控的复制过程。反应始于 DNA 复制所需的基本要素：单链的 模板 DNA（我们想要读取的文本）、一个与已知位点结合以提供起点的短引物、一种 DNA 聚合酶（抄写员），以及作为 DNA 字母表中四种化学“字母”（A、C、G 和 T）的 脱氧核苷三磷酸 (dNTPs) 供应。

聚合酶通过逐个添加这些 dNTPs，沿着模板移动并构建一条新的互补链。这一化学反应精确得令人惊叹，聚合酶读取模板上的一个字母，然后将相应的字母添加到新链上。此过程的关键在于 dNTP 糖骨架上的一个微小分子手柄：3'-羟基 ( $-OH$ )。这个基团是生长链中下一个核苷酸的连接点。没有它，合成便会停止。

这正是 Frederick Sanger 方法的天才之处。反应中“掺入”了少量化学修饰过的核苷酸，称为 双脱氧核苷三磷酸 (ddNTPs)。这些是“冒名顶替者”。它们看起来与正常的 dNTPs 几乎完全相同，聚合酶也可以将它们整合到生长链中。然而，它们带有一个致命缺陷：缺少了关键的 3'-羟基。一旦一个 ddNTP 被添加，链上就没有了连接下一个字母的“手柄”。聚合酶停止工作。链被终止了。

由于 ddNTP 的掺入是一个随机事件，这个过程在数百万个模板分子上重复进行，从而产生了一个全面的 DNA 片段库。对于序列中的每一个位置，都会有一些片段在此终止。结果是一组嵌套的片段，每个片段比前一个长一个碱基，共同代表了从引物到测序区域末端的所有长度。我们成功地创建了我们的“中止句”集合。现在，我们该如何解读它们呢？

读取彩虹：从片段到荧光峰

在最初的方法中，这是一个繁琐的过程，需要进行四个独立的反应，每个反应中都掺入一种不同的 ddNTP（ddA、ddC、ddG 或 ddT）并使用放射性标记。桑格测序的现代革命，即实现自动化和高通量，是荧光技术的引入——特别是 染料终止子化学法。

在这一优雅的更新中，四种 ddNTPs 分别被标记上一种在激光下发出不同颜色光的荧光染料：例如，绿色代表 'A'，蓝色代表 'C'，黄色代表 'G'，红色代表 'T'。现在，所有组分都可以在一个反应管中混合。随着聚合酶的工作，它会产生同样的一组嵌套片段，但这一次，每个终止的片段都根据其末端字母进行了颜色编码。在 'A' 处停止的片段发出绿光；在 'T' 处停止的片段发出红光。

为了理解这一点为何如此关键，想象一个失败的反应，其中错误地将所有四种 ddNTP 都标记了同一种蓝色染料。链终止仍然会发生，你仍然会得到一套包含所有可能长度的完整片段。但是当你分析它们时，所有产生的信号都会是蓝色的。你会知道每个片段的长度，但你完全不知道末端的碱基是什么。序列信息将完全丢失。染料独特的颜色才是解读密码的信息。

接着，这些带颜色的片段在一个称为 毛细管电泳 的过程中按大小进行分离。混合物被注入一根充满凝胶、细如发丝的毛细管中，并施加电场。由于 DNA 带负电，它会向正极迁移。较短的片段更灵活，能更快地穿过凝胶基质，而较长的片段则会落后。在毛细管的末端附近，激光激发染料，检测器记录下每个片段通过“终点线”时的颜色。

结果是一张美丽且信息丰富的图表，称为 色谱图：一系列随时间变化的彩色峰。最小的片段（在引物后的第一个碱基处终止）最先到达，随后是下一个，再下一个，形成一个完美的队列。颜色的序列直接解读出 DNA 的序列。

一场受控的博彩：概率的交响曲

为了使色谱图在数百个碱基的长度上保持清晰可读，反应必须达到精妙的平衡。这种平衡是一场概率游戏。在每一个位置，聚合酶都面临一个选择：是掺入一个普通的 dNTP 并继续延伸，还是掺入一个 ddNTP 并终止。

这种“选择”的结果取决于 dNTPs 和 ddNTPs 的相对浓度，以及聚合酶自身的偏好。如果 ddNTP 浓度太高，大多数链会过早终止，你将无法读出很长的序列。如果浓度太低，则很少有链会终止，导致信号微弱。因为终止是一个概率性事件，产生一个非常长的片段的机会本身就很低。要形成一个长度为 $N$ 的片段，聚合酶必须连续 $N-1$ 次“选择”掺入常规的 dNTP，然后在第 $N$ 步最终掺入一个 ddNTP。这个概率就像多次抛掷一枚略有偏重的硬币并得到一长串“正面”一样；每次抛掷后，这种可能性都会逐渐降低。

这就是为什么在色谱图中，信号强度（即峰高）会随着片段越来越长而趋于减弱的根本原因。长片段的产量远少于短片段。给定长度的片段数量随着长度的增加以一种可预测的几何级数方式减少。

DNA 聚合酶本身的特性也至关重要。对于桑格测序，我们需要一种特殊的“抄写员”。关键的是，它必须缺乏**校对**活性（也称为 $3'\to5'$ 外切酶活性）。具有校对活性的聚合酶会把掺入的 ddNTP “看作”一个错误并将其移除，从而撤销了我们所依赖的终止事件。使用这样的酶会适得其反，因为它会抹掉我们的终止信号。此外，理想的聚合酶应表现出对 ddNTPs 的低辨别力，从而允许化学家通过调整反应混合物中 ddNTPs 与 dNTPs 的比例来可靠地调控终止概率。

这个过程通常以 循环测序 的形式进行，它类似于聚合酶链式反应 (PCR)，但有两个关键区别。首先，它只使用一个引物，这意味着终止片段的数量是线性增长，而非指数增长。其次，延伸温度通常从 PCR 典型的 $72^{\circ}\mathrm{C}$ 降至 $60^{\circ}\mathrm{C}$ 左右。这有助于聚合酶更均匀地掺入体积庞大的荧光标记 ddNTPs，从而获得更均一的峰高和更好的数据质量。

从曲线到确定性：解读数据

在理想世界中，每个色谱图都应该是一系列完美无瑕、轮廓清晰、间距良好、颜色单一的峰。现实中，生物学和化学是复杂的。有时，起始的 DNA 样本不纯。如果它包含共享相同引物位点的两种不同模板的混合物，测序反应就会在两种模板上同时进行。生成的色谱图在两种模板序列分歧点之前会是干净可读的。在此之后，检测器会在每个位置看到混合的颜色，导致峰重叠、无法读取——这是混合样本的明显特征。

其他时候，问题出在序列本身。由单个碱基重复形成的长链，称为 均聚物（如 A-A-A-A-A-A-A-A），是出了名的难测。聚合酶可能会在这些重复区域上“打滑”，产生的片段无法被清晰地分离开，导致峰图压缩、混乱不堪，无法读取。聪明的化学家们已经开发出一些技巧来解决这个问题，例如针对该特定碱基微调 ddNTP/dNTP 的比例以促使聚合酶读穿该区域，或者使用特殊的变性化学品来防止 DNA 自身折叠。

这就引出了该过程的最后一步，或许也是最深刻的一步：将发光峰的模拟信号转化为带有置信度度量的数字数据。并非所有的碱基判读都具有同等的可信度。一个高耸、尖锐、分离良好的蓝色峰代表一个高置信度的 'C'。而一个短而宽、底下还带有一点绿色的峰则远不那么确定。生物信息学软件会分析每个峰的数十个特征——其高度、宽度、间距以及其他颜色通道中的信号——来计算该碱基判读为错误的概率 $p_{e}$ 。

这个错误概率随后被转换成一个优雅且通用的质量度量标准：Phred 质量分数，或 $Q$ 。其关系是对数关系： $Q = -10 \log_{10}(p_{e})$ 。这个标度非常直观。

$Q$ 值为 10 意味着错误概率为 1/10 ( $p_{e} = 0.1$ )。
$Q$ 值为 20 意味着错误概率为 1/100 ( $p_{e} = 0.01$ )。
$Q$ 值为 30 意味着错误概率为 1/1000 ( $p_{e} = 0.001$ )。

这个分数附加在最终序列文件中的每个碱基上，它不仅仅是一个数字，更是一个经过统计校准的确定性度量。它让科学家能够区分可靠数据和噪音。例如，分析中常见的第一个步骤是修剪掉读长两端信号最弱的低质量区域。通过使用滑动窗口，算法可以找到读长中保持较高平均质量分数的、最长的连续片段，从而确保任何后续的生物学结论都建立在坚实的基础之上。Phred 分数是这个链条上美妙的最后一环，它将化学反应的混乱现实转化为干净、量化、可信的数字信息，为基因组革命提供了动力。

应用与跨学科联系

一项新的科学原理就像一把新钥匙。起初，你可能只用它来打开它被设计用来开启的那把锁。但很快，凭借一点好奇心和创造力，你会发现它可以被打磨、改造，并与其他工具结合，用来开锁、锁门，甚至建造你从未想象过的复杂钟表装置。桑格测序法，尽管其概念优雅简洁，正是这样一把钥匙。它的发明开启了读取生命密码的能力，但其真正的力量在随后的几十年里才得以显现，科学家们将其应用于从实验室工作台到医学前沿，再到我们构建科学知识的根基等一系列惊人的任务中。

尽管今天我们听到了许多关于新一代测序（NGS）——能够以惊人速度读取整个基因组的技术——的奇迹，但将桑格测序视为过时的技术是错误的。如果说 NGS 是一台收割机，能通过将整片田地切成数百万个小碎片来一次性处理，那么桑格测序就是工匠的精密工具。它提供长而极其准确的读长，使其成为验证特定发现和解决那些绝对确定性至关重要的问题时无可争议的“金标准”。它的应用并非古董；它们是一项成熟、可信且不可或缺技术的标志。

根基：验证我们的工作

在最根本的层面上，科学涉及构建事物和检查我们的工作。在分子生物学中，我们构建的“事物”通常是 DNA 分子。想象你是一名基因工程师，试图对一个质粒（一种小环状 DNA）进行精细的手术。你的目标是改变其遗传密码中的一个字母——例如，将一个鸟嘌呤 ( $G$ ) 变成一个腺嘌呤 ( $A$ )。你如何知道你的实验是否成功？你必须回读序列。这是桑格测序最经典、最核心的用途。通过设计一个结合在你目标位点附近的引物，你可以获得 DNA 序列的明确读出结果，从而绝对肯定地确认你得到的是预期的 'A' 还是原来的 'G'。这是任何基因构建项目的最终质量控制。

在 CRISPR-Cas9 等革命性技术时代，这种作为最终真理仲裁者的角色变得更加关键。CRISPR 提供了一把强大的“分子剪刀”，可以在精确位置切割 DNA，但最终序列是由细胞自身的修复机制决定的。这个修复过程通常不完美，会产生微小的、随机的插入或缺失 (indels)。为了验证编辑发生在正确的位置并了解所产生的各种突变，研究人员求助于桑格测序。从经过编辑的细胞群体中扩增目标区域后，得到的测序色谱图在切割位点之后通常看起来“混乱”。这种混乱并非失败，而是一个美丽的成功确认！它表明测序仪正在同时读取许多不同 indel 序列的混合物，为基因编辑按预期工作提供了明确的标志。

探索者的工具：绘制未知领域

除了验证我们自认为已知的事物，桑格测序也是一种卓越的发现工具，让我们能够窥探生物学奥秘，绘制未知领域。

试想一位临床微生物学家正在紧急工作中，试图确定细菌性脑膜炎的病因，这是一种危及生命的脑部感染。患者的脑脊液中可能含有一种未知的致病菌。挑战在于快速找到并识别它。一个绝妙的策略是将 PCR 的广度与桑格测序的精度相结合。首先，使用“广谱” PCR，其引物结合于 $16\text{S}$ 核糖体 RNA 基因，这个基因对细菌生命至关重要，其序列在几乎所有物种中都保守。这充当了一个通用的“这里有细菌吗？”检测器。如果 PCR 呈阳性，意味着存在细菌，但是哪一种呢？答案就在 PCR 产物本身。通过对这个片段进行测序，我们可以读取 $16\text{S}$ 基因的可变区，这些区域充当了每个物种独特的“名牌”。这使得能够快速鉴定常规检测可能漏掉的意外病原体。有时，初步分析暗示存在不止一个元凶，例如在多重微生物感染中。在这些情况下，首先对 PCR 产物进行克隆，确保每个 DNA 分子都被单独测序，从而使医生能够解析出所涉及的每一种病原体的身份。

探索者的精神也延伸到绘制完整基因组图谱这一宏大挑战中。尽管高通量 NGS 方法在生成基因组草图方面表现出色，但它们难以处理高度重复的 DNA 区域。这些重复序列就像一本书中被复制粘贴多次的相同段落。当 NGS 将这本书撕成短句时，拼接软件不知道如何对落在这些重复区域内的片段进行排序，从而在最终的图谱中留下令人沮丧的缺口。这时，桑格测序就来救场了。它能产生长达 800-1000 个碱基对的长读长，使其能够直接读穿整个重复段落，并进入另一侧的独特文本。通过在已知重叠群 (contigs) 的边缘设计引物，研究人员可以“跨越”缺口，生成将基因组拼图拼接成完整、精美杰作所需的远程信息。

临床医生的裁判：高风险的基因诊断

在任何领域，对准确性的要求都没有临床诊断领域那么强烈，因为在这里，一个测序结果就可能影响改变人生的医疗决策。在此，桑格测序不仅仅是一项技术，它是一个旨在提供确定性的、高度受控系统的核心。

想象一对计划生育的夫妇，他们知道自己是某种严重隐性遗传病的携带者。他们选择通过绒毛膜绒毛取样 (CVS) 进行产前诊断，以确定胎儿的基因型。一次误诊将是毁灭性的。实验室面临两大威胁：母体细胞污染 (MCC)，即母亲的 DNA 污染了胎儿样本；以及等位基因脱扣 (ADO)，即胎儿的两个基因拷贝中有一个在 PCR 过程中未能扩增。一个使用桑格测序的稳健工作流程被设计成多层防御体系。首先，精心制备样本以富集胎儿细胞。然后，使用多态性标记 (STRs) 进行独立分析，以量化任何残留的 MCC，确保其低于严格的安全阈值。最后，为防止 ADO，使用不止一对，而是至少两对独立的 PCR 引物来扩增目标基因。只有当 MCC 可以忽略不计且所有测序结果完全一致时，才能做出最终诊断。这不仅仅是测序，这是一个为最大置信度而设计的诊断方案。

对权威仲裁者的这种需求延伸到了我们基因组中一些最复杂的区域，在这些区域，功能性基因与几乎相同但无功能的“邪恶双胞胎”——假基因——并存。像 SMN1/SMN2 位点（与脊髓性肌萎缩症相关）这样的区域，因“基因转换”事件而臭名昭著，即假基因序列的一部分被复制到功能基因中，使其失活。短读长 NGS 可能难以区分这些几乎相同的基因。解决方案通常是进行靶向的长程 PCR，特异性地只扩增功能基因，然后进行桑格测序。这种组合使临床医生能够以无误的准确性读穿真实基因的关键区域，确认是否存在来自假基因的破坏性序列。这是在遗传学险恶地带解决模糊性的终极工具。

档案员的标准：建立持久的知识

如果一项科学发现无法被他人验证、分享和在其基础上继续发展，那么它的价值就微乎其微。在其成熟阶段，桑格测序已经成为我们创建和维护稳健科学知识的基础设施的一部分。

在处理成千上万个样本的大规模测序设施中，标准化是质量的关键。一个巧妙且被广泛采用的策略是将所有 DNA 片段克隆到一个包含通用引物位点（如 M13 序列）的标准载体中。这就像决定在一个大型建筑项目的所有部分都使用相同尺寸的螺钉一样。它极大地简化了工作流程：设施可以购买一大批高度纯化的单一引物，对每个样本使用一套统一、完美优化的反应条件，并减少批次间的差异。此外，由于每个测序读长的第一部分是已知的、恒定的载体序列，它为仪器提供了内置的校准标准，并能即时检查样本混淆或污染。这将测序从一项定制化的手艺提升为一个可靠的工业化过程。

当一个实验室确认了一个新的致病变异时，这一发现如何成为我们集体医学知识中一个永久、可信的部分？答案在于严格的数据存档，遵循确保数据可发现 (Findable)、可访问 (Accessible)、可互操作 (Interoperable) 和可重用 (Reusable) (FAIR) 的原则。一个简单的陈述，如“基因 X 中的 G 到 A 变化”，是不足够的。一个适合像 ClinVar 这样的公共数据库的正式记录，必须包括锚定于特定参考基因组版本（例如 GRCh38）的精确基因组坐标、用于命名的精确转录本版本、用于生成数据的 PCR 引物序列，以及至关重要的——指向原始色谱图文件的链接。这个完整的软件包允许世界上任何地方的任何科学家找到该记录，准确理解结果是如何产生的，重新分析原始数据，并从头开始重现实验。正是通过这个过程，一个简单的实验室观察被转化为一个持久的科学证据。

最后，当像桑格测序这样的技术在受监管的环境中用于临床诊断时，它必须遵守最高的问责标准，受临床实验室改进修正案 (CLIA) 和美国病理学家学会 (CAP) 等机构的管辖。临床实验室必须严格验证其测序分析的各个方面：其对已知样本的准确性、在不同日期和操作员之间的精密度、其分析灵敏度（定义检测嵌合体的极限，通常约为 $15\text{%–}20\text{%}$ 的变异等位基因频率）及其特异性。实验室必须参加定期的能力验证测试——实质上是来自外部机构的评分考试——以证明其持续的能力。每一个程序、结果和纠正措施都必须被 meticulous 记录。这是科学方法向内的应用，一个质量保证的框架，确保该技术是如此可靠和受控，以至于我们可以充满信心地将其输出作为人类健康决策的依据。

从一个简单的检查工作的工具，桑格法已经演变成侦探的放大镜、制图师的笔、外科医生的手术刀和档案员的印章。它的故事证明了一个优雅思想的持久力量，这一力量被几十年来人类智慧围绕它编织的复杂应用、标准和质量体系网络所放大和完善。