配体的指数富集系统进化技术

玻尔百科

定义

配体的指数富集系统进化技术是一种模拟达尔文进化过程的分子生物学实验室方法，用于从巨大的随机文库中筛选被称为适配体的特定 DNA 或 RNA 分子。该过程通过结合、分离和扩增的循环迭代，实现高亲和力序列的指数级富集，产生的适配体可作为具有高化学稳定性的合成抗体。此技术广泛应用于临床诊断、靶向治疗及合成生物学等领域，并可通过 Cell-SELEX 等进阶技术在自然细胞环境中筛选靶点。

核心要点

SELEX是一种模拟达尔文进化的实验室方法，用于从一个巨大的随机文库中分离出称为适配体的特异性DNA或RNA分子。
该过程依赖于与靶标结合、分离以及扩增成功结合分子的迭代循环，从而实现高亲和力序列的指数富集。
适配体作为“合成抗体”，在化学稳定性、成本效益高的合成以及靶向非免疫原性分子的能力方面具有优势。
诸如Cell-SELEX等先进技术能够在天然细胞环境中发现针对靶标的适配体，从而增加了其生物学相关性。
SELEX的应用非常广泛，涵盖诊断学、靶向治疗、解析基因调控以及构建合成生物学的功能组件。

引言

如果我们可以驾驭进化的力量，将数百万年的自然选择压缩到试管中的短短几天，会怎样？这不是科幻小说，而是一项名为“配体的指数富集系统进化技术”（Systematic Evolution of Ligands by Exponential Enrichment，简称SELEX）的强大技术的现实。SELEX的核心在于解决生物学和医学中的一个根本性挑战：需要找到能够以极高精确度与特定靶标——无论是致病蛋白还是细胞标记物——结合的分子。虽然自然界提供了抗体，但制造抗体的过程可能缓慢且昂贵，而且它们并非对所有靶标都有效。SELEX提供了一种革命性的替代方案，通过从头进化出定制设计的DNA或RNA结合分子，即适配体。

本文探讨了该方法的精妙原理和开创性应用。我们将首先深入探讨SELEX的“原理与机制”，剖析其逐步过程，看少数功能性分子如何从一个包含数万亿分子的文库中脱颖而出。我们将研究多样性、选择和扩增如何协同作用以实现指数富集。随后，“应用与跨学科联系”部分将展示这些进化出的分子如何彻底改变从诊断和治疗到基因调控基础研究以及合成生物学中新型装置构建等多个领域。

原理与机制

试管中的进化

想象一下，你有一把锁，但钥匙丢了。取而代之的是，你得到一个巨大的钥匙串，上面不是几十把，而是 $10^{15}$ ——一千万亿——把随机切割的钥匙。你的任务是找到那把能开锁的钥匙。你会怎么做？你可以一把一把地试，但这会比宇宙的年龄还要长。一定有更好的办法。

如果你可以一次性尝试所有钥匙，并且任何一把能在锁里稍微晃动的钥匙都能被识别出来呢？然后，如果你能把那些“还不错”的钥匙，为每把制造数百万个副本，并在副本中引入一些随机错误，再重复这个过程呢？在第一轮中，你可能会找到几乎能插入锁孔的钥匙。在下一轮，你会找到那些钥匙的副本中能稍微转动一点的。再经过几轮这样的“选择与扩增”，你几乎肯定能得到一把完美打开这把锁的钥匙。你实际上已经进化出了一把钥匙。

这正是配体的指数富集系统进化技术（SELEX）背后的思路。这是达尔文进化论——适者生存——的体现，只不过不是在非洲大草原上经历数千年，而是在试管中进行几天。其目标不是进化出更快的猎豹，而是发现一个能以极高精度与特定靶标结合的分子。这些分子“钥匙”被称为适配体，它们是短的单链DNA或RNA片段。

起点：一个充满可能性的文库

每个进化过程都需要一个充满多样性的起始种群。对于SELEX来说，这是一个合成的核酸文库。想象一个由短DNA或RNA分子组成的庞大集合。每一个分子都具有相同的结构：中间是一段随机核苷酸区域（比如40个碱基长），两侧是两个恒定区域。

随机区域是多样性的核心所在，也是奇迹发生的地方。在40个位置中的每一个位置上都有四种可能的核苷酸碱基（A、T、C、G），因此可能存在的独特序列总数为 $4^{40}$ 。这个数字惊人——大约是 $1.2 \times 10^{24}$ ，比可观测宇宙中估计的恒星数量还多。即使是一个包含 $10^{15}$ 个不同分子的“大型”实验室文库，也仅仅是这个巨大“序列空间”中一个微不足道的小样本——就像从太平洋中舀起一小勺水一样。

那么，如果我们只采样了极小的一部分，又何必费心呢？秘密在于，我们不需要在所有 $10^{24}$ 种可能性中找到唯一最佳的序列。我们只需要找到少数“足够好”的序列来启动进化过程。计算表明，即使一个高亲和力结合分子的出现概率极低，仅为每 $10^{14}$ 个随机序列中出现一次，一个包含 $10^{14}$ 个分子的起始文库也有超过60%的机会至少包含一个这样的序列。如果频率稍高一些，比如每 $10^{12}$ 个中出现一个，那么找到它几乎是必然的。我们只需要一个立足点，剩下的交给进化。

两端的恒定区域起到了“把手”的作用。它们在文库中的每个分子上都是相同的，并作为聚合酶链式反应（PCR）所用酶的结合位点，PCR是我们稍后将讨论的扩增引擎。

选择的引擎：结合与分离

SELEX过程是一个由四个关键步骤组成的循环，周而复始：结合、分离、洗脱和扩增。

结合： 将整个核酸分子文库与目标物质——蛋白质、小分子药物，甚至病毒——混合。通常像松软绳索的单链RNA或DNA分子会根据其独特序列折叠成复杂的三维形状。其中一些形状，纯属偶然，会完美地契合靶标分子表面的某个缝隙。它们会黏附上去。这种“黏性”通过解离常数（ $K_d$ ）来量化，该常数衡量适配体与靶标结合后分离的难易程度。较低的 $K_d$ 值意味着更紧密、更稳定的结合——即更好的匹配。
分离： 这是关键时刻，是选择过程中最至关重要的一步。在给分子足够时间结合后，进行洗涤。未结合或结合微弱的分子被洗去并丢弃。与靶标形成牢固结合的分子则留了下来。这就是“生存”事件。想象一下，靶标被粘在试管底部；分离步骤就是简单地倒掉液体，只留下粘附在靶标上的“胜利者”。
洗脱： 现在你需要收集你的胜利者。你改变条件——也许通过改变pH值或温度——来迫使结合的分子与靶标分离。然后将它们收集到干净的溶液中。这个分子池不再是随机的；它富集了对靶标具有一定亲和力的序列。
扩增： 这是“繁殖”步骤。通过聚合酶链式反应（PCR），将筛选存活下来的少数分子扩增成数十亿个拷贝。这一步至关重要。它确保了上一轮成功的序列成为下一轮种群的主导部分，为进化提供了坚实的基础。

然后，这个四步循环会重复进行。第一轮扩增后的产物池成为第二轮的起始文库。在第二轮中，这些已经“相当不错”的结合分子相互竞争，只有其中最优秀的才能在（通常更严格的）洗涤步骤中存活下来。

指数富集的力量

SELEX的名称中包含“指数富集”这个短语，这是有充分理由的。这个过程不仅是选择性的；它具有强大的、指数级的选择性。

让我们在一个简化的情景中看看数字。假设在我们的分离步骤中，我们成功保留了20%的真正结合分子（ $E_b = 0.20$ ），但同时也意外地保留了极小一部分非特异性滞留的非结合分子，比如0.001%（ $E_{ns} = 1.0 \times 10^{-5}$ ）。在单一一轮中，结合分子与非结合分子的比例将增加一个因子 $\frac{E_b}{E_{ns}}$ ，在本例中即为 $\frac{0.20}{1.0 \times 10^{-5}} = 20,000$ 倍！。

这意味着，如果你从一个百万分之一的分子是结合分子的文库开始，仅经过一轮，这个比例就会提高到每50个非结合分子中有一个结合分子。经过第二轮后，结合分子的比例将再增加20,000倍，此时分子池中将有超过99%是纯的结合分子。这就是为什么SELEX仅需几轮循环就能从数万亿个无用分子中筛选出少数珍宝的惊人力量所在。

我们实际上可以在实验室中观察到这种富集过程。通过一种称为电泳迁移率变动分析（EMSA）的技术，我们可以将自由漂浮的DNA与已结合到我们靶蛋白上的DNA分离开。蛋白质-DNA复合物更重、更庞大，因此它们在凝胶中移动得更慢。当我们分析连续几轮SELEX的样品时，我们会看到代表结合DNA的“迁移”条带变得越来越亮，这为我们的种群正朝着更高亲和力进化提供了优美的视觉证明。

筛选的艺术：特异性与反向筛选

找到一把能开我们锁的钥匙是一回事，确保它不会也打开街区里所有其他的门则是另一回事。在分子术语中，我们既要高亲和力，也要高特异性。一个优秀的适配体能够牢固地与其靶标结合，而忽略其他一切。

然而，最简单的SELEX实验只筛选结合能力。它不关心胜出的适配体是否也与试管的塑料壁或复杂生物样品中的其他蛋白质结合。这可能导致“交叉反应”的结合分子的富集，而这些分子并不十分有用。

为了解决这个问题，科学家们为这个过程增加了一个巧妙的转折：负向筛选，或反向筛选。在将文库暴露于真正的靶标之前，他们首先将其暴露于一个他们不希望适配体结合的表面或分子上。在此步骤中任何黏附的分子都会被丢弃。只有那些保持未结合状态的分子才被允许进入与实际靶标进行的正向筛选步骤。

这种反向筛选的时机是SELEX“艺术”的关键部分。如果等待的轮次太多，一个亲和力高但滥结合的分子可能已经占据了整个种群，使其难以被清除。通过从早期开始并在每一轮都应用负向筛选，你从一开始就引导进化去寻找那些不仅黏性强，而且有辨别能力的分子。

选择战场：靶标至关重要

环境塑造进化，而在SELEX中，“环境”就是靶标以及结合发生的条件。SELEX的一个绝妙之处在于，这个环境可以被量身定制，以找到几乎能完成任何可以想象的任务的适配体。

经典方法，蛋白-SELEX，使用固定在合成微珠上的纯化蛋白。这是一个干净、受控的系统，但它是人为的。试管中的蛋白质可能与其在自然家园——拥挤、动态的活细胞表面——中的形状或行为不同。

这促使了Cell-SELEX的发展，这是一个更为复杂的实验版本，其靶标是位于完整活细胞表面、处于天然状态的蛋白质[@problem-id:5093758]。这种战场的改变引入了引人入胜的新选择压力：

天然环境： 适配体必须识别蛋白质真实存在的状态，包括其正确的折叠、附着在其上的任何糖分子（糖萼）以及其脂质邻居。这使得可以发现那些能识别具有生物学相关性、依赖于环境的表位的适配体，而这些表位在纯化蛋白中可能完全不存在。
亲合力： 细胞表面的蛋白质并非静止不动；它们像海中的浮标一样四处漂移。这种流动性带来了一种称为亲合力的强大效应。一个与某个受体结合然后解离的适配体可能不会漂走，而是迅速找到并重新结合到邻近的受体上。这极大地增加了表观黏性，并偏好那些能够识别受体模式或簇的适配体。
细胞动力学： 细胞是活的！适配体的结合可能导致细胞做出反应，例如将受体拉入细胞内部（一个称为内吞作用的过程）。这也成为选择的一部分。如果实验设计为收集停留在表面的适配体，它将自动筛选掉任何会触发快速内化的适配体。

为何如此大费周章？“合成抗体”

这个复杂过程的最终目标是创造一类新分子，它们可以与自然界自身的首要结合剂——抗体——相媲美。几十年来，抗体一直是诊断和治疗的金标准。然而，适配体提供了一系列源于其化学性质的引人注目的优势。

抗体是蛋白质，在复杂的活细胞培养物中生产。这个过程昂贵，且可能导致批次之间存在细微差异。而适配体，一旦其序列已知，就不是在细胞中制造，而是在机器中通过自动化化学合成来制造。这个过程更便宜、更快，并且每次都能生产出化学纯净、定义完美的产物。

此外，DNA和RNA本质上是比蛋白质更稳定的分子。它们可以承受高温和恶劣条件，而这些条件会导致抗体变性并失去功能。这使得适配体非常适合像无需冷藏的现场诊断测试等应用。最后，SELEX可用于生成针对有毒或非免疫原性靶标的结合分子——这些靶标很难或不可能用传统方法产生抗体。

通过利用进化的基本原理——多样性、选择和扩增——SELEX使我们能够在分子尺度上引导自然的创造力。它完美地展示了对生物学和化学的深刻理解如何使我们能够设计和发现定制分子，创造出一套新的“合成抗体”工具包来诊断和治疗疾病。

应用与跨学科联系

掌握了SELEX的精妙机制后，我们现在正站在一个充满可能性的新世界的门槛上。这个过程远不止是一个巧妙的实验室技巧；它是一种驾驭进化真正引擎的方法，将其巨大的创造力在试管中付诸实践。它允许我们直接向分子世界提问，并通过选择与扩增的迭代循环，让分子自身进化出答案。这一原则呼应了生命起源的宏大叙事，即简单、功能性的分子可能最早从混乱的原始汤中出现，我们现在可以在实验室中令人信服地模拟这一情景。让我们踏上征程，看看这个强大的思想如何分支，连接迥然不同的科学领域，并为我们提供曾经属于科幻小说范畴的工具。

分子间谍与可编程医学

SELEX最直接和最具革命性的应用或许在于创造适配体——定制设计的RNA或DNA分子，它们能以惊人的特异性和亲和力与几乎任何靶标结合。可以把适配体想象成一名分子间谍，被训练在数百万人口的城市中找到某一个人。我们可以从一个包含比我们银河系中恒星还多的序列的文库开始——一个像 $10^{15}$ 这样的惊人数字——在这个分子混沌中，我们可以找到那个完美识别我们靶标的分子。

其魔力在于“指数富集”。在每一轮中，我们奖励那些与我们的靶标结合的分子，即使最初结合很弱。然后我们扩增这些成功的少数派。即使是结合上的微小优势——一个稍微好一点的匹配——经过几轮循环后也会转化为巨大的数量优势。在适当条件下，一个解离常数（ $K_d$ ）为 $5\,\text{nM}$ 的分子在一轮筛选中将比一个 $K_d$ 为 $500\,\text{nM}$ 的竞争者富集十倍。仅仅几轮之后，那个优越分子的后代就能主导整个种群。这种从近乎无限的化学空间中提炼出完美结合分子的能力是SELEX力量的核心。

我们能用这些分子间谍做什么呢？

首先，它们可以在诊断领域充当“哨兵”。可以设计一个适配体来结合病毒蛋白、癌症生物标志物，甚至是患者血液样本中的抗生素等小分子。通过在适配体上附加一个荧光标签，我们可以创造一个仅在靶标存在时才会发光的传感器，从而提供清晰快速的诊断信号。

其次，这些间谍可以成为战士。在治疗领域，适配体提供了两种绝佳的策略。它们可以充当拮抗剂，即适配体与一个关键蛋白结合得如此紧密，以至于物理上阻断了其功能。例如，一个靶向血管内皮生长因子（VEGF）——一种促进肿瘤生长的蛋白质——的适配体可以关闭癌症中的一个关键通路，这一原理已经催生了已获批的药物[@problemid:2336851]。或者，适配体可以用作递送配体。通过将治疗载荷——一种强效药物或一种基因沉默RNA——附加到一个能识别癌细胞独有蛋白质的适配体上，我们可以创造出一种“智能炸弹”，它只将货物递送到病变组织，从而保护健康细胞。

破译细胞的语言

SELEX的用途远不止于创造新的结合分子。它可以被转向内部，用作一种分子世界的“罗塞塔石碑”来破译细胞现有的语言。基因组是一部庞大的指令文库，而称为转录因子的蛋白质则是决定哪些书（基因）被阅读的图书管理员。每个转录因子都能识别一个特定的DNA序列，即其“结合基序”。但是，对于一个新发现的因子，我们如何弄清楚那个序列是什么呢？

我们可以直接问这个蛋白质。通过向一个转录因子提供一个包含所有可能短DNA序列的文库，SELEX可以告诉我们它与哪些序列结合。经过几轮筛选后，富集的序列揭示出一个共有模式，即该因子的首选结合基序。我们甚至可以量化这个基序的“信息含量”，用比特（bits）来衡量该蛋白在其序列每个位置上偏好的特异性程度。

这种方法使我们能够探究基因调控的精细语法。例如：

团队合作的力量： 许多转录因子，如关键的发育蛋白HOX，是团队合作的。单个HOX蛋白可能弱结合于一个类似TAAT的序列，但当它与PBX和MEIS等辅助因子合作时，整个复合物就获得了识别一个更长、更特异的复合位点（如TGATNNAT）的能力。利用SELEX，我们可以比较单个蛋白与复合物的结合偏好，从而精确地描绘出协同性如何增强DNA特异性，并构建出胚胎发育的复杂逻辑。
解读表观遗传密码： DNA字母表上还有一层标点符号。表观遗传标记，如CpG二核苷酸处胞嘧啶碱基的甲基化，可以在不改变基因序列的情况下改变其含义。通过使用一种称为甲基-SELEX的改良技术，我们可以研究这种标点符号如何影响读取。我们可以发现那些甲基化敏感（被标记排斥）、甲基化耐受（对其无动于衷）甚至甲基化偏好（被其吸引）的转录因子。这揭示了一个深刻的调控层面，解释了增强子——基因的关键控制面板——如何根据局部表观遗传图景在不同细胞类型中具有不同的活性[@problem_-id:2941912]。

工程生命：合成生物学的艺术

一旦我们理解了生命的语言，我们就可以开始书写自己的语言。这就是合成生物学的领域，SELEX为构建新型分子机器提供了零件。其中最精巧的设计之一就是核糖开关。

核糖开关是RNA工程的杰作——一个既是传感器又是执行器的单分子。它包含一个适配体域（传感器），该域是利用SELEX进化出来以结合特定小分子的。这个适配体被巧妙地融合到一个表达平台（执行器）上，该平台控制着一个基因。整个系统是热力学和动力学的精妙平衡。

假设我们想构建一个在特定代谢物存在时能开启一个基因的开关。设计过程是一个真正的工程挑战。首先，我们使用SELEX进化出一个解离常数（ $K_d$ ）与我们靶标代谢物的生理浓度完美匹配的适配体。如果亲和力太高，开关会卡在开启状态；太低，则永远不会激活。然后，我们必须将这个适配体嵌入到一个更大的RNA结构中，该结构包含两种互斥的折叠形式：一种是终止基因表达的“终止子”发夹结构（关闭状态），另一种是允许基因表达继续的“抗终止子”（开启状态）。自由能必须被精确平衡，使得在没有配体的情况下，终止子结构更稳定。配体与适配体的结合则必须提供恰到好处的能量，以将结构翻转成抗终止子构象。整个折叠决策必须在RNA合成后、聚合酶移动离开之前的几分之一秒内完成。这是一个程序化分子自组装的惊人范例。

一个统一的原则

从用催化性核酶探索生命的黎明，到设计医学和合成生物学的未来，配体的指数富集系统进化技术这一原则是一条统一的主线。它证明了一个简单思想的力量：选择，加上扩增，是宇宙中最强大的设计算法。通过将其引入实验室，我们获得了前所未有的能力来阅读、书写和重新设计生命密码，揭示其内在之美，并为人类一些最紧迫的挑战提供解决方案。