基于片段的先导化合物发现 (FBLD)

玻尔百科

定义

基于片段的先导化合物发现 (FBLD) 是一种高效的药物设计策略，该方法通过使用简单的小分子片段作为起点来探索广阔的化学空间。这种药物化学方法利用灵敏的生物物理技术和结构生物学指导片段进行理性演化，通过增长或连接策略将其开发为强效的先导化合物。基于片段的先导化合物发现 (FBLD) 侧重于配体效率并针对分子热点进行设计，为攻克包括蛋白质-蛋白质相互作用在内的难成药靶点提供了强有力的手段。

核心要点

FBLD 通过使用微小、简单的分子（片段）作为药物设计的起点，高效地探索广阔的化学空间。
该方法通过灵敏的生物物理技术检测微弱的片段结合，优先考虑相互作用的质量（配体效率）而非原始的结合强度。
结构生物学提供原子级别的蓝图，指导片段通过生长和连接等策略合理地演化为高效的先导化合物。
通过靶向微小的“热点”，FBLD 为攻克包括曾被视为“不可成药”的蛋白质-蛋白质相互作用在内的困难靶点提供了强有力的策略。

引言

现代药物发现面临着一个巨大的挑战：在近乎无限的“化学空间”中航行，以找到一个能够治疗疾病的单一分子。尽管传统方法测试庞大的大分子库，但这种方法通常效率低下，且对潜在解决方案的覆盖稀疏。基于片段的先导化合物发现 (FBLD) 带来了一场范式转变，提供了一种更合理、高效和巧妙的策略。FBLD 并非寻找一个成品，而是识别微小的分子“片段”作为高质量的起点，并逐一地用它们构建出高效的药物。本文旨在作为这项强大技术的指南，详细介绍其理论基础和实际操作。

旅程始于原理与机制部分，我们将在其中解构 FBLD 的核心逻辑。我们将探讨该方法如何更有效地采样化学空间，用于检测片段微弱相互作用的灵敏生物物理技术，以及指导化学家选择最有前途的构建模块的关键概念——配体效率。随后，文章将过渡到应用与跨学科联系部分，展示这些原理在现实世界中的应用。我们将探讨将一个片段命中物转化为可行的药物先导化合物所需的化学、生物学和计算领域的协作努力，并特别关注其在攻克先前“不可成药”靶点方面的成功。

原理与机制

要真正领会基于片段的先导化合物发现 (FBLD) 的艺术，我们必须抛弃一些关于寻找新药的传统观念。这不是一场寻找恰好能配上一把锁的单一神奇钥匙的寻宝游戏。它更像是成为一名建筑大师，得到一盒制作精美的基本构建模块和一座宫殿的蓝图。任务不是找到一座建成的宫殿，而是发现哪些模块能完美地嵌入地基，然后凭借技巧和洞察力，用它们建造出整个结构。

化学空间的新地图

想象一下所有可能的类药分子的宇宙。这就是化学家所称的化学空间，其规模惊人——比我们银河系中的恒星数量还要多。传统的药物发现方法，即高通量筛选 (HTS)，试图通过测试庞大的化合物库来探索这个空间，这些库通常包含数百万个大型、复杂、“预制”的分子，希望能找到一个有效的分子。这就像在一个国家里搜寻每一栋房子以找到适合你的那一栋。你覆盖了很大的范围，但你的搜索最终是稀疏的；你只能看到那些已经建好的房子。

FBLD 采用了一种根本不同，且在许多方面更为巧妙的方法。你可能不是从一个包含一百万个复杂分子的库开始，而是从仅仅几千个非常微小、简单的被称为片段的分子开始。这怎么可能更好呢？魔力在于组合。如果你有一套 2000 个独特的构建模块（片段），理论上仅通过组合其中三个就可以构建出数量巨大的独特结构。一个简单的计算表明，从一个包含 2000 个片段的小型库中，你可以生成超过十亿种不同的组合。从简单的片段开始，你不仅仅是在采样化学空间，你是在装备自己以便在其中进行构建。你通过了解仅仅几种砖块的特性，来探索十亿栋房子的潜力。这是效率上的一次深刻飞跃，让科学家能用一小部分资源探索远为丰富的化学空间区域。

聆听低语的艺术

当然，这种效率是有代价的。因为片段非常小，它们与靶蛋白形成的连接不多。因此，它们的结合几乎总是极其微弱的。传统 HTS 筛选的命中物可能以纳摩尔 ( $10^{-9}\ \text{M}$ ) 到低微摩尔 ( $10^{-6}\ \text{M}$ ) 的亲和力结合，而一个片段命中物通常的结合亲和力范围在高微摩尔到甚至毫摩尔 ( $10^{-3}\ \text{M}$ ) 之间。这通常要弱上一千到一万倍。这种相互作用不是一声呐喊，而是一声低语。

这带来了一个精妙的技术挑战：你如何可靠地检测到如此微弱的相互作用？大多数传统的生物学检测方法测量的是蛋白质功能上的变化——例如，其酶活性的降低。但是，一个仅仅微弱地“搔痒”蛋白质的片段，可能不足以改变其功能以产生一个能与检测背景噪音区分开的信号。

解决方案是改变你所“听”的对象。你不再试图去听结合的后果，而是使用灵敏的生物物理技术来检测结合这一物理行为本身。像核磁共振 (NMR) 光谱学这样的方法可以追踪溶液中的片段，观察哪些片段的速度变慢了，就好像它们停下来与大得多的蛋白质相互作用一样。表面等离子共振 (SPR) 就像一台极其灵敏的天平，当片段附着在涂有靶蛋白的表面上时，它可以检测到微小的质量变化。

这些强大的方法伴随着一个关键要求。为了观察到微弱的相互作用，你必须通过加入大量的片段来推动化学平衡。有片段结合的蛋白质分子的比例，我们可以称之为 $\theta$ ，由公式 $\theta = \frac{[L]}{K_d + [L]}$ 给出，其中 $[L]$ 是片段浓度， $K_d$ 是解离常数（衡量结合弱度的指标）。要获得可检测的信号，你需要有相当比例的蛋白质被结合，而由于片段的 $K_d$ 值非常大，你必须使用非常高的浓度 $[L]$ 。这直接导致了任何片段库都必须具备的一个不容商榷的特性：化合物必须具有高的水溶性。如果它们在水中的溶解性不好，你就根本无法达到听到它们“低语”所需的浓度。

设计完美的砖块：三原则

什么才是一个好的片段？它并非任何小分子都可以。经过多年的实践，化学家们制定了一套被称为三原则 (Rule of Three) 的指导方针。它不是一条僵硬的物理定律，而是一条为设计完美分子“砖块”而设的优雅经验法则。其核心原则是：

分子量 ( $MW$ ) $\le 300$ 道尔顿：这确保了片段足够小，为以后增加复杂性留下了充足的空间，而不会使最终分子变得过大和“不可成药”。
分配系数的对数 ( $c\log P$ ) $\le 3$ ：这是衡量分子“油腻”程度的指标。保持该值较低可确保片段不会过于亲脂，这对于维持高水溶性并防止其非特异性地附着于所接触的一切至关重要。
氢键供体数量 $\le 3$ ：这些通常是 -OH 或 -NH 基团。
氢键受体数量 $\le 3$ ：这些通常是氧或氮原子。

限制这些氢键基团可以使片段保持简单，并防止其在与蛋白质结合前因脱去水分子外壳而付出巨大的能量代价。一个遵守三原则的分子是简单的、可溶的，并且是构建更复杂、更高效物质的理想起点。

质量优于效力：配体效率的力量

现在我们来到了 FBLD 中最美妙的概念之一。当你发现一个能结合的片段时，你如何判断它的质量？你的第一直觉可能是选择那个结合最紧密的（即 $K_d$ 值最低的）。但这通常是错误的做法。FBLD 优先考虑相互作用的质量，而非原始的强度。

想象一下你有两个片段命中物：

片段 F1：一个含有 12 个重原子（非氢原子）的小分子，其结合的 $K_d$ 值为 $1\ \text{mM}$ 。
片段 F2：一个含有 20 个重原子的较大分子，其结合紧密程度是 F1 的 10 倍， $K_d$ 值为 $100\ \text{µM}$ 。

片段 F2 显然更有效力。但它更好吗？让我们仔细看看。结合能 $\Delta G$ 是驱动相互作用的因素，它与 $K_d$ 的关系为 $\Delta G = RT \ln K_d$ 。对于 F1， $\Delta G_1 \approx -4.1\ \text{kcal/mol}$ 。对于 F2， $\Delta G_2 \approx -5.5\ \text{kcal/mol}$ 。

现在，让我们通过分子的大小来对这个能量进行归一化，看看每个原子对结合的贡献效率如何。这个指标被称为配体效率 (LE)，定义为 $LE = -\Delta G / N_{\mathrm{HA}}$ ，其中 $N_{\mathrm{HA}}$ 是重原子的数量。

$LE_1 = 4.1 / 12 \approx 0.34\ \text{kcal/mol per atom}$
$LE_2 = 5.5 / 20 \approx 0.28\ \text{kcal/mol per atom}$

令人惊讶的是，那个更小、结合更弱的片段是更高效的结合物！它的每个原子平均对结合能的贡献更大。它正在形成更高质量的接触。F1 是一块贴合得恰到好处的砖块，而 F2 则是一块更大、更粗糙的砖块，它仅仅是通过体积更大来实现其更高的亲和力。在 FBLD 中，我们总是押注于高效的结合物。它提供了一个更优越的基础，保证了当我们将它发展成一个更大的分子时，我们可以保持这些高质量的相互作用，并开发出一种高效的药物，而不会最终得到一个性质不佳的、过大且油腻的分子。

从砖块到大厦：连接与生长

一旦你识别出这些高效率的片段，建筑阶段就开始了。结构生物学技术，特别是 X 射线晶体学，是 FBLD 架构师不可或缺的工具。它们提供了高分辨率的三维图像，精确地展示了片段是如何位于蛋白质表面的口袋中的。有了这份蓝图，两种主要策略应运而生：

片段生长：可以对结合在单个口袋中的片段进行扩展。化学家在结构信息的指导下，合成片段的新版本，这些新版本带有化学附加物，旨在伸入相邻的未占据口袋，形成新的、有利的相互作用，并显著提高亲和力。
片段连接：这也许是 FBLD 原理最优雅的展示。通常，筛选会识别出两个不同的片段微弱地结合在相邻的口袋中。晶体结构显示了它们确切的相对位置和方向。化学家的任务就是扮演分子媒人：设计并合成一个包含这两个片段的单一较大分子，通过一个具有完美长度和几何形状的化学连接子将它们连接起来，使得两个部分能够同时结合到各自的口袋中。这样做的回报可能是巨大的。连接后化合物的亲和力通常远大于其各部分亲和力的简单加和，这一现象由与熵相关的强大热力学优势所驱动。

怀疑论者的工具箱：根除欺骗

分子相互作用的世界充满了诡计。许多分子可以通过与特异性、真实的结合无关的机制来表现出抑制蛋白质功能的作用。这些分子骗子被广泛称为泛检测干扰化合物 (PAINS) 或“频繁命中物”，因为它们在许多不同的检测中都显示为命中物，但原因都是错误的。常见的罪魁祸首包括：

胶体聚集体：这些分子根本不结合。在筛选中使用的高浓度下，它们会聚集在一起形成微小的聚集体，非特异性地捕获和隔离蛋白质，使其看起来像是抑制剂。经典的诊断测试是加入微量的洗涤剂，这会溶解聚集体并恢复蛋白质的功能。
氧化还原循环体：一些化学结构可以与检测缓冲液中的氧气和其他组分反应，生成像过氧化氢这样的活性物质，从而损害蛋白质。这不是抑制，而是化学暴力。
滥交的共价修饰剂：这些是过度活性的亲电体，它们与蛋白质表面能找到的任何亲核体形成永久性的共价键。它们是非特异性和有毒的，与靶向药物正好相反。

筛选中初始命中率高通常是其被这些假阳性物污染的迹象。要想成功，科学家必须是一个永远的怀疑论者，手持工具箱来揭穿这些冒名顶替者。这就是为什么正交验证是 FBLD 不可动摇的规则。一个“命中物”在被至少两种依赖于不同物理原理的独立或正交方法（例如，NMR 和 SPR）确认之前，都不能算作真正的命中物。

这不仅仅是“检查你的工作”。这是对概率推理的严谨应用 [@problem_-id:5016331]。想象一下，起始库中真实结合物的流行率非常低（比如说 5%）。即使是来自一个良好检测的单次阳性测试，也可能只将你对获得真实命中物的信心提高到大约 30%。这个置信度太低，不足以证明化学优化的巨大成本和努力是合理的。但是，如果你随后从一个独立的正交检测中得到第二个阳性信号，概率法则（特别是贝叶斯法则）表明，你的信心可以飙升到 70% 或 80%。只有到那时，当信念被独立的证据链所巩固，你才能自信地宣布一个片段是真正的命中物，并开始将其构建成一种潜在药物的激动人心的工作。这种严谨、自我批判的工作流程是基于片段的发现的智慧灵魂，将其从简单的搜索转变为一门真正的分子设计科学。

应用与跨学科联系

在回顾了基于片段的先导化合物发现 (FBLD) 的基本原理之后，我们现在来到了探索中最激动人心的部分：亲眼见证这些思想的实际应用。在抽象层面欣赏一种理论是一回事，但只有当它被付诸实践，解决实际问题并连接起看似毫不相关的科学领域时，其真正的美和力量才会显现出来。FBLD 是一曲由物理学、化学、生物学和计算科学共同谱写的恢弘交响乐，每一门学科都在创造新药的宏伟事业中扮演着至关重要的角色。现在，让我们拉开这场表演的帷幕，看看片段的优雅之舞如何在实验室和计算机中展开。

起始的艺术：选择靶点与工具

甚至在进行第一个实验之前，就必须进行大量的巧妙思考。一场成功的 FBLD 战役并非始于黑暗中的随机漫步，而是始于一张精心绘制的地图和一套精心挑选的工具。

首先，我们必须问：我们的蛋白质靶点是否适合这种方法？并非所有的锁都适合用我们称之为片段的小钥匙来开启。一些蛋白质表面广阔、平坦且毫无特征——就像试图在光滑的大理石墙上找到一个抓手。我们寻找的是一个“可成药”的口袋，一个微小、轮廓清晰的空腔，它具有恰当的特征组合，能够接纳并留住一个片段，哪怕只是短暂地。在这里，我们求助于计算化学领域的同事。他们使用复杂的算法分析蛋白质的三维结构，从而识别和表征潜在的结合位点。这些程序评估口袋的大小、形状和化学特性——即其疏水性（排斥水）和极性（吸引水）区域的混合情况。它们可以生成一个“可成药性分数”，这个数字为我们成功的几率提供了线索。一个深邃、封闭且特征混合良好的口袋是一个有希望的迹象，因为它提供了一个环境，片段可以在其中形成多个有利的接触，并且至关重要的是，可以取代有序的水分子——这是结合能的一个关键来源。例如，像 SiteMap 这样的程序给出的高分表明我们已经为片段找到了一个有希望停靠的港湾。

有了一个有希望的靶点，我们还需要我们的“钥匙串”——片段库本身。什么才是一个好的片段？我们要求这些微小分子完成一件相当困难的事情：在水基缓冲液中以非常高的浓度（通常是毫摩尔级别）溶解，这是许多更大、更复杂的药物分子无法完成的壮举。如果一个片段太“油腻”或亲脂，它会干脆拒绝溶解，或者更糟的是，它会聚集在一起形成微小的聚集体，从而欺骗我们的检测方法，造成大量的假阳性。为了避免这种情况，药物化学家们制定了一套经验性指导方针，即著名的“三原则”。这些规则——将分子量 ( $MW$ ) 限制在 $300$ 道尔顿以下，亲脂性 ( $c\log P$ ) 限制在 $3$ 以下，氢键供体和受体的数量不超过 $3$ ——起到了过滤器的作用。它们帮助我们筛选出那些微小、水溶性合理且结构简单的片段，确保它们在我们高浓度筛选实验中是表现良好的“公民”。这种精心的筛选是确保我们试图检测到的结合“低语”是真实的第一步。

搜寻：检测最微弱的低语

现在，狩猎开始了。片段的结合是一个微妙的事件，是与一个巨大蛋白质的微弱握手。检测这个微弱的信号需要极其灵敏的生物物理技术。技术的选择并非随意的；它通常由我们蛋白质靶点的独特性格决定。

有些蛋白质性情“暴躁”。它们只在非常低的浓度下才能保持稳定和“快乐”，如果挤在一起，它们就会错误折叠并聚集成无用的淤泥。这带来了一个严峻的挑战。像等温滴定量热法 (ITC) 或某些类型的核磁共振 (NMR) 光谱学这样的技术，需要高浓度的蛋白质才能对弱结合物有效工作。对于这些“难搞”的蛋白质，这类方法根本不予考虑。我们必须转而使用那些要么超灵敏，要么能处理固定在表面上的蛋白质的技术。例如，表面等离子共振 (SPR) 将蛋白质束缚在金芯片上，巧妙地避免了溶液中的聚集问题。其他方法，如微尺度热泳 (MST) 和基于配体观察的 NMR 技术，例如饱和转移差谱 (STD) NMR，其灵敏度足以在低微摩尔甚至纳摩尔范围的蛋白质浓度下工作，使它们成为这些娇贵靶点的完美选择。

对于更“皮实”的蛋白质，我们可以使用更广泛的工具。其中最强大的之一是核磁共振 (NMR)，一项源于基础物理学的技术。一个特别巧妙的技巧是使用氟原子作为微型间谍。由于氟在生物系统中几乎完全不存在， $^{19}\mathrm{F}$ 原子核就像黑暗房间里的一盏明灯。通过在我们的片段上附加一个氟原子，我们可以使用 $^{19}\mathrm{F}$ NMR 来筛选结合。由此产生的光谱异常简洁，没有来自蛋白质或缓冲液的背景噪音。此外， $^{19}\mathrm{F}$ 原子核本身非常灵敏，仅次于质子，使我们能够检测到甚至非常微弱的相互作用。这种“氟灯笼”方法也可以用于竞争模式，其中一个含氟的报告分子被一个结合片段从蛋白质上置换下来，从而为一个命中物提供清晰明确的信号。

当然，FBLD 中最令人垂涎的奖品是片段在其结合位点中的直接图像。这是X 射线晶体学的领域。在这里，也需要做出实际的选择。我们可以先长出蛋白质晶体，然后将它们“浸泡”在含有片段的溶液中，希望片段能扩散到晶体中并找到它的归宿。或者，我们可以尝试在片段存在的情况下对蛋白质进行“共结晶”。最佳策略取决于多种因素的微妙平衡：片段的溶解度、晶体的稳定性，甚至片段本身是否可能从一开始就阻止晶体的形成。需要对这些限制因素进行仔细分析，以最大限度地提高观察到我们的片段结合的机会，从而为我们接下来的步骤获得原子级别的蓝图。

在整个过程中，记分至关重要。我们的筛选有多成功？在测试的数千个片段中，有多少是“命中物”？这由命中率来量化。但并非所有初步命中物都是真实的；有些是假象。所以，我们进行第二个不同的实验——一个正交检测——来确认它们。通过这第二次测试的比例给了我们确认的命中数。这些简单的统计数据是我们项目的生命体征，告诉我们我们的策略是否有效，并指导我们的资源分配。

生长的蓝图：从片段到先导化合物

找到一个片段命中物不是故事的结局；它是最具创造性阶段的开始。我们已经在山上找到了一个立足点。现在，我们必须开始攀登。我们的目标是将这个弱结合的片段转化为一种高效的、类药的分子。

但我们如何知道我们最初的立足点是否好呢？我们需要一种方法来衡量一个命中物的“质量”，而不仅仅是它的亲和力。这就是配体效率 (LE) 概念的用武之地。它衡量的是片段中每个原子贡献的结合能。高 LE 值告诉我们，我们的片段工作得非常高效，相对于其小尺寸，它正在形成强大而富有成效的接触。这就像汽车的燃油效率——衡量给定“物质”量的性能指标。另一个相关指标，亲脂性配体效率 (LLE)，平衡了效力与亲脂性，帮助我们避免仅仅为了获得亲和力而使分子更油腻的陷阱，这条路通常会导致药物性质不佳。这些效率指标是我们的指南针，确保我们在发展片段时，能以一种智能和富有成效的方式进行。

有了一个高质量的片段和一份晶体结构，我们就有了我们的蓝图。在此基础上进行构建主要有两种策略：

片段生长： 如果结构显示我们结合的片段旁边有一个空位，我们可以合理地设计并合成一个新版本的片段，使其延伸到那个空间以形成新的、有利的相互作用。可以添加一个化学臂，伸出去与附近的蛋白质残基形成氢键，或者添加一个环来填充一个空置的疏水口袋。这是一个逐步、合理的扩展我们初始立足点的过程。
片段连接： 有时，晶体学揭示了一个美妙的惊喜：两个不同的片段在活性位点的相邻子口袋中找到了各自的家。这是一个黄金机会。我们可以设计一个化学“连接子”将这两个片段缝合成一个单一的、更大的分子。这种方法的美妙之处在于其可加性原理。新的连接分子通常以远大于其各部分亲和力总和的亲和力进行结合，这要归功于将两个结合元件保持在一起所带来的巨大熵增益。

征服“不可成药”靶点：新的前沿

也许 FBLD 最深远的影响在于它能够攻克那些曾被认为是“不可成药”的生物靶点。其中最主要的是蛋白质-蛋白质相互作用 (PPIs)。这些相互作用通常发生在广阔、相对平坦的表面上，这对传统的药物设计来说是一个令人生畏的领域。

FBLD 的“少即是多”理念非常适合这一挑战。FBLD 并非试图覆盖整个界面，而是寻求找到微小的“热点”——表面上对相互作用在能量上至关重要的小口袋或凹槽。通过筛选一个片段库，我们可以识别出能够锚定在这些热点上的小分子。一旦锚定，我们就可以动用药物化学的全部武库来对该片段进行精细加工。我们可以让它生长以获得额外的相互作用，比如与主链羰基形成一个高度特异性的卤键。我们可以在附近的口袋中找到第二个片段，并将它们连接在一起。这种策略让我们能够用一个始于微小、精心挑选的锚点的分子来破坏一个巨大的蛋白质相互作用，将一个看似不可能的问题转化为一个可处理的问题。

通过这种方式，FBLD 超越了一种单纯的技术，成为一种思维方式。它是一种哲学，融合了物理学的灵敏性、结构生物学的精确性、化学的创造性以及计算的预测能力。它教导我们，通过从小处着手，通过聆听最微弱的相互作用低语，以及通过建立在效率和理性的基础上，我们可以设计出能够调节最复杂生物机器的强大分子。它是科学统一性的证明，也是服务于人类健康的强大工具。