
数十年来,药物发现通常类似于一场蛮力搜索,即筛选数百万种化合物,以期找到一个能成为药物的“命中物”(hit)。这一过程被称为高通量筛选(High-Throughput Screening, HTS),但其效率低下,产生的先导物往往难以优化成有效的药物。这造成了一个巨大的知识鸿沟:我们如何才能从一场碰运气的游戏,转向一个理性、智能的设计过程?基于片段的先导化合物发现(FBLD)作为应对这一挑战的有力答案应运而生,它将药物发现的范式从寻找“锁钥”般的匹配,转变为逐个片段地策略性构建“钥匙”。
本文将探讨FBLD这一优雅而强大的方法论。FBLD并非从庞大复杂的分子开始,而是从微小、简单的化学“片段”入手,以确定蛋白质靶点上最有潜力的相互作用位点。您将了解到这种“从小处着手”的理念如何为创造高效、安全、有效的药物提供一条更高效、更可预测的路径。第一章原理与机制将揭示FBLD背后的基础理论,从片段的设计规则到驱动其结合的热力学力量。随后的应用与跨学科联系一章将展示这些原理如何付诸实践,以攻克“不可成药”的靶点,并在化学、生物学和计算机科学之间建立起强大的联系。
想象一下,您是一位生物学家,试图了解一种非常特殊且稀有的鱼类偏爱什么食物。一种方法,我们可以称之为高通量筛选(HTS),就像向海洋中撒下一张巨大的网。您可能会捕到那条稀有的鱼,但同时也会捕获成千上万条其他鱼、一些海草、几只旧靴子和一辆自行车。捕获物的巨大数量让您不堪重负。您花费数月时间进行分拣,结果发现许多看起来像目标鱼的东西其实只是伪装巧妙的塑料片,而您真正捕到的鱼又太大太硬,不适合作为实际的食物来源。这本质上就是1990年代药物发现所面临的挑战。尽管筛选了数百万个化合物,但“命中物”通常很难被开发成真正的药物。
这时,基于片段的先导化合物发现(FBLD)登场了,它提供了一种更巧妙的策略。您不再使用巨网,而是使用一个精心挑选的渔具盒,里面装着微小、简单的鱼钩——即我们的“片段”。您将成千上万种不同的鱼钩放入水中,大多数都空手而归。但偶尔,一种特定类型的鱼钩上会带回一丝可辨识的划痕,就像声呐上的一声微弱“嘀声”。您没有捕到鱼,但学到了极其宝贵的信息:您知道了鱼的确切位置,以及它们喜欢咬的鱼钩的精确形状和化学性质。现在,您可以开始围绕这个鱼钩构建一个合适的鱼饵。FBLD是一种先学习再捕获的策略,是从蛮力转向智能设计的转变,它在21世纪初作为直接应对HTS局限性的方法而受到广泛关注。
什么才是一个好的“鱼钩”,或者说片段?它不能是任何一种小分子化学物质。首要条件是它必须高度水溶。为了检测片段与其靶蛋白之间非常微弱的相互作用——那种轻柔的“啃咬”——我们需要在实验中使用极高浓度的片段。一个油腻、不溶的分子是行不通的。
这一实际需求催生了一套著名的指导方针,即“三原则”(Rule of Three)。这些并非物理学的刚性定律,而是来自经验丰富的化学家关于如何构建一个优良片段库的明智建议。一个典型的片段应具备:
这些规则确保了片段小巧、简单且不过于油腻,使其保持可溶性和良好的行为特性。这一方法与描述最终可口服药物——我们希望最终捕获的“大鱼”——性质的著名“五原则”(Rule of Five)形成鲜明对比。最终药物可以更大(例如 )也更复杂。
从一个符合“三原则”的片段开始的精妙之处在于,它为你提供了化学家所说的理化性质的提升空间(physicochemical headroom)。当你在片段的基础上进行构建,通过增加原子来提高其效力时,其尺寸和亲脂性将不可避免地增加。从小分子开始,你就有足够的空间进行生长,而不至于违反“五原则”,最终得到一个太大或太油腻而无法被身体吸收的分子——这是药物优化中常见的失败原因。
这就引出了FBLD核心的一个美妙悖论。如果片段的结合如此微弱,为什么它们被认为是比一开始就结合更紧密的大分子更好的起点?答案在于一个极其精妙的概念:配体效率(LE)。
配体效率不关心结合的总强度;它关注的是你从每个原子(不包括氢原子)中获得了多少结合能。它是对相互作用质量的衡量,而不仅仅是其数量 [@problem_-id:3847298]。想象一场拔河比赛。一个由20个高大但不协调的人组成的团队可能拉出200磅的力。而一个由10名杂技演员组成的小型精英团队,每个人都处于完美位置,可能只拉出150磅的力。第一个团队总体上更强,但第二个团队的效率要高得多——每个成员贡献更多。在药物发现中,你希望从这些“杂技演员”开始。
我们可以量化这一点。结合强度由解离常数 衡量,它通过公式 与吉布斯自由能变 相关。 越负,表示结合越紧密。配体效率则可简单表示为: 其中 是非氢原子的数量。我们来看一个情景。片段A的 为 ,含有10个重原子。片段B更大,有20个重原子,结合更紧密,其 为 。乍一看,片段B似乎更好。但是当我们计算配体效率时(在室温 下),我们发现片段A的LE约为每个原子 ,而“更强”的片段B的LE仅为每个原子约 。片段A是更高效的起点。它找到了一个真正的“甜蜜点”,从这个高质量的锚点出发,我们有更大的机会开发出一种高效且性质优良的最终药物,而不会积累“分子肥胖”。
当然,为了测量这些微弱如私语的相互作用,我们需要极其灵敏的仪器。FBLD依赖于核磁共振(NMR)、X射线晶体学和表面等离子体共振(SPR)等生物物理技术,这些技术可以检测到大多数传统分析方法无法察觉的微弱结合事件。
这些高效的片段倾向于结合在哪里?蛋白质的表面并非均匀的景观;它是由山脉和山谷构成的复杂地形。散布在这片地形上的是被称为结合热点(binding hotspots)的特殊位置。这些是蛋白质表面上的小口袋或凹槽,在能量上已准备好与其他分子结合。
一个热点不仅仅是拥有一个形状良好的空腔。它是一个局部化学环境恰到好处的地方,能够提供强氢键或互补的静电相互作用——这些是有利的焓()的来源。但也许热点中最神奇的成分是你无法直接看到的东西:水。
结合位点充满了水分子。大多数水分子很自在,像其他地方的水一样振动。但在一个深口袋的受限、特定几何结构中,一些水分子被迫形成高度有序、受约束的排列。它们是“不愉快”的水分子,拥有高自由能。当一个片段进入并结合在这个口袋中时,它将这些不愉快的水分子推入到可以自由翻滚的溶液主体中。这种将有序水释放为无序状态的过程,导致系统熵()的大幅增加,为结合提供了强大的热力学驱动力。因此,一个绝佳的热点既能提供焓变的“握手”,又能提供水分被解放时的熵增“欢呼”。
令人惊讶的是,我们通常可以在进行实验之前就预测出这些热点的位置。像FTMap这样的计算方法可以通过在蛋白质的三维结构上计算性地“播撒”各种小型化学探针来探索它。许多不同类型的探针聚集的区域被标记为热点。这使得化学家能够评估一个靶点的可成药性(druggability)——即它对FBLD的适用性。一个拥有小型、深邃、封闭口袋且富含热点和高能水分子的靶点是理想的候选对象。而一个表面平坦、缺乏特征的靶点则要挑战得多。
找到一个与热点结合的高效片段,就如同找到了“藏宝图上的X标记”。这个片段不是最终的药物,而是我们开始攀登的锚点和立足点。接下来的阶段是一场优美的结构导向设计实践,化学家利用片段在其结合位点的三维图像作为生长的蓝图。主要有三种策略:
片段生长(Fragment Growing):这是最常用的方法。从已结合的片段出发,化学家理性地设计并合成新的分子,使其延伸出一个“触手”到口袋中相邻的未占据部分。目标是形成新的、有利的相互作用,逐步增加亲和力。这个过程常常展现出一场优美的热力学二重奏:初始片段的结合通常是焓驱动的(形成特定的强键),而随后向疏水口袋的生长则可能是熵驱动的,其动力来自于更多不愉快水分子的释放。
片段连接(Fragment Linking):在这项雄心勃勃的策略中,研究人员发现两个不同的片段结合在相邻的口袋里。挑战在于设计一个化学“桥梁”或连接子(linker),将它们连接成一个效力更强的单一分子。理论上,这可以带来亲和力的巨大提升。然而,物理学提出了一个关键的现实检验。如果连接子为了跨越间隙而必须弯曲或扭曲成一个别扭的、高能量的构象,这会引入一种称为连接子应变能(linker strain energy)的能量惩罚。一个成功的连接子不仅要连接片段,还必须以最小的应变做到这一点,这是一个要求苛刻的几何难题。
片段融合(Fragment Merging):有时,筛选会发现两个不同的片段结合在同一个热点中,它们相互重叠并共享一些关键的相互作用。融合策略涉及设计一个新颖的单一骨架,将两个母体片段最重要的特征整合到一个分子中。
最后,所有这些优雅的设计策略都必须面对现实的最终裁决:合成的可行性(synthetic tractability)。一个在计算机屏幕上看起来完美的分子,如果不能在实验室中制备出来,就毫无用处。生长策略的优先级在很大程度上取决于可用的化学反应。如果生长方向可以通过简短、可靠、高产率且依赖于商业可用构件的反应来实现,那么它就会被优先考虑。基于片段的药物发现艺术不仅在于设计出完美的分子,更在于设计出你能够实际创造的完美分子。正是这种物理学、化学与实用性的无缝融合,使FBLD成为现代医学中最富智力挑战且最强大的策略之一。
如果说基于片段的先导化合物发现(FBLD)的核心原理代表了一套新工具,那么本章就是我们对工作坊的参观。在这里,我们将看到这些工具不仅被用来更好地完成旧工作,还被用来创造曾被认为不可能的事物。FBLD的理念——从微小、完美的部件开始构建一个复杂、功能完整的整体——已在整个科学领域引起共鸣,在药物化学与计算机科学、酶学、临床药理学等不同领域之间架起了桥梁。它将药物发现从寻找一个恰好适合“锁”的“钥匙”的过程,转变为一种逐个分子进行建筑设计的理性过程。
在着手任何伟大的建设项目之前,一位优秀的建筑师会先勘察土地并了解材料的质量。在药物发现中,这并无不同。我们必须在一个规模惊人的化学宇宙中航行,并且需要量化的路标来指引我们。
第一个路标告诉我们是否走对了方向。在一个典型的筛选项目中,我们可能会用一个包含约1500个片段的库来测试我们的蛋白质靶点。一定数量的片段会登记为“初步命中物”。由此,我们可以计算出一个简单但至关重要的数字:命中率。如果我们找到75个初步命中物,我们的命中率就是 ,即 。这个数字是生物系统传来的第一声低语。它高还是低?一个显著高于背景噪音的命中率表明,该蛋白质具有适合与小分子结合的口袋——即该位点是“可成配体的”(ligandable)。当然,并非所有初步命中物都是真实的。我们必须对它们进行第二种不同类型的实验——“正交”验证——以确认真实的结合。如果我们的验证分析有60%的成功率,我们就可以预期最初的命中物中约有45个是真实、已确认的、可用于我们设计项目的起点。
但这45个片段中,哪些是最佳的起点呢?仅仅是结合最紧密的那个吗?FBLD教给我们一个更微妙、更强大的道理:对于一个片段来说,最重要的不是结合的绝对强度,而是该结合的效率。想象两位攀岩者。一位用一个巨大沉重的梯子爬上10英尺高的墙,而另一位则利用几个小巧、位置绝佳的抓手达到同样的高度。哪一位是更好的攀岩者?
为了体现这一思想,化学家设计了一个非常直观的指标:配体效率(LE)。它衡量的是你的片段中每个原子(不包括氢)能带来多少结合能。我们使用基本的热力学关系式 ,从测得的解离常数 计算出标准吉布斯自由能变 。配体效率就是 除以重原子数()。一个亲和力较弱()但只有12个重原子的片段,其 可能约为 。这得出的LE约为每个原子 。这是一个极好的数值!该领域的一条经验法则,常被称为“0.3法则”,建议任何LE达到或超过 每原子的片段都是非常高质量的起点。这是一个“小而精”的分子,其表现远超其体量,表明其为数不多的原子与蛋白质形成了极其优化的接触。
这一效率原则在我们整个过程中都成为指引之星。当我们通过添加新的化学基团来“生长”片段,使其变得更大、更有效时,我们持续追踪LE。考虑一个成功的生长步骤:我们最初的12原子片段,结合能为 (),被优化成一个17原子的分子,其结合能大大改善至 。我们的生长策略是否成功?我们检查效率:新的LE现在约为每个原子 。效率增加了!这告诉我们,我们添加的原子不仅仅是无用的体积填充物;它们形成了高质量、有能量贡献的相互作用。LE的这种正向变化是成功的理性设计策略的标志。
借助这些量化工具,FBLD方法使科学家能够应对医学领域一些最艰巨的挑战——那些长期被认为“不可成药”的蛋白质靶点。
想象一下,试图通过在两片云之间扔一块石头来阻止它们合并。这就是破坏蛋白质-蛋白质相互作用(PPIs)所面临的挑战。蛋白质接触的表面通常广阔、平坦且看似没有特征,为传统药物的结合提供的明显口袋很少。然而,FBLD提供了一个绝妙的解决方案。详细研究表明,这些界面的并非所有部分都同等重要。一些微小区域,即“热点”,通常贡献了不成比例的结合能。虽然一个大的药物分子可能会在平坦的表面上徒劳地滑过,但一个小片段的大小却恰好可以嵌入这些微小、能量丰富的热点之一。
一旦我们找到结合到不同热点的片段,一种“连接”策略便应运而生。例如,如果片段A以 的能量结合到一个热点,而片段B以 的能量结合到另一个热点,我们能否通过简单地将它们拴在一起来创造一个超级结合剂?热力学告诉我们天下没有免费的午餐。将两个独立的分子连接成一个整体的行为本身就带有熵罚——我们失去了两个分子独立翻滚的自由。此外,连接子本身可能会引入应变,因为它迫使两个片段处于其最佳结合姿势。这些惩罚是对自由能的真实、正向的贡献,使得结合变得不那么有利。一个典型的连接熵成本可能是 ,而应变惩罚可能是 。我们连接后分子的最终结合能将是各项之和:。虽然这比理想的总和 要小,但它显著优于任何一个单独的片段,展示了一种成功的(且可量化的)连接策略。这种“热点”靶向和连接方法是设计PPI抑制剂的主要策略,而PPI是癌症、炎症等疾病的核心靶点类别。
另一个优美的跨学科联系体现在酶抑制剂的设计中。酶是生物学的主要催化剂,通过稳定反应的最高能量点——过渡态——来加速反应。一个理想的抑制剂将是一个能够完美模拟这种短暂、不稳定过渡态的稳定分子。FBLD提供了一条从头开始构建此类模拟物的路径。这个过程是现代药物发现的杰作:
这整个工作流程将生物物理筛选、高水平计算理论、合成化学和经典酶学联系起来,以创造出具有极高特异性的抑制剂。
FBLD不仅限于简单地阻断蛋白质的功能。它还可以用来创造被称为变构调节剂的复杂“调光开关”。这些分子不与蛋白质的主要活性位点结合,而是结合在一个次要的、远程的位置。从这个“变构”位点,它们可以巧妙地改变蛋白质的形状,从而调高或调低其活性。这对于像G蛋白偶联受体(GPCRs)这样的靶点尤为重要,它们是细胞通讯的守门人。
一个基于片段的项目可能会在一个新发现的GPCR变构位点内,识别出两个结合在相邻子口袋中的弱片段。将它们连接起来可以产生亲和力的急剧增加——这种效应有时被称为“超加性”,即连接后的化合物比其各部分简单相加所预期的效力要强得多。其结果是一个分子,例如,它本身不激活受体,但能使天然信号分子的效力增强25倍。这将片段结合的生物物理原理与活细胞的功能性药理学输出直接联系起来,为更安全、更精细地控制生物学开辟了道路。
片段的小尺寸和简单性使其成为计算建模的完美对象。这在FBLD和计算机科学之间创造了深刻而富有成效的协同作用,使我们能够看到和探索实验上不可见的东西。
一个关键的计算应用是寻找隐藏的或“隐蔽的”(cryptic)结合位点。这些是蛋白质上的一些口袋,它们在其最稳定的基态结构中不存在,但随着蛋白质自然地“呼吸”和弯曲,会短暂地闪现出来。我们如何找到一个通常不存在的口袋?答案来自一个优美的统计力学应用,称为混合溶剂分子动力学(MSMD)。在这些模拟中,蛋白质不置于纯水中,而是置于含有低浓度小分子“探针”(如异丙醇或乙腈)的水中。这些探针充当一群分子间谍。当一个隐蔽口袋短暂打开时,探针可以扩散进去并形成有利的弱相互作用。这些相互作用虽然单个微不足道,但集体地降低了“开放”构象的自由能。根据热力学定律(特别是玻尔兹曼分布),降低一个状态的能量会增加其出现的概率。因此,MSMD模拟会诱导蛋白质花更多时间保持其隐蔽口袋开放,通过显示探针分子聚集的位置来揭示其位置和化学性质。
这种预测能力延伸到设计整个发现工作流程。一个先进的虚拟筛选级联是一种多阶段的计算策略,旨在最大限度地提高成功机会,同时最大限度地减少资源浪费。这样的级联始于对系统物理现实的承认:蛋白质不是静态的,配体可以以多种化学形式存在。因此,一次彻底的搜索必须对多种不同的蛋白质构象(一个“系综”)进行采样,并为每个片段测试多种相关的质子化和互变异构状态。这种对采样完整性的承诺至关重要。然后,为了从海量计算的巨大噪音中分离出真实信号,应用了严格的统计方法。我们不只是挑选得分最高的化合物,而是可以控制假发现率(FDR),这是一种复杂的统计工具,可确保我们命中物列表中的假阳性预期比例保持在预定义的阈值以下(例如10%)。最后,使用最严谨的基于物理学的方法,如炼金术自由能微扰(FEP),来生长最有希望的片段,以预测哪些化学修饰将产生最大的亲和力增益。
从最初简单的命中率计算到抑制剂的量子力学设计,FBLD已证明它不仅仅是一项技术——它是一个统一的原则。它强迫我们采用一种既微观又宏观的思维模式,将分子相互作用的最微小细节与人类健康的最广泛挑战联系起来,并在此过程中,使整个药物发现事业成为一门更理性、更可预测、更优美的科学。