泛分析干扰化合物 (PAINS)

玻尔百科

定义

泛分析干扰化合物 (PAINS) 指的是在生物分析中通过非特异性机制而非真实的靶点结合产生假阳性结果的一类化合物。这些分子通过形成胶体聚集体、氧化还原循环或与蛋白质形成无差别共价键等机制干扰药物筛选，属于药物化学领域的研究范畴。通过计算过滤和实验复筛来识别并剔除这类化合物，对于提高药物研发的效率和成功率至关重要。

核心要点

泛分析干扰化合物 (Pan-Assay Interference Compounds, PAINS) 是指通过非特异性机制而非真实的靶点结合，在生物分析中产生假阳性结果的分子。
常见的 PAINS 机制包括形成胶体聚集体、参与氧化还原循环以产生活性氧，以及与蛋白质形成无差别的共价键。
识别 PAINS 涉及结合使用计算筛选（以发现已知的有问题的亚结构）和实验性反向筛选（例如添加去污剂或使用正交分析）。
制定严格的 PAINS 管理策略对于提高药物发现项目的效率和成功率至关重要，可以防止在假先导化合物上浪费资源。

引言

在复杂的药物发现世界中，找到一个能与生物靶点完美相互作用的分子，就像为一把精密的锁找到一把独特的钥匙。高通量筛选让科学家能够一次性测试数百万把潜在的钥匙，但这个过程充满了欺骗。一个重大的挑战来自于那些看似有前景，但实际上只是化学伪装者的“命中化合物”。这些泛分析干扰化合物（PAINS）通过非特异性作用产生虚假信号，将研究引向代价高昂且徒劳无功的道路。本文旨在解决如何区分这些分子赝品与真正候选治疗药物这一关键知识鸿沟。

为应对这一挑战，本文将首先探讨 PAINS 的“原理与机制”，详细说明它们如何通过聚集、化学反应性和读出干扰等过程欺骗常见的分析方法。随后，“应用与跨学科联系”一章将拓宽视野，讨论 PAINS 管理在药物发现中的战略重要性、用于其检测的计算工具，以及用于揭示其真面目的巧妙实验设计，确保科学家在发现新药的道路上追求的是真实的生物活性。

原理与机制

在我们发现新药的征途上，我们如同锁匠，寻找一把独特的钥匙来配一把单一而复杂的锁——我们的生物靶点。高通量筛选就像一次测试成千上万把钥匙。当筛选报告一个“命中”时，那是一个激动人心的时刻；我们以为找到了能用的钥匙。但如果这个信号是假的呢？如果我们的“钥匙”实际上并没有插进锁里，而是卡住了机械结构、弄坏了门，或者只是欺骗了我们的传感器，让它以为门已经打开了呢？这就是泛分析干扰化合物（Pan-Assay Interference Compounds，简称PAINS）带来的挑战。它们并非真正的钥匙，而是一群化学伪装者，因在一次又一次的筛选中出现而臭名昭著，浪费着时间、资源和希望。要想成功，我们必须首先成为专业的侦探，学会识别这些赝品并理解它们的作案手法。

PAINS这个术语本身指的是一系列已知会在多种生物分析中引起问题的化学结构。它们是药物发现界的“频繁命中物”。它们的恶名并非因为它们是特别好的药物，而是因为它们具有通过各种非特异性机制欺骗我们实验的离奇能力。理解这些机制不仅仅是一项学术活动；它是区分奇迹般的发现与海市蜃楼的根本。

聚集体：当分子结成团伙

想象一下，你有一瓶水，然后往里撒一些细微的、略带油性的粉末。起初，颗粒各自漂浮。但加得足够多时，它们突然开始聚集在一起，形成更大、更黏的团块。一些小分子，特别是那些有些疏水性或“油性”的分子，在生物分析的水性环境中也会发生同样的事情。当浓度超过某一特定值时，它们会自发地组装成名为胶体聚集体 (colloidal aggregates) 的微小颗粒。

这些聚集体是分子世界里的恶霸。它们不是与我们的靶蛋白进行精细的一对一相互作用，而是形成一个巨大的、黏性的表面，简单地捕获蛋白质，将它们从溶液中拉出来并使其失活。蛋白质并非被巧妙的分子相互作用所抑制；它只是被“抢劫”了。

这种机制有几个敏锐的科学家可以发现的典型特征：

对肥皂的敏感性： 处理黏腻、油性的脏东西最好的方法是什么？肥皂。在实验室里，我们使用非离子去污剂（如Triton X-100）。这些分子非常擅长分解聚集体。如果一个化合物的“活性”在加入一小滴去污剂后就消失了，那它几乎可以肯定是一个聚集体形成剂。这个黏性的团伙被驱散了，被捕获的蛋白质也获得了自由。
异常的效价曲线： 一个与蛋白质单一靶点结合的真正抑制剂通常会产生一条平滑、可预测的剂量反应曲线，其所谓的希尔斜率 ( $n_H$ ) 约等于1。然而，聚集体形成剂的行为不同。它们的行为具有高度的协同性；在临界浓度以下，几乎没什么反应，但稍高于此浓度，聚集体便迅速形成并封存酶。这导致了异常陡峭的剂量反应曲线，希尔斜率通常远大于1，例如，在某个假设案例中观察到 $n_H = 2.4$ 。
对蛋白质浓度的依赖性： 对于一个正常的抑制剂，其测得的效价 ( $IC_{50}$ ) 通常与分析体系中的蛋白质含量无关。而对于聚集体形成剂，其抑制作用更像是一种化学计量滴定——你需要一定量的聚集物来捕获一定量的蛋白质。如果你将蛋白质的量加倍，你就需要将聚集体形成剂的浓度加倍才能达到同样的效果，这导致表观 $IC_{50}$ 值随酶浓度而变化。

科学家还可以使用一种叫做动态光散射 (DLS) 的技术，通过将激光射入溶液中，直接检测这些纳米级颗粒的存在，从而为聚集提供物理证据。

破坏者：被释放的化学反应性

如果说聚集体形成剂是被动的恶霸，那么其他 PAINS 则是主动的破坏者。它们不仅仅是捕获蛋白质；它们会化学攻击并摧毁蛋白质或分析组分。

氧化还原循环体：纵火犯

想象一个分子，它可以从分析缓冲液中的“辅助”分子（如常用的还原剂二硫苏糖醇，DTT）那里夺取一个电子，然后立即将这个电子抛给一个氧分子。这个过程，称为氧化还原循环 (redox cycling)，可以一遍又一遍地发生，每次都会产生极具破坏性的活性氧 (ROS)，如过氧化氢 ( $\mathrm{H}_2\mathrm{O}_2$ )。本质上，这个化合物就是一个在你试管里生产漂白剂的微型工厂。这种漂白剂随后会非特异性地氧化并损伤靶蛋白，导致活性丧失，而被误认为是真正的抑制作用。

一旦你知道要寻找什么，氧化还原循环体的特征就非常明显：

“抑制”作用通常是时间依赖性的，随着更多 ROS 的产生而变得更糟。
添加更多的还原剂（如 DTT）会增加表观抑制作用，因为它为产生 ROS 的火焰提供了更多燃料。这是一个关键的危险信号，因为真正的抑制剂不会受此影响。
通过添加过氧化氢酶 (catalase)——一种专门分解过氧化氢的酶，或超氧化物歧化酶 (SOD)——一种处理另一种 ROS 前体的酶，这种效应可以被完全逆转。如果添加这些清理酶能够挽救你的靶蛋白活性，你就抓到了一个氧化还原循环体的现行。

某些化学结构，如儿茶酚 (catechols) 和醌类 (quinones)，是众所周知的易于发生此类行为的结构，使它们成为常见的 PAINS 警报。

共价修饰剂：强力胶

一个好的药物通常像一把能 neatly 装入锁中并能轻易取出的钥匙。而共价修饰剂则像一把涂了强力胶的钥匙。这些分子含有活泼的化学基团——亲电“弹头”——它们会与蛋白质的一部分（通常是像半胱氨酸这样的亲核氨基酸）形成牢固、永久的共价键。

虽然一些非常成功的药物确实是共价抑制剂，但它们的反应性是为其特定靶点而精确调整的。然而，具有这种机制的 PAINS 通常是混杂的，会与任何具有可及反应基团的蛋白质发生反应。它们不是特定的钥匙，而是不加选择的破坏者。像醛类 (aldehydes)、亚硝基 (nitroso groups) 和氮丙啶 (aziridines) 这样的官能团因其固有的化学反应性，是此类行为的已知结构警报。它们的风险甚至可以通过计算其在生物亲核体存在下的反应半衰期来评估；秒级或分钟级的半衰期是一个重大的危险信号。

幻术师：欺骗读数

有时，靶蛋白完全没问题，但化合物直接干扰了我们的测量系统，造成了活性的假象。

光学干扰： 许多分析测量光的变化——荧光或发光。如果一个化合物有颜色，它可以在光到达检测器之前吸收光，这种现象被称为内滤效应 (inner-filter effect)。如果它本身是荧光的，它会增加不必要的光。无论哪种情况，信号都被破坏了，结果也毫无意义 [@problem__id:5267655]。
金属螯合剂： 许多酶需要一个金属离子（如锌 $Zn^{2+}$ 或镁 $Mg^{2+}$ ）作为关键的辅因子来发挥功能。一些化合物是优秀的螯合剂 (chelators)，意味着它们像分子爪一样，能抓住金属离子并将其夺走。通过窃取酶必需的辅因子，化合物在从未与其活性位点结合的情况下使其失活。诊断测试简单而巧妙：如果通过向溶液中添加过量的所需金属离子可以逆转抑制作用，你很可能是在处理一个螯合剂。

区分敌友：科学家的工具箱

面对这一群形形色色的“流氓”，科学家如何系统地揭露它们呢？这是一个充满深度怀疑和巧妙实验的过程，从怀疑走向证实。

首先，我们使用计算过滤器。科学家们已经汇编了已知的 PAINS 亚结构库。甚至在筛选运行之前，计算机就可以扫描库中所有分子的结构，并标记出可疑分子。这是强大的第一步。通过去除一大部分潜在的干扰物，我们极大地增加了发现的“命中”是真实命中的机会。这提高了筛选的阳性预测值；一项假设分析表明，过滤可以将命中化合物中真实结合物的比例提高三倍。

然而，结构警报仅仅是一个警告，而不是定论。许多优秀的药物含有可能被幼稚的过滤器标记的片段。断然拒绝每一个被标记的化合物是一种糟糕的策略，有丢弃有价值分子的风险。警报只是告诉我们：“要格外小心地研究这一个。”

研究的黄金标准是正交分析 (orthogonal assay)。原理很简单：如果你怀疑一个化合物在说谎，就用一个完全不同的方法来测试它的说法。如果一个来自基于荧光的分析（测量光）的命中，在表面等离子体共振 (SPR) 分析（测量质量与表面的结合）中重新测试时没有显示相互作用，那么最初的命中几乎可以肯定是假象。一个假象可能骗过一种检测方法，但它不太可能骗过两种或三种依赖不同物理原理的方法。

最后，我们使用我们讨论过的特定的基于机制的反向筛选：分别添加去污剂、过氧化氢酶或金属离子来诊断聚集、氧化还原循环或螯合。一个表现良好的命中应该保持稳定，其活性不受这些测试的干扰，而一个伪装者的伪装则会脱落。

通过将计算警报与一系列严格的、有机制意识的实验相结合，我们可以剥去欺骗的层层外衣。这个命中化合物分类和验证的过程并非绕道药物发现之路；它本身就是这条路。它确保我们追逐的是真正的生物活性，让我们更接近于设计出未来精准、有效且安全的药物。

应用与跨学科联系

在理解了泛分析干扰化合物（PAINS）——这些模仿真实生物活性的化学变色龙——的本质之后，我们现在可以领会这一概念在整个科学领域产生的深刻而广泛的影响。对 PAINS 的认识不仅仅是药物化学教科书中的一个脚注；它是一项关键的指导原则，影响着实验设计，塑造着计算策略，并在从计算机科学到临床医学等看似不相关的领域之间建立了联系。故事在此变得真正有趣起来，因为我们看到科学家们如何成为精明的侦探，开发出一系列工具来揭露这些伪装者。

宏观策略：守护药物发现的大门

寻求新药的过程常被比作寻找一把能配上特定生物锁的、形状精巧的钥匙。这个过程，即药物发现，极其艰巨且昂贵。现在，想象一下我们庞大的潜在钥匙库中混入了一小部分“万能钥匙”，它们似乎能晃开接触到的每一把锁，但实际上并未正常工作。这些就是 PAINS。它们产生成功的假信号，导致研究团队走上昂贵且徒劳无功的道路。

因此，PAINS 概念的首要且最根本的应用，便是在宏观尺度上的风险管理。但风险有多大？我们可以用一点概率学得到一个惊人清晰的画面。让我们想象一个典型的高通量筛选（HTS）项目，测试一百万个化合物。为论证起见，假设我们库中 $1\%$ 的化合物是 PAINS，并且我们的分析总“命中率”为 $0.8\%$ 。我们可以估算问题的规模。如果一个化合物是 PAINS 和它是一个“命中”是独立事件，那么一个化合物既是 PAINS 又是命中的概率就是它们各自概率的乘积： $0.01 \times 0.008 = 0.00008$ 。这看起来很小，但它意味着每筛选 10,000 个化合物，我们预计会有 8 个命中，如果 PAINS 和非 PAINS 的命中率相同，那么其中 $0.01 \times 8 = 0.08$ 个将是 PAINS。然而，PAINS 的本质恰恰是它们有更高的命中率。如果我们发现从一百万个化合物中得到的 8,000 个总命中中，有相当一部分是这些已知的麻烦制造者，那我们就有问题了。这个简单的计算揭示了必须管理的巨大假阳性负担的潜力。

这一现实催生了复杂的“筛选漏斗”——旨在高效分流化合物的多阶段策略。问题不仅在于是否要过滤，还在于何时以及如何过滤。一些过滤器，如用于一般“类药性”（例如 Lipinski 五规则）的过滤器，通常在进行任何昂贵的筛选之前，在最开始就应用于清理化合物库。然而，PAINS 过滤器通常使用得更为巧妙。一开始就一刀切地移除所有 PAINS 可能会丢弃一个真正有前途的分子，它只是碰巧与一个 PAINS 基序共享一个亚结构。一种更现代、更有效的策略是在初筛之后，将 PAINS 警报用作“红旗”，以优先确定哪些命中需要最深入的后续研究。

数字筛网：化学信息学与分子设计

我们究竟如何知道一个分子是否含有 PAINS 基序？光靠看是看不出来的。这正是化学与计算机科学的美妙交叉点——化学信息学——发挥作用的地方。一个分子可以表示为一个图，其中原子是节点，键是边，每个都标有其类型（例如，碳、氧；单键、双键）。一个 PAINS 基序只是一个更小的、已定义的图。在一个大分子中寻找一个 PAINS 基序的任务就等同于经典的计算机科学问题——子图同构：尝试在一个更大的网络中找到一个特定的、更小的模式。通过编程算法来执行这种搜索，化学家可以在几秒钟内扫描数百万个分子，以惊人的效率标记出潜在的麻烦制造者。

这一原理的应用远不止于过滤现有分子。它彻底改变了科学家构建其初始工具包的方式。在基于片段的先导化合物发现（FBLD）中，目标是从非常小、简单的分子（“片段”）开始，将它们培育成有效的药物。在设计一个包含数千个化合物的片段库时，一个关键原则是主动排除任何与已知 PAINS 警报相匹配的结构。这确保了药物发现项目的基础是由高质量、可靠的化学物质构建的，从而在下游节省了大量的时间和资源。

但如果一个简单的“是/否”过滤器过于粗糙怎么办？有时一个分子可能含有一个临界的亚结构，或者我们可能愿意为一个潜在的高回报而容忍一个小风险。这催生了更复杂的计算工具。我们不仅可以过滤，还可以创建评分函数，根据 PAINS 基序的存在，对分子的预测结合分数施加“惩罚”。一个含有臭名昭著的 PAINS 亚结构的分子，其分数会变差，使其不太可能被优先考虑，但未必会完全从考虑中剔除。

也许分子设计中最优雅的应用不仅仅是规避，而是智能的重新设计。想象一个有前途的分子，不幸的是它含有一个 PAINS 基序。药物化学家的目标是进行“分子手术”——精确地改变结构以去除有问题部分，同时保留负责所需活性的基本特征。这通常涉及一种称为“骨架跃迁”的策略，即用更具三维性、更饱和的结构取代扁平、芳香且通常有问题的环系。这不仅降低了 PAINS 的风险，还可以显著改善分子的类药性，这是将问题转化为机遇的绝佳例子。

实验讯问：一个侦探故事

计算标记只是一项指控；判决必须来自实验室。这正是科学方法大放异彩的地方，研究人员设计巧妙的实验来审判一个可疑的化合物。这些实验的数据读起来就像侦探的案卷，充满了指向特定干扰机制的线索。在这些调查中揭露的两个最常见的罪魁祸首是胶体聚集体形成剂和氧化还原循环体。

分子团伙案： 一些化合物，特别是那些油腻且扁平的化合物，表现得像反社会个体。在低浓度下，它们没问题，但当浓度超过某个“临界聚集浓度”时，它们会在分析缓冲液中自发地聚集在一起，形成称为胶体聚集体的纳米级颗粒。这些聚集体就像“分子捕蝇纸”，非特异性地隔离靶蛋白，阻止其发挥作用。这表现为抑制，但完全是假象。

侦探用来发现聚集体形成剂的工具包非常巧妙：

去污剂测试： 聚集体由微弱的非共价力维系。加入少量非离子去污剂（如 Triton X-100）会破坏这些颗粒，使其分解。如果化合物的“抑制”作用在去污剂存在下消失，它几乎可以肯定是聚集体形成剂。
保镖测试： 如果你加入高浓度的无关惰性蛋白（如牛血清白蛋白，BSA），它会充当“保镖”。聚集体将隔离丰富的 BSA，使真正的靶酶得以自由发挥功能。随蛋白质添加而效力降低是另一个强有力的线索。
直接观察： 使用一种称为动态光散射（DLS）的技术，科学家可以将激光射入样品。如果存在聚集体，它们会散射光线，直接揭示其大小并证实其存在。
陡峭曲线： 聚集体形成剂的剂量反应曲线通常异常陡峭，这是其非特异性、类似协同行为的另一个典型标志。

细胞破坏者案： 其他 PAINS，如含有儿茶酚基序的那些，充当氧化还原循环体。在分析（或细胞）的复杂、富含能量的环境中，这些化合物可以进入一个无效循环。它们从一个来源（如辅因子 NADPH）窃取电子，将其传递给分子氧，并在此过程中产生高破坏性的活性氧（ROS），如过氧化氢（ $\mathrm{H}_2\mathrm{O}_2$ ）。这种 $\mathrm{H}_2\mathrm{O}_2$ 随后可以攻击并损伤靶蛋白，导致被误认为是抑制的活性丧失。

用于诊断氧化还原循环体的诊断方法同样巧妙：

帮凶测试： 氧化还原循环需要一个电子源。如果化合物的活性依赖于还原剂（如 DTT 或 NADPH）的存在，这表明存在氧化还原循环。
确凿证据测试： 像 Amplex Red 检测法这样的分析可以直接检测 $\mathrm{H}_2\mathrm{O}_2$ 的存在。与抑制相关的阳性信号是强有力的证据。
救援任务： 最确凿的测试是在分析中加入像过氧化氢酶这样的酶。过氧化氢酶是一种能快速、特异性地解毒 $\mathrm{H}_2\mathrm{O}_2$ 的专家。如果加入过氧化氢酶“挽救”了靶酶的活性，就证明 $\mathrm{H}_2\mathrm{O}_2$ 是真正的罪魁祸首。

最终，确认一个真实命中的黄金标准是使用正交分析——一种依赖于完全不同检测原理的测试。例如，如果初筛使用荧光，那么使用液相色谱-质谱联用（LC-MS）的后续检测可以提供独立的判决。LC-MS 直接测量酶产生的产品量，这种方法不受大多数 PAINS 引起的光学干扰或蛋白质损伤的影响。

联系之网：QSAR、细胞生物学及其他

识别和消除 PAINS 的原则远不止影响初筛阶段。在人工智能时代，科学家使用定量构效关系（QSAR）模型来预测新分子的活性。但这些模型的好坏取决于它们所训练的数据。如果训练数据被来自 PAINS 的假象活性所污染，模型将学到错误的教训。它可能会学会识别聚集体的特征，而不是真正结合物的特征。因此，对数据集进行严格的、基于机制的整理——使用上述的实验测试——是构建一个有预测性和有用性的 QSAR 模型的绝对先决条件。这完美地体现了计算机科学的原则：“垃圾进，垃圾出”。

随着我们从简单的试管分析转向更复杂的生物系统，这些原则变得更加关键。在表型筛选中，研究人员用化合物处理整个细胞，以观察它们是否产生期望的结果（例如，阻止癌细胞生长），通常事先并不知道具体靶点。这种环境是假象滋生的温床。一个进行氧化还原循环的 PAINS 可能会产生足够的 ROS，通过一般毒性简单地杀死细胞，这可能被误认为是特定的抗癌效果。应用同样严格的一套正交后续验证——去污剂测试、过氧化氢酶救援、靶点结合分析——对于区分真正的通路调节剂和粗糙的细胞毒物至关重要。

从发现新抗生素到开发无数其他疾病的疗法，分析干扰的幽灵始终存在。PAINS 的概念为应对这一挑战提供了一个统一的语言和理性的框架。它促使我们保持一种健康的怀疑态度，并提倡一种能加强整个科学事业的严谨性。它教导我们，理解我们如何测量与我们测量什么同样重要，这是一个永恒的教训，揭示了科学探索深刻而美丽的统一性。