蛋白质重设计

玻尔百科

核心要点

蛋白质重设计通过修饰现有、稳定的蛋白质骨架来创造新功能，从而简化了从零开始设计蛋白质这一天文数字般的挑战。
计算设计依赖于一个能量函数来评估序列，主要通过优化范德华堆积和包埋疏水残基来实现低能量状态。
成功的设计需要特异性，即目标结构必须比任何竞争性的“诱饵”结构稳定得多，以确保可靠的折叠。
蛋白质重设计的应用非常广泛，包括增强治疗药物、创造智能生物传感器、构建可编程纳米材料以及工程化新酶。

引言

创造具有新功能的蛋白质是生物技术领域的一项巨大飞跃。生命建立在蛋白质的基础之上，然而自然界的蛋白质库仅代表了化学可能性中的极小一部分。这提出了一个根本性挑战：我们如何能超越发现，主动设计具有定制功能的新蛋白质，从分解污染物到抗击疾病？本文将通过探索蛋白质重设计领域来回答这个问题。文章首先将带领读者了解其基础的“原理与机制”，解释计算方法如何将物理定律转化为设计蓝图。随后，“应用与跨学科联系”一章将展示这些原理如何被用于构建新型治疗药物、分子机器和合成生物系统，从而重新定义分子尺度的可能性。

原理与机制

想象一下，你正站在一个巨大的图书馆前，馆内收藏了所有已写成的书，以及所有可能被写成的书。你的任务是找到一个完美的句子。这正是蛋白质设计者面临的艰巨挑战。“字母”是20种氨基酸，而“书”是它们能形成的无数种序列。蛋白质的功能诞生于一个由数百个这样的字母组成的句子，它指导蛋白质链折叠成独特的三维形状——一个分子建筑的杰作。我们如何写出这样的句子？我们如何有目的地塑造一个分子？

两大哲学思想指引着这一探索。其一模仿自然之力；其二则汇聚建筑师的智慧。

建筑师与育种家：两条创造之路

第一条路是定向进化。这是查尔斯·达尔文精神的试管浓缩版。你不需要详细的蓝图。相反，你通过随机突变创造一个巨大且多样的蛋白质变体库，就像一百万只猴子在一百万台打字机上随机敲打。然后，你施加一个严酷的选择压力：一个巧妙的测试，只允许那些具有所需特性——比如分解一种新型工业塑料的能力——的蛋白质“存活”下来。你选出胜出者，引入更多突变，然后重复这个循环。一代又一代，蛋白质朝着期望的功能进化。这种方法极为强大，尤其是在我们不了解其底层机制，但有很好的方法来测试成功与否时。我们只需要找到一种方法来识别胜利者，而不需要理解它为什么会赢。

第二条路，也是我们的主题，是理性和计算设计。这是建筑师的方法。它不依赖于偶然，而是依赖于对支配蛋白质折叠的物理和化学定律的深刻理解。在这里，我们不去猜测，而是去计算。我们的目标是根据第一性原理设计蛋白质的序列，利用计算机预测哪个序列会折叠成一个特定的、预先确定的结构。

但即便对于建筑师来说，改造一座现有建筑也远比在一片空地上从零开始设计新建筑要容易得多。蛋白质也是如此。设计一个具有全新折叠方式的蛋白质，这个过程称为从头设计（de novo design），是生物化学领域的重大挑战之一。它需要在天文学数字般的可能序列空间和同样浩瀚的可能三维折叠空间中进行暴力搜索。这项计算任务是巨大的。

一种更常见且更易于处理的方法是蛋白质重设计。在这里，我们从一个已知的、稳定的蛋白质结构——一个骨架（scaffold）——开始，并对其进行修饰以赋予其新功能。我们不再是寻找新的建筑地基，而只是改变内部布局。这通过固定整体主链结构，极大地简化了问题，使我们能够将创造力集中在选择适合该骨架的正确序列上。

改造自然机器：骨架的力量

什么样的骨架适合用于重设计？想象一下，你正在挑选一栋老房子，准备将其改造成一个现代艺术画廊。你会想要一栋“骨架好”的房子：地基坚固，结构稳固，并且可能有一些可以移动的非承重墙。同样，一个理想的蛋白质骨架必须异常稳定。它应该有很高的熔点，这表明它能抵抗解体。它的稳定性起到了缓冲作用，能够容忍我们为创造新活性位点而引入的潜在的去稳定突变。

此外，我们需要一个高分辨率的蓝图——一个实验结构，通常来自X射线晶体学。就像那栋房子一样，如果蛋白质有容忍变化的区域，那将很有帮助。这些区域通常是暴露在表面的环（loop），对核心结构不那么关键。这些环可以被重新塑造以创建一个新的结合位点，而蛋白质稳定的核心，例如一个“β-桶状”折叠，则保持完整。一个已经是高度特异性的、必需的酶通常不是一个好的选择，因为它的活性位点可能过于受限，难以改变。有了一个精心挑选的骨架，宏大的设计挑战就变成了一个更集中、可解决的谜题。

稳定性的语言：解读能量函数

计算机如何决定在哪个位置放置哪种氨基酸？它没有化学直觉或审美感觉。它遵循一个单一、冰冷的原则：找到能量最低的排列方式。建筑师的构想被转化为一个势能函数，这是一个数学评分，用于估算给定序列在固定骨架中的稳定性。让我们来看看这个函数必须捕捉的关键物理原理。

紧密贴合：范德华堆积

在原子尺度上，不存在真正“空”的空间。一个折叠良好的蛋白质是致密堆积的奇迹，尤其是在其无水的核心区域。这由范德华力所主导。这种力包含两种相互作用。在非常近的距离上，它是一种强大的排斥力，是原子间发出的严厉警告，告诫彼此不要侵犯对方的私人空间。原子碰撞会导致巨大的能量惩罚。在稍远的距离上，存在一种微弱而温和的吸引力，即伦敦色散力。

堆积的目标是排列原子，使它们恰好处于这个有吸引力的最佳位置，最大化这些有利的接触，同时避免触发严酷的排斥惩罚。计算机评分函数中的范德华能量项，通常由Lennard-Jones势（ $E_{vdw} \propto r^{-12} - r^{-6}$ ）建模，是这些相互作用的主会计师。通过最小化这一项，算法能找到侧链可以像完美解决的三维拼图一样相互契合的角落和缝隙，从而消除代价高昂的空腔和碰撞。

油性核心：疏水效应

如果你摇晃一瓶油和水，你会看到油滴迅速合并并与水分离。这并不是因为油分子之间有强烈的吸引力，而是因为水分子将它们推到了一起。这就是疏水效应，它是蛋白质折叠中最重要的单一驱动力。

具有非极性、“油性”侧链的氨基酸是疏水的。当一个非极性基团暴露于水中时，周围的水分子被迫在其周围排列成高度有序的“笼状”结构。这代表了水熵（无序度）的显著降低，这在热力学上是不利的。系统可以通过最小化暴露的非极性表面积来增加熵，从而降低其总自由能。最简单的方法是将疏水侧链埋藏在蛋白质的核心，远离水。

计算中的溶剂化能项正是模拟了这一点。它对任何暴露于溶剂的非极性原子施加能量惩罚，这个惩罚从根本上源于对周围水的熵代价。通过寻求最小化这个惩罚，设计算法自然地驱动了明确的疏水核心的形成，这是所有稳定的球状蛋白质的一个关键特征。

驯服无限：计算简化的艺术

即使有了固定的主链和明确的能量函数，可能序列的数量仍然是惊人的。对于一个100个残基的小蛋白质，如果每个位置都可以从所有20种氨基酸中选择，那么可能性的数量（ $20^{100}$ ）将超过宇宙中的原子数量。为了使搜索易于处理，我们必须使用一些巧妙的简化方法。

首先是固定主链近似本身。通过保持每个残基的主链原子——氮（N）、α-碳（Cα）、羰基碳（C）和羰基氧（O）——的刚性，我们极大地降低了问题的复杂性。如果我们允许每个位置即使只有少数几个离散的主链构象，搜索空间也会爆炸性增长。对于一个10个残基的环，如果每个位置只允许5个备选主链状态，搜索空间的大小就会增加 $5^{10}$ 倍，即近一千万倍！冻结主链是一种强大但有时粗糙的简化，它使问题在计算上变得可行。

其次，我们简化了侧链的运动。氨基酸侧链中的化学键可以旋转，使其具有灵活性。尝试探索所有可能的角度（ $\chi$ 角）在计算上是不可能的。幸运的是，侧链并不会随机采取任何构象。它们强烈偏好少数几个离散的、低能量的姿态，称为旋转异构体（rotamer）。这些就像侧链最舒适的坐姿。我们可以预先计算这些偏好的旋转异构体，并将它们存储在依赖于主链的旋转异构体库中。因此，算法不是探索每个键连续的 $360^{\circ}$ 旋转，而是简单地从一个小的、离散的、预先批准的旋转异构体目录中选择最佳选项。这个技巧以令人难以置信的程度减少了搜索空间——对于一个简单的三残基片段，这可以将超过 $10^{15}$ 种可能性的搜索变成仅有几百种的搜索。

特异性原则：设计一个安分守己的蛋白质

现在，我们有了骨架、能量函数和一些计算技巧。我们运行算法，它在我们的目标结构中找到了一个能量非常低的序列。成功了吗？还没有。

蛋白质能够折叠成期望的形状是不足够的。同样重要的是，它不能折叠成任何其他稳定的形状。这就是负向设计（negative design）的原则。想象一下为一把锁设计一把钥匙。钥匙必须完美地适配你的锁（正向设计），但它也必须无法打开附近的任何其他锁（负向设计）。

一个蛋白质设计只有在其目标构象显著比任何其他竞争性的“诱饵”构象更稳定时才算成功。这个稳定性差异，即能量间隙（ $\Delta E = E_{\text{decoy}} - E_{\text{target}}$ ），决定了折叠的特异性。一个序列，其目标态能量为-95单位，诱饵态能量为-60单位，其能量间隙为35单位。这远比另一个序列更好，后者的目标态能量为-120单位，诱饵态能量为-112单位，能量间隙仅为8单位。尽管第二个序列在绝对值上找到了一个更稳定的目标态，但其微小的能量间隙意味着它可能频繁地错误折叠成诱饵态。一个大的能量间隙确保蛋白质将可靠且唯一地采取其唯一的正确折叠方式。

从蓝图到现实：强大的伙伴关系

有了这些原理，计算生物学家现在可以从头设计出令人惊叹的复杂新蛋白质。然而，我们的模型仍然是对现实的近似。特别是催化作用，涉及极其微妙的量子力学效应和蛋白质动力学，这些都难以完美建模。

这就是为什么一种强大的现代策略是结合两者的优点：利用计算设计生成一个具有正确折叠和合理活性位点的蛋白质，然后利用定向进化来对其进行“微调”。设计的蛋白质可能只有微弱的、初期的活性。但通过将其作为定向进化的起点，我们可以快速搜索附近的序列空间，寻找能够完善活性位点、优化动力学并将催化效率提高几个数量级的小突变。这种理性的建筑师和不懈的育种家之间的伙伴关系正在推动可能性的边界，使我们能够创造出自然界从未梦想过的分子。

应用与跨学科联系

在探索了驱动蛋白质重设计的复杂原理和计算机制之后，我们可能感觉就像一位终于明白每个弹簧和齿轮如何工作的钟表匠。但真正的乐趣不仅在于理解机制，更在于意识到它能告知什么时间，测量哪些世界。现在，我们将目光从“如何做”转向“为什么做”，探索这一力量让我们能够构建的广阔且不断扩展的领域。蛋白质设计不仅仅是一项学术活动；它是一种变革性工具，一种塑造生命分子机器的方式，并借此重塑我们的世界。

分子雕塑艺术：重塑自然工具

几千年来，人类一直在改进自然的工具——磨利燧石、驯化作物、培育动物。蛋白质设计使我们能够从最根本的层面做到这一点。我们可以利用进化提供的蛋白质，对它们进行提炼、锐化，甚至重新利用它们来完成全新的任务。

最直接的应用之一是医学领域，特别是在提高治疗性蛋白质的效力方面。考虑一个设计用于对抗病毒的抗体。其有效性取决于它“抓住”目标的紧密程度。通过蛋白质设计，我们可以放大抗体与病毒之间的界面。我们发现了一个显著的经济学原理：巨大的结合能并非平均来自所有接触点。相反，它由少数几个“热点”残基主导，这些残基承担了大部分的重任。通过识别这些关键的锚点（通常通过如丙氨酸扫描等计算方法），工程师们可以集中精力，进行策略性突变以优化堆积和静电力。这就像一个机械师微调引擎，不是通过重建整个引擎，而是通过调整几个关键螺丝来获得性能的大幅提升。

除了仅仅锐化一个工具，我们还可以更换其功能部件。想象一下，你有一个非常稳定且无毒的人类蛋白质——一个完美的、坚固的“手柄”——但你需要它执行一个新的功能，比如与癌细胞结合。蛋白质设计者可以找到一个具有所需结合能力的小肽，并以手术般的精度，将其“嫁接”到手柄蛋白的一个暴露环区上。诀窍在于确保几何形状恰到好处，使得宿主蛋白上环的端点与嫁接肽的形状相匹配。这种移植保留了肽的功能，同时赋予了它更大骨架的稳定性和寿命。这是分子模块化的终极形式。

这种模块化思维使我们能够创造全新类型的传感器。许多细菌使用蛋白质作为内部监视器；例如，一种蛋白质可能与一个糖分子结合，并作为响应开启一个基因。合成生物学家可以劫持这个系统。通过仔细地重塑蛋白质的配体结合域——即分子“调谐器”——他们可以将其特异性从糖分子改变为，比如说，一种环境污染物。蛋白质的其余部分，包括与DNA结合以发送信号的部分，保持不变。结果是一个活的细菌细胞，它可以检测特定的污染物，并通过发出绿光来报告其存在。我们实际上已经为我们自己的诊断目的重新连接了一台自然机器。

从空白画布开始设计：从头设计蛋白质的黎明

尽管提炼自然界的蛋白质已经非常了不起，但蛋白质设计的真正前沿是从零开始创造它们。这就是从头设计：不仅仅是雕刻一块找到的大理石，而是构思雕像，并逐个原子地创造出大理石本身。

一个人如何开始为一个从未存在过的功能设计蛋白质呢？这始于物理和化学的基本原理。想象一下，我们想设计一种蛋白质来结合一个大的、扁平的、油性的药物分子。结合口袋应该是什么形状？我们由生物物理学提炼出的直觉告诉我们，为了最大化有利的“疏水效应”——油性物质在水中聚集在一起的趋势——我们需要最大的表面接触。一个由α-螺旋的柔和曲线构成的口袋会留下空隙，但由相对平坦的β-折叠片构成的表面可以形成一个大的互补面，非常适合平面客体分子附着。这是形状互补性最优雅的体现，利用蛋白质结构的基本构建模块为目标分子创造一个完美的“家”。

从头设计中最宏大的挑战是创造新酶。酶是自然界的催化大师，能将反应速率加快数万亿倍。要设计一种酶来分解像PET这样的塑料污染物，我们必须首先像化学家一样思考。每个化学反应都通过一个高能量、瞬时存在的原子排列，称为“过渡态”。它是一个幽灵，存在时间不到一皮秒。天然酶的秘密在于其活性位点是一个完美的摇篮，其形状和电荷都经过了精巧的设计，以稳定这个过渡态，从而降低反应的能垒。因此，要设计一种新酶，设计者必须首先在计算上模拟这个过渡态。他们必须描绘出他们希望捕捉的那个幽灵的图像。只有这样，他们才能在其周围设计一个稳定的蛋白质骨架，将氨基酸放置在恰当的位置，以抓住它、呵护它，并诱导它的产生。

工程化生物系统：作为可编程部件的蛋白质

蛋白质设计的雄心正在增长。它不再仅仅是创造单个分子，而是设计一组作为更大合成系统中可编程组件的蛋白质。这是蛋白质设计与纳米技术、系统生物学和合成生物学的交汇点。

我们现在可以对蛋白质进行编程，使其成为建筑材料。通过在蛋白质单体表面设计特定的、互补的“补丁”，我们可以指导它们如何相互连接。利用计算对接程序来测试我们的设计，我们可以验证这些补丁将引导单体自组装成精确、有序的结构——例如二维六边形晶格，形成纯蛋白质的纳米片。这些不仅仅是分子；它们是可编程物质，其潜在应用范围从新型过滤器到电子设备支架。

也许最深刻的系统级应用是创造“正交”生物回路。活细胞是一个极其拥挤和嘈杂的环境，一个信息纷繁的都市。如果想在其中构建一个可靠的合成电路，我们需要我们的工程部件在一个私有通道上通信，忽略宿主的喋喋不休。蛋白质设计使这成为可能。例如，我们可以创造一个嵌合σ因子——一种关键蛋白质，它告诉细胞的转录机器从哪里开始读取一个基因。通过交换其结构域，我们可以工程化一种新蛋白质，它能识别我们选择的启动子（这是从大肠杆菌σ因子获得的一个特性），但只会与一个共同表达的、来自不同物种的“外源”RNA聚合酶结合（这是从外源σ因子获得的一个特性）。结果是一个与宿主系统并行运作、完全隔离的私有转录系统。这种方法是理性蛋白质设计的胜利，使我们更接近真正可编程细胞的未来。它是一个工程化复杂蛋白质基机器的迷人范例，这一挑战在其他背景下，如基因组编辑，已经被像CRISPR-Cas9这样使用可编程RNA分子的系统优雅地解决了，这说明了人们在不断寻找最有效的分子“编程语言”。

此外，我们可以为天然缺乏控制机制的蛋白质安装新的控制机制。我们可以取一个简单的、“永远开启”的酶，通过计算设计和定向进化的结合，构建一个新颖的变构位点——一个远程控制开关。这个位于远离酶活性位点的新口袋，可以结合我们选择的特定小分子。这种结合事件通过蛋白质的原子框架发送一个信号，打开或关闭酶。这是理性设计（可以创建开关的初始蓝图）与定向进化（可以微调其线路以达到完美）协同作用的证明。

展望未来：面对进化的设计

最后，蛋白质设计正赋予我们一种诱人的新能力：预测并反制进化本身的力量。在抗击抗生素耐药性的斗争中，这一点至关重要。

当我们使用抗生素时，我们给细菌施加了巨大的选择压力，而进化在寻找逃逸路线方面是无情的，通常是通过药物靶点蛋白的突变。我们如何设计更“抗进化”的药物？答案在于利用我们对蛋白质最深层限制的理解。一个真正稳健的策略是设计一种抑制剂，它模仿酶的天然底物，与相同必需的、具有催化活性的、高度保守的残基结合。其结合能应来自一个分布式的相互作用网络，而不是单一的强相互作用。在这种情况下，任何削弱药物结合的单一突变也可能削弱酶的基本功能，从而给细菌带来高昂的适应性成本。此外，如果产生耐药性需要不止一个，而是多个协同突变，那么统计上的障碍将变得巨大。这不仅仅是药物设计；这是进化预测。我们正在与进化下棋，并利用蛋白质结构和功能的基本规则来设计一个让我们的对手几乎没有胜算的局面。

从增强治疗药物到构建纳米材料，从创造新的挽救生命的酶到设计抗进化的药物，蛋白质重设计正在实现其承诺。它是讲生命语言的艺术和科学，不仅仅是为了理解它，更是为了用它创作出新的、优美的分子诗篇。