第一性原理计算：从量子理论到材料设计

玻尔百科

定义

第一性原理计算：从量子理论到材料设计是指一种直接从基本量子力学原理出发推导材料性质的计算方法，具有超越经验方法的普遍预测性。该方法在科学领域广泛应用于实验解释、药物研发和材料设计，其准确性依赖于包括哈特里-福克理论在内的一系列近似处理。目前，研究者正通过结合第一性原理的精确性与机器学习的计算速度，来克服计算成本过高带来的挑战。

核心要点

第一性原理计算从基本量子力学出发推导材料性质，提供了超越经验性、数据驱动方法的普适预测能力。
ab initio 方法的准确性涉及一个近似的层级结构，包括基础的 Hartree-Fock 理论和对基组的仔细选择。
这些计算被广泛应用于科学领域，用于解释实验、预测反应速率、理性设计药物和材料，甚至模拟原子核。
主要挑战是计算成本的“指数墙”，现在正通过将第一性原理的准确性与机器学习的速度相结合来应对。

引言

我们如何预测一种材料的性质？一种方法是查阅手册，依赖于一个世纪以来积累的实验数据。这种经验方法对于已知物质来说既快速又可靠。但如果这种材料从未被制造出来呢？如果它只存在于遥远的星云中，或者仅仅是药物设计师脑海中的一个概念呢？为此，我们需要一种更根本的方法——一种从零开始构建知识的方法。这就是第一性原理（或称 ab initio）计算的世界，它是一个强大的范式，仅利用量子力学定律就能从物质的原子组成来预测其行为。本文将为这个计算密集但见解深刻的领域提供一份指南。

我们将从第一章“原理与机制”开始，探讨区分 ab initio 方法与经验方法的核心思想。我们将揭示其理论机制，从势能面的概念到 Hartree-Fock 方法和基组选择等巧妙的近似，这些都使得计算成为可能。然后，在第二章“应用与跨学科联系”中，我们将看到这些原理的实际应用。我们将遍览化学、生物学、材料科学甚至核物理领域，见证第一性原理计算不仅用于重现已知事实，还用于预测未知、设计新颖解决方案，并推动科学前沿的发现。

原理与机制

“从头算起”的真正含义是什么？

想象一下，你想了解水的性质。你可以走经典工程师的路线：在手册中查找其沸点、密度和热容。你可以使用描述水如何流动、结冰以及与其他物质相互作用的成熟公式。这种方法是经验性的；它建立在大量先前的观察和测量之上。它快速、可靠且极其有用。这就是我们在化学中所称的经典力场背后的精神。为了预测水分子的能量，人们使用一个简单的、预先写好的方程，就像食谱书中的一道菜谱，其中的成分如键长和键角，以及参数如弹簧刚度都经过精心调整以匹配实验数据。

现在，想象另一种方法——物理学家的路径。你说：“我对水一无所知，只知道它是由两个氢原子和一个氧原子组成的。而且我知道支配宇宙的基本定律：量子力学和电磁学。” 你仅从这些出发点，而且只从这些出发点，开始推导其他一切。你不是从关于水的实验数据开始，而是从自然界的基本常数开始：电子的质量、其电荷、普朗克常数。这就是第一性原理，或 ab initio，计算的哲学。对于水分子原子的每一种可能排列，你都求解量子化学的主方程——薛定谔方程，以找到围绕原子核飞速运动的电子的能量。

根本的区别在于起源和目标。经验方法虽然强大但有限；其为水设计的“配方”对于一个非设计目标的分子知之甚少。相比之下，ab initio 方法则拥有一个宏伟的普适性承诺。因为量子力学定律对所有物质都相同，所以用于预测水性质的计算机制同样可以应用于遥远星云中新发现的分子，或是一个从未存在过的潜在药物分子。它的目标不仅仅是重现已知，更是预测未知。

所有可能性的地图：模型的层级结构

化学的核心是势能面（PES）的概念。可以把它想象成分子的地形图。图上的低洼山谷代表稳定的分子，如 $H_2O$ 或 $CH_4$ 。连接这些山谷的山隘是过渡态——分子在化学反应过程中必须经过的瞬时高能构型。这些山隘的高度决定了反应发生的速度。所有的化学——结构、稳定性、反应性——都编码在这个表面的景观之中。

我们用来绘制这片景观的方法形成了一个优美的层级结构，每种方法都有其自身的哲理和权衡。我们可以用一个简单的类比来概括这一点：

经典力场是“答案集”。它们速度极快，几乎可以瞬间告诉你一个标准分子在标准构型下的能量。但它们对底层的电子行为毫无洞察，并且只对为其参数化的特定类型的问题可靠。例如，断键是其词汇中完全不存在的现象。
Ab Initio 方法是“物理教科书”。它们包含了完整、基础的理论。原则上，你可以用它们计算任何东西。它们具有普适性，并能提供对支配化学键的电子结构的深刻洞察。但是，就像从教科书中解决一个复杂问题一样，它们计算量巨大，并且需要对基础理论有仔细的理解。
半经验方法是“工程师手册”。它们代表了一种绝妙的折衷。它们从与 ab initio 方法相同的量子力学框架开始，但走了明智的捷径。它们用参数、巧妙的近似以及从实验或更高级别理论中拟合的数据来替代最困难的计算。它们保留了描述电子效应（如成键）的能力，但比纯粹的 ab initio 方法快几个数量级。它们是实용的工具，但其可靠性与它们所训练的化学空间有关。对于 ab initio 方法至关重要的概念，如微妙的基组重叠误差，在半经验方法中变得模糊并被吸收到参数化中，使其不直接适用。

理解这个层级结构是关键。没有哪一种是“最佳”方法；只有适合工作的工具，其选择需要平衡对准确性、洞察力和计算可行性的需求。

构建波函数：巧妙的近似

我们到底如何进行 ab initio 计算？对于任何超过一个电子的分子，精确求解薛定谔方程都是不可能的。所以，我们必须进行近似。整个量子化学领域，在某种意义上，就是进行有物理动机且可系统改进的近似的艺术。

这个旅程几乎总是从 Hartree-Fock (HF) 方法开始。HF 的核心思想既简单又深刻：它假设每个电子不是在其他每个电子瞬时、抖动的场中运动，而是在由所有其他电子创造的光滑、静态的平均电场中运动。这是一种平均场理论。这个近似的致命缺陷是它忽略了电子相关性。电子作为同种电荷的粒子，会主动避开彼此。这种错综复杂的相关性舞蹈所带来的能量降低就是相关能，而 HF 方法完全忽略了它。这就是为什么 HF 能量总是高于真实能量的原因。

那么，为什么这个“有缺陷”的方法会成为量子化学的基石呢？因为 Hartree-Fock 方法给了我们可以写成单个 Slater 行列式（一种针对多电子体系的特定数学构造）的最佳波函数。更重要的是，它提供了一组最优的单电子波函数，称为分子轨道，它们是更强大理论的完美起点——一个参考态。像组态相互作用、Møller-Plesset 微扰理论和耦合簇这样的方法都是“后 Hartree-Fock”方法，旨在通过建立在 HF 计算所奠定的基础上，系统地恢复缺失的相关能。Hartree-Fock 为我们提供了舞台和演员；后 HF 方法则指导了电子相关的美丽而复杂的戏剧。

现实的要素：选择你的基组

为了在计算机上求解 Hartree-Fock 方程，我们还需要一个关键要素：基组。一个分子轨道是三维空间中一个复杂的数学函数。为了在计算上处理它，我们必须将其表示为以每个原子为中心的更简单的预定义函数的组合。这组预定义的函数就是基组。

这就像用一组预制的积木来建造一座雕塑。如果你只有粗大的立方体积木，你只能建造出人脸的粗略近似。但如果你有一套形状和大小各异的丰富积木，你就能创造出更细致、更准确的表示。你计算的质量从根本上受到你的基组“积木”质量的限制。选择正确的基组是一门艺术，其指导原则是你试图解决的问题的物理性质。

例如，如果你想描述分子的电子云在电场中如何变形怎么办？这个性质，即极化率，对于理解分子如何与光相互作用至关重要。为了捕捉这种形变，你需要让电子有自由度移动到比孤立原子更复杂的形状中。这是通过向你的基组中添加极化函数——更高角动量的函数（如碳上的 $d$ -轨道或氢上的 $p$ -轨道）——来实现的。没有它们，你的计算就像试图用直尺来描述一个弯曲的物体；你得到的极化率，以及它在振动过程中的变化（这决定了拉曼光谱），将完全错误。

或者考虑计算一个阴离子（一个带有多余电子的原子或分子，如氟离子 $F^-$ ）的性质。这个多余的电子被松散地束缚，其波函数延伸到远离原子核的地方。为了描述这个在空间上延展的、“蓬松”的电子云，你需要本身就很宽广和分散的基函数。这些被称为弥散函数。如果你试图在没有它们的情况下计算涉及阴离子的反应，结果可能是灾难性的。你实际上是在试图将电子挤入一个过小的空间，这人为地提高了它的能量。这可能导致荒谬的错误预测，比如得出某个已知有显著能垒的反应根本没有能垒，仅仅因为你对反应物的描述太差了 [@problemid:1504121]。

即使是我们的近似也有近似。一个常见且通常非常安全的捷径是冻芯近似。我们假设原子的最内层核心电子（如碳的 1s 电子）被紧紧束缚，不参与化学成键。我们“冻结”它们，只计算外层价电子的行为。对于周期表的大部分元素来说，这非常有效。但大自然总爱给我们惊喜。对于像镓（Ga）这样的重元素，最外层的“核心”电子（3d 殼层）并不像人们想象的那样深埋。它们的能量与价电子足够接近，可以相互作用并使其运动相关联。这种芯-价相关对化学键强度有真实、可测量的影响。如果你对氮化镓（GaN）使用冻芯近似并冻结这些 3d 电子，你就会忽略这种重要的稳定相互作用，并显著低估键能。这是一个美丽的提醒，即使在 ab initio 理论中，对眼前系统深刻的物理直觉也是不可或缺的。

巨大挑战：攀登复杂性的高山

拥有所有这些力量，为什么我们不能直接使用最准确的 ab initio 方法来设计任何我们能想象到的药物或材料呢？答案在于一个严峻的障碍：指数墙。

考虑一下生物学中的一个巨大挑战：从氨基酸序列预测蛋白质的三维结构。蛋白质折叠成其功能形状不是随机的，而是沿着其势能面上的梯度走向一个深谷——全局能量最低点。对此问题的 ab initio 方法意味着试图从头绘制这个景观以找到那个最低点。

问题在于景观的巨大规模。一个由100个氨基酸组成的小蛋白质，如果每个氨基酸只有三种可能的局部形状，那么它可能存在的总构象数就是 $3^{100}$ 。这个数字远大于宇宙中的原子数量。这是 Levinthal's paradox 的现代体现。虽然真实的蛋白质在毫秒内完成折叠，但一台试图暴力破解所有可能性的计算机会运行比宇宙年龄还長的時間。

这种可能状态数量的组合爆炸是 ab initio 方法的准确性和可行性随着系统规模增大而急剧下降的唯一最根本的原因。这就是为什么对于像蛋白质这样的大体系，如果可能的话，像同源建模这样基于模板的方法在绝大多數情況下被首选；它们巧妙地绕过了全局搜索问题，因为它们假设答案与一个已知结构相近。

因此，我们站在一个前沿。一边是我们拥有的美丽、普适的量子力学定律。另一边是呈指数级增长的计算复杂性高山。第一性原理计算领域持续的追求，就是在这座高山上寻找更巧妙的路径——通过更好的算法、更聪明的近似以及现代超级计算机的原始力量——让我们能够从最基本的规则出发，绘制出越来越广阔的化学宇宙。

应用与跨学科联系

好了，我们已经花了一些时间来研究这些“第一性原理”计算的机制。我们已经看到，通过认真对待量子力学的基本定律，我们可以坐在电脑前求解原子集合中电子的行为。但这么做的意义何在？这仅仅是理论物理学家和化学家的一种复杂的娱乐，一种产生别人并不关心的数字的方式吗？

绝非如此！今天，我们将看到这个“游戏”实际上是我们探索世界最强大、最通用的工具之一。我们将踏上一段旅程，看看这些计算如何不仅仅是目的本身，而是一个推动几乎所有科学和工程领域进步的发现引擎。我们将从简单的计算转向理解、预测，以及最激动人心的——设计。

聚焦分子世界：理解结构与性质

我们用新的计算显微镜要做的第一件、最明显的事情就是观察事物。如果我们的计算足够好，它们应该能重现我们在实验室中可以测量到的东西。这不仅仅是为了沾沾自喜；理论与实验之间的这种对话才是真正理解的开始。

以光谱学为例，这是研究物质如何与光相互作用的学科。实验光谱通常很杂乱，是一系列因温度而展宽、因测量设备局限而模糊的峰。第一性原理计算可以为我们提供单个孤立分子的“完美”、理想化的光谱。但其真正的威力在于我们用它来构建整个实验的完整模型时才得以显現。我们不仅可以模拟分子的量子跃迁，还可以模拟热运动的混沌碰撞以及光谱仪本身的模糊效应。通过将这种完全实现的模拟与真实世界的数据进行比较，我们可以自信地解开所有这些效应，并以惊人的精度提取出真实的、底层的分子性质。这种在高水平理论模型和高分辨率实验光谱之间的严谨反复验证对于获得可以进行有意义比较的无偏结果至关重要。

光谱学不仅仅关乎事物的颜色；它关乎结构。对化学家来说，确定分子三维结构的金标准是核磁共振（NMR）。NMR谱是分子原子连接性的极其详细的地图，但它给出的数字——所谓的“耦合常数”或 $J$ 值——源于电子与原子核磁矩之间一种极其微妙的量子舞蹈。为什么一个质子会“感觉”到三个化学键之外的另一个质子的自旋？

第一性原理计算让我们能够剖析这种效应并观察其组成部分。当我们计算 $J$ -耦合时，我们发现它不是一回事，而是不同物理机制的协同作用。对于邻近原子，主导效应通常是费米接触相互作用，这取决于原子核处的电子自旋密度。但对于相距较远的原子，另一种效应，即各向异性的自旋-偶极相互作用，可能会变得出人意料地重要。通过在计算中开启和关闭这些效应，我们可以精确地理解是哪些物理相互作用产生了我们在实验中看到的信号，从而揭示了单个测量数字背后隐藏的物理学。

原子的舞蹈：预测变化与反应性

分子不是静态的博物馆展品。它们移动、振动、碰撞并发生反应。化学的真正魔力就在于这种转变。我们的计算能否预测这种化学舞蹈的速率？

反应的速度由其能量景观或势能面决定。要发生反应，分子通常必须攀登一个能垒，通过一个称为过渡态的高能构型。这个能垒的高度在很大程度上决定了反应速率。计算这个“山隘”的结构和能量是第一性原理方法非常擅长的。但有一个实际问题：最准确的“金标准”计算在计算机时间上非常昂贵。

这就是聪明才智发挥作用的地方。我们不必每次都进行最佳计算，而是可以使用一小组珍贵的高质量计算来“教导”或“校准”更便宜的日常计算工具。这就像用原子钟的几次测量来校正全国的每一块手表。对于一个化学反应，一个稳健的校准要求我们分别考虑活化焓（ $\Delta H^{\ddagger}$ ）、活化熵（ $\Delta S^{\ddagger}$ ）以及粒子可以穿过而非越过能垒的奇特量子现象——隧穿效应中的误差。通过构建一个物理上合理的校正模型，我们可以为庞大的化学网络生成可靠的反应速率，这是仅靠高水平理论无法实现的。

这种化学舞蹈在活细胞内最为错综复杂和重要。酶是一种纳米级机器，进化来加速特定反应，通常是通过为其创造一个微小的、专门的环境。想象一下，将一种像天冬氨酸这样的氨基酸（它在水中很乐意放弃一个质子，pKa约为3.9）埋藏在蛋白质油腻的非极性内部深处。它还会表现出同样的行为吗？

利用一种称为热力学循环的巧妙逻辑技巧，我们可以使用第一性原理计算来计算这种转移的能量代价。我们发现，将中性质子化的天冬氨酸移入蛋白质需要一些能量，但移动带电荷的去质子化版本则需要巨大的能量。非极性环境根本无法稳定负电荷。结果呢？埋藏的天冬氨酸的 pKa 会飙升，可能达到15或更高。它变成了一种弱得多的酸。这种我们可以从第一性原理预测的化学特性的巨大转变，通常是酶执行其功能的关键。

从预测到设计：物质的理性工程

到目前为止，我们一直在使用我们的计算来理解世界的样子。但这种方法最令人兴奋的前景是构建我们想要的世界。这是从科学到工程的转变，在原子尺度上进行。

考虑一下寻找新药的过程。一种常见的方法是找到一个能与特定蛋白质靶点紧密结合的分子。我们如何设计这样的分子？我们可以从一种已知的活性药物开始，利用量子力学绘制出它的“静电面孔”——它向世界呈现的由其独特电子分布决定的正负电势景观。这张图，即所谓的药效团，揭示了其分子身份的关键特征：这里有一个喜欢提供氢键的点，那边有一个接受氢键的区域。这个药效团成为了一个经过量子力学精炼的蓝图，一个我们可以用来扫描庞大数字文库的搜索查询，以寻找具有相同基本“面孔”并因此可能与同一生物靶点结合的新型不同分子。

或者，也许我们想构建一种全新的材料。想象一下创建一个定制的聚合物“陷阱”，一种旨在从血液或废水等复杂混合物中选择性地捕获特定类型分子的材料。这就是分子印迹聚合物的目标。挑战在于选择正确的化学构件（单体），以创建一个具有完美匹配目标分子形状和化学性质空腔的聚合物。我们无需在实验室合成和测试数百种可能性——这是一个漫長而昂貴的过程——而可以在计算机上完成。我们可以快速计算目标分子与数十种候选单体之间的量子力学相互作用能，识别出形成最强、最有利键合的单体。这种计算预筛选使我们能够理性地选择最有前途的配方，指导实验工作并极大地加速新功能材料的发现。

当然，ab initio 方法有其局限性。我们还无法从第一性原理计算整个巨大蛋白质的结构；它实在太大了。但正是在这里，这些方法在一个更大的计算工具生态系统中找到了其关键作用。对于一个新发现的蛋白质，我们可能会发现其序列的一部分看起来很熟悉，与一个已知结构的蛋白质相关。对于那部分，我们可以使用更简单的、基于模板的方法，如同源建模。但蛋白质的另一部分，那个序列对科学来说是全新的域呢？那里我们没有模板，没有指南。我们必须从头构建其结构。而那时，我们就要调用 ab initio 建模的全部、纯粹的力量，仅根据物理定律来预测其折叠。

拓展前沿：新视野与意外联系

这种思维方式——从底层构建——的影响范围确实非常广阔，延伸到你可能意想不到的领域。

让我们放大。再放大。穿过电子，穿过真空，进入微小、致密的原子核。这里的参与者不是原子，而是质子和中子，支配力不是电磁力，而是强核力。我们可以应用同样的“第一性原理”思想吗？是的。核理论家现在正在进行 ab initio 计算，旨在从单个核子之间的基本、测量的相互作用出发，构建整个原子核的性质——其大小、壳层结构、激发态。这是一个巨大的计算挑战，推动了超级计算的边界，但它展示了物理学美丽的统一性：量子多体问题再次出现，只是换了一批角色和一套不同的力学脚本。

现在让我们缩小回来，参观一下同步加速器，这是一台产生强度和纯度都令人难以置信的X射线的巨大机器。科学家们使用这些X射线来探测材料的局部原子结构，特别是那些缺乏晶体完美重复秩序的材料。由此产生的测量结果，即 XANES 谱，通常只是一条复杂的曲线。它是局部原子环境的指纹，但它是用一种复杂的量子力学电子散射代码写成的。为了破译它，我们需要一把钥匙。Ab initio 模拟提供了这把钥匙。我们可以计算不同候选原子排列的预期光谱——这个键是弯曲的吗？那个原子是否缺失？——然后找到其模拟光谱与实验光谱匹配的结构。理论赋予了测量意义，将神秘的曲线变成了原子尺度世界的详细图像。

最终的前沿是什么？也许是一种合作关系。单次的 ab initio 能量计算在计算上是昂贵的，而一个化学反应的完整模拟需要数百万次这样的计算。这在很大程度上仍然是不可能的。但是，如果我们能用几千次这样昂贵、高精度的计算来训练一个机器学习模型呢？这个机器学习模型，就像一个聪明的学生，学习了原子位置和势能之间复杂、高维的关系。结果是一个代理模型——一个机器学习势能面——它不仅准确，而且快如闪电。最有效的策略涉及一个主动学习循环：我们使用快速的机器学习模型来探索能量景观，识别出既物理上重要又模型最不确定的区域，然后在那里进行一次全新的、单一的 ab initio 计算，以提供改进模型的基础真值。这种第一性原理的严谨性与AI的速度和灵活性之间的美妙协同作用正在彻底改变我们能够模拟的对象，为模拟十年前我们只能梦想的化学复杂性打开了大门。

我们已经看到，一个源于量子力学定律的单一理论框架如何能应用于极其多样化的问题。它让我们能够解释光谱的微妙细节，预测反应的速度，设计新的药物和材料，窥探原子之心，甚至为下一代科学人工智能提供动力。“第一性原理”方法，通过坚持从头构建，为探索我们的宇宙提供了一个普适的、可预测的、并且不断扩展的工具包。