
当一种材料由数量惊人的原子组成时,我们如何预测它的性质——它的强度、颜色或电导率?秘诀在于理解原子间作用力,这些无形的线索编织了物质的肌理。虽然支配这些原子的底层量子力学对于块状材料来说复杂到不可能直接求解,但一系列强大的近似方法使我们能够从头开始构建一个有效且具有预测性的图景。本文旨在探讨为这些力建模的挑战,弥合量子理论与宏观观测之间的鸿沟。
本文探讨了原子间作用力的基本原理和实际应用。在“原理与机制”一章中,我们将深入探讨理论框架,从 Born-Oppenheimer 近似和势能面的概念开始。然后,我们将历览一系列模型,从简单的对势描述到复杂的多体势和机器学习势,并了解它们如何与材料的振动性质相联系。随后,“应用与跨学科联系”一章将展示这些知识如何被应用,从分子振动、晶体结构到通过计算模拟设计先进材料,无所不包。
想象一下,试图仅通过观察一根线来理解一张巨大而复杂的挂毯的本质。这似乎是不可能的。然而,在材料科学中,我们面临着类似的挑战。一块铁、一颗石英晶体或一杯水都由数量惊人的原子组成——数量级约为 。我们怎么可能期望理解,更不用说预测它们的集体行为,而正是这些行为产生了我们观察到的性质,如强度、颜色和电导率?
秘诀在于理解原子之间的相互作用。这些原子间作用力是编织物质肌理的无形丝线。乍一看,这似乎只会加深谜团。每个原子都与所有其他原子相互作用,电子和原子核都遵循着复杂的量子力学定律。情况似乎复杂得令人绝望。但在这里,大自然为我们提供了一系列绝妙的简化原理,使我们能够从头开始,构建一幅关于材料如何运作的美丽且出奇有效的图景。
第一个也是最重要的简化来自一个简单的观察:原子核的质量比电子大数千倍。例如,一个质子大约比电子重1836倍。想象一只敏捷的苍蝇在一头行动迟缓的大象周围嗡嗡作响。大象移动得如此之慢,以至于在任何瞬间,苍蝇都可以飞速绕着它探索整个周围环境,几乎瞬间就能根据大象的新位置调整自己的路径。
这就是 Born-Oppenheimer 近似 的精髓。材料中轻而快的电子会“瞬间”适应重而慢的原子核的运动。这意味着我们不必解决所有物体同时运动这个不可能解决的复杂问题。相反,我们可以玩一个概念游戏:首先,我们将原子核冻结在一个特定的排列中,这个构型由它们所有位置的集合 表示。然后,我们求解在这些固定原子核的静电场中运动的电子云的基态(最低)能量。
这个过程给了我们一个单一的数字:该特定原子核排列下的电子能量。如果我们对每一种可能的原子核排列重复这个过程,我们可以想象一个宏大的景观,一个高维空间中的曲面,其中每个点代表一个原子核构型,其高度代表总能量。这个景观就是著名的势能面(PES),表示为 。
一旦我们有了这个曲面,电子就从我们的显式考虑中消失了。原子核现在的行为就像在这个景观上滚动的弹珠。作用在任何给定原子核上的力就是其位置处曲面梯度的负值——即最陡的下坡方向:。这个源于量子力学的单一曲面,现在决定了原子的整个经典运动:它们的振动、扩散,以及它们在受推或拉时的响应方式。
这个势能面是我们探索的核心对象。在我们尝试近似它之前,我们必须认识到它从底层物理定律继承而来的基本对称性。如果你将一块晶体在空间中整体移动或旋转,其内能不会改变。同样,因为所有电子都是相同的,同一种元素的所有原子核也是相同的,交换两个相同的原子也必须保持能量不变。因此,任何有效的势能面 都必须在全局平移、全局旋转和相同原子的置换下保持不变。
真实的势能面是一个极其复杂的对象,由电子的完整多体量子力学决定。使用密度泛函理论(DFT)等方法“从头算”(a-priori,或 ab initio)来计算它是可能的,但计算成本非常高,以至于我们一次只能对几百或几千个原子进行计算。要模拟理解许多材料性质所需的数十亿原子,我们需要一种更快的方法。我们需要构建一个近似的、解析的 PES 模型——一个力场或原子间势。
构建这些势的艺术就像为一台错综复杂的机器绘制一幅简化草图。你识别出最重要的部件,并以一种能捕捉其基本功能的方式将它们连接起来。我们能做的最简单的假设是,总能量只是所有不重复的原子对之间相互作用的总和。这就是对势近似。
这个对势相互作用 应该是什么样子的?如果你试图将两个原子推得非常近,它们的电子云会开始重叠。泡利不相容原理是量子力学的一条基本规则,它禁止两个电子占据相同的状态,这导致了一种极强的排斥力,防止原子相互塌陷。这种泡利排斥作用是一种非常短程的效应,通常用一个陡峭的指数函数来建模,比如 。
同时,必须有一种吸引力将材料维系在一起。即使在像氩气这样的稀有气体中,原子是中性且球对称的,也存在吸引力。这源于一种微妙的量子舞蹈。原子的电子云在不断涨落,产生一个微小而短暂的电偶极子。这个瞬时偶极子会在邻近的原子中感应出一个相应的偶极子,而这两个偶极子相互吸引。这就是普适的伦敦色散力,一种范德华相互作用,其主导项具有 的特征距离依赖性。
将这些结合起来,我们就得到了一个经典的函数形式,比如Buckingham 势,。它在短程具有软排斥,在长程具有温和的吸引,并有一个特征性的能量最低点,定义了一个稳定的键长。为了描述特定的共价键,常使用像Morse 势这样的形式,它明确包含了键的平衡距离()、解离能或势阱深度(),以及一个控制键刚度的参数(),该参数又决定了其振动频率。
这些对势模型优美、简单且直观。对于某些体系,如稀有气体,它们的效果非常好。但对于大多数材料,它们隐藏着一个致命的缺陷。对势近似做出了一个深刻且可检验的预测。对于任何立方晶体(如铜、铝或盐),如果作用力纯粹是中心力和对势,那么它的两个弹性常数(测量其在不同方向上刚度的量)必须相等。这就是著名的柯西关系:。
这是一个直接的、可证伪的预测。而当我们测量真实材料的弹性常数时,我们发现它几乎总是错误的!对于大多数金属, 不等于 。这个“柯西问题”是19世纪物理学的一个深层难题,它的解决指向一个基本事实:两个原子之间的相互作用取决于其他原子的位置。力不是纯粹的对势;它们本质上是多体的。
以硅为例,它是我们数字世界的核心。它形成金刚石立方结构,这是一种非常开放的晶格,每个原子与四个邻居以完美的四面体形式键合。任意两个键之间的夹角约为 。这种四面体几何结构是方向性 共价键的结果。如果你试图弯曲这个角度,你会遇到一个强大的恢复力。一个简单的对势,只关心距离,对角度是“盲目”的。在只使用对势的模拟中,硅的开放金刚石结构是不稳定的,会塌陷成更密集的堆积结构。为了稳定硅,势函数必须包含明确依赖于角度的项,这意味着它必须至少同时考虑三个原子。这是一个典型的多体效应。
一旦我们接受对势世界过于简单,我们就可以设计出更复杂的模型,以拥抱成键的多体性质。
角势:对于像硅这样的共价材料,我们可以明确地在势函数中添加三体项,为偏离理想键角创建能量惩罚。精确模拟硅的 Stillinger-Weber 势就是这种策略的一个典型例子。
嵌入原子方法(EAM):金属则不同。价电子没有被锁定在方向性的键中,而是形成一个弥漫于整个晶体的离域“电子海”或“电子气”。为金属开发的 EAM 巧妙地捕捉了这一点。一个原子的能量有两部分:一个标准的对势求和项和一个多体的“嵌入能”。这个嵌入能取决于该原子所“嵌入”的局域电子密度,该密度通过对其所有邻居的贡献求和来计算。因此,一个有很多邻居的原子(如在体相中)与一个邻居很少的原子(如在表面上)即使对势距离相同,其能量也不同。这种至关重要的环境依赖性使得 EAM 能够正确预测对势失败的性质,如表面能和对柯西关系的违背。
反应力场(ReaxFF):为了模拟化学——即化学键的实际形成与断裂——我们需要一种更高级的描述。反应力场引入了键级的概念,这是一个依赖于局域原子环境的变量,它连续地追踪一个键的强度,从完整的共价键到零。这通常与一个允许原子电荷浮动的方案相结合,使得这些势能够模拟复杂的化学反应、燃烧和催化过程。
这里有一个清晰的层级结构:随着我们增加更多的物理真实性,从简单的对势到角项、嵌入函数再到反应键级,势的计算成本也随之增加。模拟的艺术在于选择能够捕捉手头问题核心物理的最简单模型。
几十年来,原子间势的开发是一项艰苦的手工技艺,需要深厚的物理直觉和费力地将参数拟合到实验数据。机器学习的现代纪元已将这门手艺转变为一门科学。
机器学习原子间势(MLIPs)的核心思想惊人地直接:与其猜测一个函数形式,为什么不利用像神经网络这样的通用函数逼近器的力量,直接从从头算数据中学习 Born-Oppenheimer 势能面呢?
这个过程是这样的:人们对一种材料进行大量昂贵的 DFT 计算,采样各种各样的原子构型——完美的晶体、有缺陷的晶体、表面、液体、应变结构等等。这会生成一个包含原子位置及其对应的“真实”量子力学能量和力的数据库。然后训练一个 MLIP,使其找到从一个原子的局域环境到其能量的映射,从而使这些原子能量的总和能够再现数据库中的总 DFT 能量和力。
一个关键的创新是解决了对称性问题。模型必须遵守基本的物理不变性。这是通过首先将一个原子邻居的原始坐标转换为一个数学“描述符”来实现的——这是一个数字向量,它唯一地表征了局域环境,但本身对旋转、平移和相同邻居的置换是不变的。这个描述符随后成为机器学习模型的输入。
这种方法的力量是巨大的。MLIPs 可以达到接近 DFT 的精度,但计算成本却便宜数百万倍,从而实现了前所未有规模和复杂度的模拟。然而,这种力量伴随着一个关键的警告:可移植性。MLIP 是一个专家级的插值器。它只对那些与其训练期间见过的原子环境相似的环境可靠。如果你让它预测一个全新结构的能量——这是一种外推行为——它的预测可能会出现离奇的、不符合物理规律的错误。
因此,一个 MLIP 的可信度范围,即其训练域 ,是由其训练数据中包含的热力学和结构环境集合所定义的。对于一个像高熵合金这样的复杂体系,它包含多种不同元素,并以无序方式排列,确保训练集包含无数种可能的局域化学基元的代表性样本是一项巨大的挑战,也是限制模型可靠性的主要因素。
无论是手工推导还是由机器习得,势能面包含了关于材料结构和动力学的所有信息。它揭示的最美丽的联系之一是与材料的振动。
晶体中的原子不是静止的;它们在各自的平衡位置周围不断振动。这些不是混乱的、个体的运动,而是集体的、同步的波,在晶格中传播。这些量子化的晶格振动被称为声子,它们是固体中热和声音的基本载体。
PES 和声子之间的联系是直接而优雅的。连接原子的“弹簧”的“刚度”由原子间力常数(IFCs)给出,它就是势能相对于原子位移的二阶导数:。这些 IFCs 是支配晶格所有谐振动的基本参数。
为了找到允许的振动模式,我们构建一个动力学矩阵,其矩阵元是实空间力常数的质量加权傅里叶变换。求解这个矩阵的本征值问题,,就能得到我们所需要知道的一切。本征值 给出了允许的声子模式的频率平方,而本征矢量 描述了每种模式下原子位移的精确模式。对于一个原胞中有 个原子的晶体,总是有 个这样的声子支。其中三个是声学支,邻近的原子同相运动,对应于长波长的声波。其余的 个是光学支,其中晶胞内的原子相互反向运动,并且可以被光激发。
当然,真实的原子相互作用并非完美谐和。真实的 PES 不是一个完美的抛物线。这些偏离谐和性的部分,被称为非谐性,由势能的三阶(及更高阶)导数捕获,。虽然非谐性通常很小,但它却是一些最基本的物质性质的原因,例如热膨胀(在一个纯谐和晶体中,加热不会使其膨胀)和有限的热导率。
我们的旅程,从 Born-Oppenheimer 近似到声子错综复杂的舞蹈,都建立在几个基本假设之上。了解这张地图的边缘在哪里至关重要。
经典原子核:我们将原子核视为经典的质点。对于大多数原子,这在室温下是一个极好的近似。但对于最轻的元素——氢,量子效应总是很重要的。一个质子是如此之轻,以至于它的波粒二象性不容忽视。它可以隧穿能量壁垒而不是翻越它们,这个过程对于理解氢在矿物中的扩散和许多生物过程至关重要。缺乏这种量子行为的经典模型可能会错上好几个数量级。
绝热世界:我们假设电子总是保持在其基态。这在几个重要的情景中会失效。在极端条件下,例如在冲击加载期间或被高能辐射撞击时,电子可能会被大量激发成高温等离子体,而晶格仍然保持冷却。这些电子随后通过将能量转移给声子而冷却下来,这是一个根本性的非绝热过程,我们的单势能面模型无法描述。在具有多个能量相近的电子态的材料中,它也会以更微妙的方式失效。例如,在地球深部地幔的含铁矿物中,压力可以导致铁离子从“高自旋”电子态转变为“低自旋”电子态。在这个转变点附近,两种状态都是可及的,单一 PES 的图景就失效了。为一个状态训练的经典势将无法描述该转变的物理过程。
认识到这些局限性并不会削弱我们模型的威力。相反,它照亮了我们知识的前沿,并引导我们走向下一层次的理论。原子间作用力的故事是科学过程的一个完美例子:我们从一个简单、直观的图景开始,用现实来检验它,发现它的缺陷,然后构建更复杂、更强大的模型,使我们越来越接近世界真实、错综复杂而又美丽的运作方式。
我们花了一些时间学习游戏规则——原子间那些我们称之为原子间作用力的基本推拉力。人们可能容易认为这是一个相当抽象和学术的事情,是一套支配着看不见的粒子的方程。事实远非如此。这些简单的规则正是宇宙随之起舞的音乐。现在,让我们走出理论的安静练习室,进入现实世界的宏伟音乐厅。让我们看看这些基本的吸引和排斥如何编排一切,从宝石的颜色、钢铁的强度到生命错综复杂的机制。
想象一下由多个原子构成的最简单物体:一个双原子分子,比如氢气 。我们可以把它想象成两个由弹簧连接的小球。那根弹簧的“刚度”,即它对拉伸或压缩的抵抗力,是维系分子在一起的原子间作用力的直接度量。就像任何弹簧上的质量系统一样,这个分子不是静止的;它在不断振动,原子来回振荡。这个振动的频率不是任意的。它由两件事精确决定:弹簧的刚度(力常数 )和原子的质量()。
现在,如果我们玩个小把戏会发生什么?我们可以不用普通的氢原子,而是用它更重的同位素——氘()来构建氢分子。一个氘原子核里除了质子还有一个中子,使其大约比氢重两倍。但在化学上,它几乎是相同的。决定原子间作用力的电子云是相同的。所以,我们的弹簧有相同的刚度 ,但其两端的质量现在重了一倍。你期望会发生什么?想象两个相同的秋千。一个上面坐着一个小孩子;另一个上面坐着一个重磅成年人。如果你给他们同样的推力,孩子会更快地来回摆动。原子也是完全一样的。更重的氘分子 振动得比更轻的氢分子 慢。这种质量依赖性具有深远的量子力学后果,改变了分子的最低可能振动能,即所谓的零点能。这种“同位素效应”不仅仅是一个奇闻;它是一个在化学和物理学中广泛使用的强大工具,用于探测反应机理和理解分子行为。
这个想法可以从单个分子完美地扩展到一个巨大的、有序的晶体。在一个由爱因斯坦提出的固体简化模型中,我们可以把晶体想象成一个原子晶格,每个原子都在由其所有邻居的作用力 tạo 成的“势阱”中振动。这个势阱的刚度再次由原子间作用力决定。如果我们用一种元素的较重同位素来构建晶体,原子振动会更慢。这改变了材料的一个基本热学性质,即爱因斯坦温度 ,它与振动频率成正比。通过简单地改变原子核的质量,而不改变它们之间的作用力,我们就可以调节材料的热学性质。
这种原子尺度的舞蹈会产生我们肉眼可见——或者至少,用红外相机可见——的后果。在像盐这样的离子晶体中,正负离子被固定在一个刚性晶格中。当这个晶格振动时,正负电荷来回移动,产生一个微小的、振荡的电偶极子。如果我们用红外光照射晶体,并且光的频率恰好与晶格的自然振动频率相匹配,就会发生壮观的现象。光会驱动原子振动进入一种狂热状态,晶体在该频率下与光的相互作用如此之强,以至于它几乎完美地反射了光。这种现象被称为剩余射线效应(Reststrahlen effect,源自德语“residual rays”),它使晶体对一种特定颜色的红外光表现得像一面镜子。而且,正如你现在可能猜到的,如果我们用更重的同位素来构建晶体,振动频率会降低,这种完美反射的“颜色”也会发生偏移。原子间的作用力决定了它们舞蹈的节奏,而那个节奏决定了材料如何与光相互作用。
原子间作用力不仅支配着原子的动力学;它们是物质的总建筑师,决定着我们周围一切事物的结构和性质。是什么让钻石成为已知最硬的物质,而铅却柔软易延展?答案完全在于原子间作用力的性质以及它们所构建的结构。在钻石中,碳原子被锁定在一个极其坚固的三维共价键网络中。在铅中,金属键较弱且方向性不强,允许原子更容易地相互滑过。
我们可以用称为弹性常数的数字来量化这种刚度。它们精确地告诉我们一种材料抵抗被挤压、拉伸或剪切的程度。而这些宏观性质是微观作用力的直接反映。思考一下当你把一块晶体置于巨大压力下时会发生什么,比如地球深处的压力。原子被推得更近,进入了它们相互作用势的陡峭排斥区域。它们会反抗,而且靠得越近,抵抗得越猛烈。在我们的弹簧类比中,弹簧在压缩下变得更硬。结果,整个晶体变得更难变形,其弹性常数增加。这种可预测的硬化是原子间势形状的直接结果,对于像地球物理学这样的领域,在模拟行星内部物质状态时至关重要。
我们理解这种联系的能力使我们自己也能成为建筑师。以控制热流的挑战为例。在大多数非金属固体中,热量仅仅是原子的集体抖动,由称为声子的振动波携带。如果我们想创造一种热绝缘体——一种阻挡热流的材料——我们需要找到一种方法来干扰和散射这些声子。我们该怎么做呢?我们可以利用我们对原子间作用力的知识。想象一下,构建一种由嵌入基体中的微小纳米颗粒组成的复合材料。如果我们设计它,使得纳米颗粒内部的原子间力常数与周围基体中的不同,我们就创造了一个“弹簧刚度”变化的景观。当声子波穿过这种材料并撞击基体和纳米颗粒之间的边界时,它会被散射,就像水波被一片巨石场打碎一样。这个原理,即在力常数不匹配的界面上散射声子,是工程先进热障涂层和能将废热转化为电能的热电材料的关键策略。
也许由原子间作用力构建的最令人惊叹的建筑是生命本身。蛋白质是生物学的“主力”分子,是氨基酸的长链。但蛋白质的功能并非仅由这条链决定;它是由其折叠成的错综复杂、独特的三维形状决定的。是什么引导这种折叠并维系最终结构的呢?不是构成链骨架的强共价键。相反,它是一个由大量更弱的原子间作用力——氢键、范德华力和静电相互作用——组成的庞大、协同的网络。例如,像 β-折叠这样构成许多蛋白质核心的稳定结构的形成,主要是由相邻链骨架上的原子之间精确模式的氢键所稳定的。一根绳索的力量不在于单根纤维,而在于成千上万根纤维的捻合。同样,一个蛋白质的稳定性和功能源于无数弱原子间作用力的集体行动,这是大自然对分子构造学精通的证明。
几个世纪以来,我们对材料的理解基于观察和实验。我们会混合、熔化和捶打物质,看看会发生什么。但我们对原子间作用力的深刻理解打开了一扇新的大门:计算模拟的世界。如果我们知道了游戏规则,我们能否在不进行真实世界实验的情况下预测结果?我们能否成为数字炼金术士,在计算机中逐个原子地设计新材料?
对原子间作用力的终极描述来自量子力学,但为成千上万甚至数百万个原子求解其方程在计算上是不可行的。因此,科学家们开发了巧妙的捷径:称为“原子间势”或“力场”的数学模型,它们旨在以极低的成本近似真实的量子力学力。
早期的模型,如“反应力场”,使用精心设计的数学函数,其参数经过调整以再现实验数据或量子计算结果。这些模型足够复杂,可以允许化学键断裂和形成,使我们能够模拟诸如金属表面在水中的腐蚀等复杂过程。虽然它们有局限性——作为经典模型,它们不能明确模拟驱动许多电化学反应的电子转移——但它们为化学的原子尺度动力学提供了一个前所未有的窗口。
今天,我们正处在一场由机器学习(ML)驱动的革命中。这个想法既简单又大胆:我们不再让专家设计势的数学形式,而是让计算机直接从数据中学习它。我们从量子力学中生成一个包含大量原子构型及其对应“真实”能量和力的库。然后,训练一个像神经网络一样的 ML 模型,以找到原子位置和作用于它们的力量之间的复杂关系。
为了使这些模型有效,我们必须聪明地训练它们。事实证明,仅仅教模型每个构型的能量是不够的。真正的奖赏是力,因为它们是驱动所有原子运动的根本。一种称为“力匹配”的强大技术,涉及训练模型同时再现来自量子数据的能量和力 [@problem-id:2759514]。Richard Feynman 曾说过,发生的一切都是力的结果。因此,直接教模型力能够产生一个远为稳健和准确的势,也就不足为奇了。
此外,这些模型必须遵守物理学的基本对称性。如果你旋转你的实验室,自然法则不会改变。原子间势能是一个标量,必须在旋转下保持不变,而力是矢量,必须随系统一起旋转。现代 ML 势,如“等变神经网络”,已将这些对称性融入其架构之中。这不仅确保了它们在物理上是正确的,而且也使它们效率大增,因为它们不必浪费时间从数据中学习这些基本原理。
新一代计算工具的回报是巨大的。我们可以使用 ML 势来加速寻找新催化剂的过程,在计算机上探索无数可能的反应路径以找到最高效的一条。我们可以模拟极端事件,比如来自核反应堆的高能粒子撞击一块金属。通过在这些剧烈碰撞的数据上训练势,我们可以准确地模拟由此产生的原子损伤级联,并利用这些知识为未来的聚变和裂变反应堆设计更安全、更有弹性的材料。这些模型甚至可以告诉我们它们何时不确定,将某个构型标记为超出其训练经验。在这些情况下,模拟可以暂停,调用更精确的量子计算,并将这块新知识添加到其库中——这是一个不断改进模型的“主动学习”过程。
从一个振动分子的嗡嗡声,到下一代核反应堆的设计,都是同一首歌,只是在不同的尺度上演奏。基本规则,即原子间作用力,非常简单,源于电子和原子核的量子舞蹈。但它们创造的交响乐——物质、化学和生命的世界——却具有无穷的复杂性和美感。探索和应用我们对这些力的知识的追求,无异于阅读,甚至可能重写物理世界的乐谱。