
任何两个个体都不完全相同,这是我们世界的一条基本真理。虽然这种多样性是日常生活的一部分,但在科学和医学领域,它却构成了一个重大挑战。为什么标准剂量的药物对一个人有效,却对另一个人无效甚至造成伤害?这种现象被称为个体间变异,长期以来一直被当作统计学上的“噪音”而被平均化处理。然而,现代科学方法将这种变异重新定义为需要解答的核心问题,而不仅仅是麻烦。本文提供了一个理解个体差异科学的框架。在接下来的章节中,我们将首先深入探讨变异的“原理与机制”,探索科学家如何利用药理学和统计学的概念对其进行分类和建模。然后,在“应用与跨学科联系”部分,我们将看到这种对变异的深刻理解如何彻底改变从个性化医疗到遗传学等各个领域,将我们独一无二这一简单事实转化为一门具有预测能力的强大科学。
为什么早晨一杯咖啡能让一些人精神焕发,而另一些人晚饭后喝了双份浓缩咖啡却能安然入睡?为什么标准剂量的止痛药能完全缓解你的疼痛,却对别人几乎不起作用?答案,简而言之,就是变异。我们不是一模一样的机器。我们独特的生物学特性与我们遇到的每一种物质相互作用,导致了一系列引人入胜的反应。理解这一系列反应,意味着从“一刀切”的规则转向对健康更精确、更个性化的理解。但“变异”只是我们无知的一个标签。为了将其转化为知识,我们必须剖析它、分类它,并建立能够捕捉其精美结构的模型。
当我们讨论药物反应的变异时,第一个关键的切入点是询问差异来自何处。是药物在体内的旅程存在差异,还是药物在最终目的地被接收时存在差异?这个区别将药理学的世界分成了两大领域:药代动力学(PK)和药效动力学(PD)。
想象一下你在寄送一个包裹。药代动力学就是整个递送过程:包裹如何从邮局(你的口腔或静脉)送到收件人的家门口(你体内的靶细胞)。它包括:
药代动力学变异,因此,意味着这个递送过程因人而异。对某些人来说,这是“当日特快专递”——药物吸收迅速,血药浓度急剧上升,并很快被清除。对另一些人来说,这是“标准陆运”——吸收较慢,峰值浓度较低,在体内停留时间较长。例如,一些常见的胃酸抑制剂(如质子泵抑制剂PPIs)可以改变胃的pH值,这会显著减少其他需要在酸性环境中溶解的药物的吸收。这是一个经典的PK相互作用,即使每个人服用相同的药片,也会造成药物暴露量的变异。
药效动力学,另一方面,是当收件人打开包裹时发生的事情。它是包裹内容物对收件人产生的影响。里面的礼物是引起了巨大的欢呼还是礼貌的点头?这完全取决于收件人,而不是递送过程。
药效动力学变异意味着,即使完全相同量的药物到达靶细胞(即药物浓度相同),产生的生物学效应也不同。一个人的细胞可能对药物有更多的受体,使他们高度敏感。另一个人的细胞可能存在一种遗传变异,改变了药物靶蛋白的形状,使药物效果减弱。一个著名的例子是抗凝药华法林(warfarin)。它的靶点是一种名为VKORC1的酶。携带特定VKORC1遗传变异的人对华法林极其敏感;对他们来说,低浓度就能对血液凝固产生很大影响,而其他人则需要高得多的浓度才能达到同样的效果。这是纯粹的PD变异:相同浓度,不同效应。
区分PK和PD是很好的第一步,但问题远不止于此。我们观察到的总变异并非一个单一的整体。它是一个层级嵌套的差异结构,就像一套俄罗斯套娃。科学家们已经发展出一个精美的框架来描述这些层次。
个体间变异(Inter-Individual Variability, IIV): 这是最外层、最大的套娃。它代表个体之间稳定、一致的差异。你代谢咖啡因的速度比你的朋友快,不仅仅是今天,而是每一天。这就是我们通常所想到的变异——那些使你成为你自己的持久生物学差异。
个体内部不同场合间变异(Inter-Occasion Variability, IOV): 这是中间的套娃。它捕捉了同一个人在不同时间点内部的波动。早上8点的你和晚上8点的你在生物学上并非同一个实体。你的激素水平、新陈代谢和警觉性都遵循着昼夜节律。早上服用的药物可能与晚上服用的同一种药物吸收方式不同。这就是IOV:同一个体在不同场合之间的变化。
残差未解释变异(Residual Unexplained Variability, RUV): 这是最内层、最小的套娃。它是任何测量中不可简化的“噪音”或“抖动”。它是实验仪器的微小波动,是记录采样时间的轻微不精确,或是无法预测的瞬时生理波动。
这不仅仅是学术上的吹毛求疵。混淆这些层次可能导致极其错误的结论。想象一种药物,其吸收速率早上比晚上快——这是一个明显的IOV案例。现在,假设我们建立一个忽略IOV的模型,只允许每个人有一个固定的吸收速率(IIV)。这个模型会尽力解释数据,从而为每个个体估算出一个平均吸收速率。
结果会怎样?在预测早晨服药后的药物浓度时,模型会使用这个平均速率,而这个速率比真实的、快速的早晨速率要慢。因此,它会低估峰值浓度。相反,在预测晚上服药后的浓度时,模型会使用它的平均速率,而这个速率比真实的、缓慢的晚上速率要快,因此它会高估峰值。这个模型系统性地抹平了真实世界的动态变化,错过了真正的波峰和波谷。更糟糕的是,它混淆了变异的来源。它看到一个个体内部从早到晚的变化,却错误地将其归因于人与人之间的稳定差异,从而导致对IIV的估算值过高。要真正理解变异,我们必须给每个套娃起一个恰当的名字。
我们怎么可能建立一个尊重这种精巧层级结构的数学模型呢?答案在于一个强大的统计学框架,称为非线性混合效应(NLME)模型。 这个名字听起来可能令人生畏,但其思想就像烤面包一样直观。
可以把为一个生物学参数(比如一个人的药物清除率 )建模想象成编写一份配方。
蓝图(固定效应): 存在一个“通用蓝图”或群体典型配方。这个蓝图定义了一个典型个体的平均参数值(例如,一个典型的清除率 )。它还包括根据可观察特征来调整配方的系统性指令。这些特征被称为协变量(covariates)。 协变量是一个可测量的属性,如体重、年龄、性别或特定基因的存在。这个蓝图可能会说:“这是一个70公斤体重的人的配方。在此基础上每增加10公斤,就多加15%的X成分。”协变量的影响是可预测的,它解释了部分的个体间变异。
个体配方(随机效应): 即使我们根据一个人的体重和年龄调整了蓝图,他们最终的结果仍然是独一无二的。也许他们身体的“生物烤箱”温度稍高,或者他们的“代谢酵母”活性更强一些。这些都是未被观察到的、潜在的特质,使得每个个体的生物学特性都独一无二。这就是随机效应()。它是一个受试者特异的、随机的项,代表了个体间变异中未被解释的部分。正是这个“秘密成分”使得你的清除率成为你的清除率。
一个个体清除率的典型模型可能如下所示:
用通俗的话来说,这个公式的意思是:“一个个体的清除率等于一个70公斤体重的人的典型清除率(),乘以一个与他们体重相关的调整因子,然后再乘以他们自己的、个人的、随机的‘修正因子’()。”
你可能会对这个看起来有点奇怪的感到好奇。为什么不直接加上随机效应呢?这种特殊的数学形式,被称为对数正态模型,其选择是基于两个深刻而实际的原因。 首先,像清除率、分布容积或心率这样的生物学参数不能是负数。任何实数的指数都是正数,所以这种形式巧妙地强制了这一物理约束。其次,生物学变异通常是成比例的。一个10%的变异比一个固定的“+5个单位”的变异是更自然的概念,因为它能对体型大小不同的个体进行适当的缩放。一个加性模型可能会意外地为一个体型较小但随机偏差较大的人预测出负的清除率,这在生理上是荒谬的。比例模型避免了这个问题。
有了这个框架,最后一个问题出现了:我们如何实际测量所有这些不同的变异组成部分?我们如何区分真正的个体间差异(IIV)和简单的测量噪音(RUV)?
关键在于实验设计。想象一下,你从100个不同的人身上各采集一个血样。你会看到一组分散的值。但你无法知道这种分散是因为这些人真的不同,还是因为你的测量设备噪音很大。IIV和RUV被无可救药地纠缠在一起,或者说混淆(confounded)了。
解决方法是收集纵向数据(longitudinal data)——也就是,在一段时间内对每个人进行多次测量。 这是极其强大的方法。通过观察来自同一个人的多个数据点,我们可以看到他们各自的曲线。他们自己的数据点围绕该曲线的“摆动”为我们提供了对残差噪音()的直接估计。一旦我们考虑了这种噪音,我们就可以将个体曲线相互比较。这些曲线之间的差异揭示了真正的个体间变异()。
层级模型完美地做到了这一点。它同时查看所有人的所有数据,同时估计“森林”(群体蓝图、固定效应和协变量)和“树木”(个体配方、随机效应)。它平衡了群体层面的知识和个体层面的证据。如果我们对某个人只有几个数据点,我们对其参数的最佳猜测将被“收缩”(shrunk)至群体平均值。随着我们从该个体收集越来越多的数据,我们的估计变得更加个性化,更多地依赖于他们自己的数据。
这种将变异分解为其组成部分——PK与PD、IIV与IOV与RUV、由协变量解释的变异与未解释的随机效应——的能力,正是将“人与人不同”这一简单观察转变为一门预测性科学的关键。它是个性化医疗的驱动引擎,让我们不仅能理解平均患者,还能理解每一个独特的个体。
我们从小就学到一个简单、甚至可以说是微不足道的真理:每个人都是不同的。你比你的朋友高;你的姐姐比你跑得快;一个人喜欢吃辣,另一个人则受不了。在我们的日常生活中,这只是世界的一个事实。但在科学中,这个我们称之为个体间变异的简单真理,却是我们能研究的最深刻、最具挑战性、最终也最富有成果的概念之一。几个世纪以来,大部分科学的进步都依赖于寻找普适规律,通过平均化处理个体差异的“噪音”来找到一个清晰的核心信号。但如果“噪音”本身就是音乐呢?如果变异本身就是通往更深层次理解的关键呢?
在本章中,我们将踏上一段旅程,看看接纳、量化和解释变异如何改变了整个科学技术领域。我们将看到,这一个概念是一条统一的线索,贯穿于你的行走方式、你身体处理药物的方式、你遗传密码的根本结构,甚至是你体内繁衍生息的微生物生态系统。
让我们从我们都会做的一件事开始:走路。如果我们在你的鞋上安装一个传感器,测量你每一步的长度,我们会注意到两件事。首先,你的步长并非完全相同;它们围绕一个平均长度轻微波动。这是个体内变异——即单个个体内部随时间的变化。但如果我们对你的朋友做同样的事情,我们会发现他们的平均步长与你的不同。这是个体间变异——即不同个体之间的变异。
这种区分不仅仅是学术上的吹毛求疵;它是我们学习了解世界的基础。想象一下,我们想研究一款新跑鞋对步长的影响。我们如何设计一个实验来证明是鞋子产生了效果,而不仅仅是人们天生就不同?科学家们使用巧妙的实验设计,例如交叉研究,其中每个人都试穿新鞋和旧鞋。通过将每个人与自身进行比较,我们可以巧妙地排除他们之间存在的巨大固有差异,从而让由鞋子引起的较小效应凸显出来。这种实验设计的巧妙之处对于将持续存在的变异“嗡嗡声”与我们试图检测的特定信号分离开来至关重要。
这个原则——生物系统在个体内和个体间都存在变异——是普遍的。但在任何领域,其后果都没有像在医学领域那样显著,其研究也没有像在医学领域那样紧迫。
在现代医学史的大部分时间里,医疗实践都是建立在“平均患者”这一理念之上的。药物的标准剂量是通过在一组人身上进行测试,找出对平均水平的人有效的方法来确定的。但我们都知道,我们中没有人是真正的“平均水平”。
以一种强效的免疫抑制剂为例,这类药物用于预防器官移植排斥反应。这些药物具有窄治疗指数,意味着有效剂量和毒性剂量之间的窗口极其狭窄。让我们想象两位患者,都接受了完全相同的标准剂量。患者A的身体清除药物的速度很慢,导致药物在体内积累到高水平,造成危险的肾脏损伤。患者B的身体清除药物的速度非常快,导致药物水平从未达到有效浓度,他们的新器官被排斥。同样的药物,同样的剂量,两种截然不同的灾难性结果。这不是药物的失败,而是未能考虑到一个称为清除率()的参数的个体间变异,该参数指的是身体消除药物的速率。
这一严峻的现实催生了计量药理学领域,这是一门致力于为药物在体内的命运及其变异性进行建模的科学。科学家们不再将“肝血流量”或“药物代谢率”等生理参数视为单个数字,而是将其看作一个统计分布——一条描述该参数值在整个人群中的范围和可能性的钟形曲线。
利用称为非线性混合效应(NLME)模型的强大计算工具,我们可以在计算机中建立一个“虚拟人群”。该模型有一个“固定效应”,代表了参数的典型值——即我们的“平均患者”。但至关重要的是,它还有“随机效应”,用以描述每个个体的参数可能如何偏离该平均值。对于我们虚拟人群中的任何给定个体,他们的参数——他们的器官体积、酶水平、药物敏感性——都被视为从这些群体分布中进行的一次随机抽样。
这种方法强大得惊人。它使我们能够模拟临床试验,预测新药在多样化人群中的表现,并确定哪些变异来源最为重要。它正是驱动治疗药物监测(TDM)的引擎,通过测量患者的药物水平并为其量身定制剂量,以使其保持在安全有效的范围内。
当面临诸如为儿童开发药物等艰巨挑战时,这种群体方法的真正天才之处就显现出来了。出于伦理和实践原因,我们只能从生病的孩子身上采集极少数的血样。仅凭两三个数据点,似乎不可能了解药物在那个孩子体内的行为。但通过使用层级群体模型,我们可以在研究中的整个儿童群体中“借用信息强度”。每个孩子的稀疏数据都为我们理解整个群体的特征——平均清除率,以及最重要的是,清除率的变异性——贡献了一小部分信息。反过来,群体模型提供了一个强大的先验信息,帮助我们解释来自每个孩子的稀疏数据。这是一种美妙的统计协同作用,使我们能够用来自每个人的最少数据来表征药物行为和变异性,这对于为我们当中最脆弱的群体安全有效地给药至关重要。
量化变异是向前迈出的一大步,但这并非故事的结局。说人们的药物清除率以例如30%的标准差变化是一回事。而问为什么则完全是另一回事。这就是下一个前沿:通过将变异与个体的可测量特征(称为协变量)联系起来,来解释变异。
想象我们有一团数据点,每个点代表一种药物在不同人体内的分布容积()。它只是一片散点。但接着我们开始提问。它与体重有关系吗?我们将与体重作图,发现一个清晰的趋势:体型较大的人往往有更大的分布容积。这在生理上是合理的,因为他们有更大的组织和体液容积供药物分布。我们可以用一种称为异速生长标度的数学关系来捕捉这一点。突然之间,一部分变异得到了解释。然后我们可以问:性别重要吗?或者血液中与药物结合的蛋白质数量重要吗?每当我们找到一个显著的协变量,我们就解释掉了谜题的又一部分。最初神秘的变异云团解析成一个更有结构、更易理解的模式。
对协变量的探寻可以将我们带到自身生物学的最深层次。考虑一下修复我们DNA的复杂分子机制。有时,这种机制会出错,通过一个称为非等位基因同源重组(NAHR)的过程导致大规模突变。这个过程的速率并非对每个人都相同;它表现出个体间变异。这种变异来自哪里?科学家们现在正在建立模型,将其追溯到其根本来源。模型可能包含一个术语,代表个体特定版本(等位基因)的*PRDM9*基因,该基因有助于引导重组发生的位置。模型可能还包括另一个术语,代表“染色质状态”,它描述了特定区域DNA的包装紧密程度。并且,它仍然会包含一个随机项,用于表示剩下未被解释的个体间差异。 在这里,我们看到了宏大的综合:变异的统计模型正在被来之不易的分子生物学细节所填充,将高层次的观察(不同的突变率)与其在我们基因和细胞中的机理根源联系起来。
个体间变异的概念并不仅限于我们皮肤的边界之内。我们不是孤立的有机体;我们每个人都是一个行走的、会说话的生态系统,是数万亿微生物的家园。你的肠道微生物组与坐在你旁边的人的有着深刻的不同。为什么?这仅仅是随机偶然吗——一种“中性理论”,即不同的细菌碰巧在不同的人体内漂移至主导地位?还是因为每个人的肠道都是一个独特的生态生态位,其特定环境决定性地选择了某些微生物?
通过应用变异性分析的原理,我们可以找到答案。我们观察到,人与人之间微生物丰度的变异比仅由随机机会所预期的要大数千倍。我们发现,一个人的微生物群落在数月内非常稳定,这与随机漂移不符。最能说明问题的是,我们发现微生物组的构成与宿主的协变量(如饮食)密切相关。一个吃大量纤维的人创造了一个有利于纤维发酵菌的生态位。这些观察为基于生态位的理论提供了压倒性的证据。 你的身体、你的饮食和你的生活方式创造了一个独特的栖息地,而你的微生物组正是这一点的反映。个体间变异不仅是一个有机体的属性;它还是整个生态系统的基本组织原则。
我们的旅程从简单的行走行为延伸到基因与微生物的复杂舞蹈。连接这一切的线索就是个体间变异的概念。我们学到,要理解人与人之间的差异,你必须研究许多人;对单个人的深入研究并不能告诉你关于人类多样性的任何信息。同时,我们也看到,这种群体层面知识的最终目标往往是为了更好地理解和预测单个个体的行为,无论是为了开出正确的药物剂量,还是为了了解他们的个人健康风险。
接纳变异性已使科学超越了对神话般的“平均人”的寻求。它认识到,使我们的世界如此丰富的多样性不是统计上的麻烦,而是生物学的核心特征。通过量化它、解释它和建模它,我们不仅仅是在完善旧的理论。我们正在建立一种新的、更个性化、更强大的科学——一种既能见森林,又能见树木的智慧科学。