try ai
科普
编辑
分享
反馈
  • 孟德尔随机化

孟德尔随机化

SciencePedia玻尔百科
核心要点
  • 孟德尔随机化利用随机遗传的基因变异作为某种暴露的无混杂代理(即工具变量),以推断因果关系。
  • 一个遗传工具变量的有效性取决于三个核心假设:它必须与暴露相关,独立于混杂因素,并且只能通过该暴露影响结局。
  • 该方法在区分心脏病等疾病的因果风险因素(如低密度脂蛋白胆固醇)与非因果生物标志物(如高密度脂蛋白胆固醇)方面发挥了关键作用。
  • 在医学领域,药物靶点孟德尔随机化利用基因变异来模拟药物效应,使科学家能够在临床试验前预测药物的有效性和潜在副作用。

引言

在几乎所有科学领域,一个根本性的挑战始终存在:区分单纯的相关性与真实的因果关系。例如,在流行病学中,观察到喝咖啡的人群某种疾病的发病率较低,并不能证明咖啡具有保护作用;未被测量的生活方式因素,即混杂因素,可能是真正的病因。这种知识上的差距源于对人类进行真正的随机实验往往不切实际或不符合伦理。在一个复杂的世界里,我们如何才能分离出单个因素的因果效应呢?

本文介绍孟德尔随机化(Mendelian randomization, MR),这是一种巧妙的方法,它利用受孕时基因的随机分配,将其作为一种“自然实验”。通过使用基因变异作为某种暴露的清晰、无混杂的代理变量,孟德尔随机化使研究人员能够以观察性研究无法比拟的严谨性来探索和量化因果关系。本文将首先深入探讨孟德尔随机化的核心原理和机制,解释其工作方式、所依赖的假设,以及科学家如何防范其潜在的缺陷。随后,我们将探索其在公共卫生、复杂生物学乃至其在现代药物研发中颠覆性的作用等众多学科中的变革性应用。

原理与机制

流行病学家的困境:错综相关的相关性

想象你是一名疾病侦探。你注意到大量喝咖啡的人似乎更容易患上某种癌症。你是否发现了咖啡是一种致癌物?或者,你观察到适量饮用红酒的人往往心脏更健康。医生是否应该开始建议每天喝一杯梅洛(Merlot)?令人沮丧的答案是:我们不知道。世界是一个混乱的地方,充满了无形的联系。大量喝咖啡的人可能也更倾向于吸烟,或从事有压力的夜班工作。每天享用一杯红酒的人可能也更富有、锻炼更多、并遵循地中海饮食。

这是流行病学中永恒的难题:​​相关不等于因果​​。我们试图分离出单一因素,即​​暴露​​(XXX,如咖啡摄入量)对​​结局​​(YYY,如癌症)的影响,但我们的视野被一团​​混杂因素​​(UUU)的迷雾所遮蔽。混杂因素是与暴露和结局都有关联的第三个因素,从而在两者之间制造出一种虚假或扭曲的联系。终生吸烟(UUU)可能导致一个人喝更多的咖啡(XXX),同时也直接导致癌症(YYY)。观察到的咖啡与癌症之间的联系,可能只不过是吸烟与癌症之间真实因果关系的“回声”。

几十年来,我们所能做的最好的事情就是尝试测量所有可能的混杂因素——吸烟、饮食、收入、锻炼——并对它们进行统计学调整。但如果我们漏掉了一个呢?那些“未知的未知”怎么办?我们从根本上陷入了困境。我们不能违背伦理地将一千人关在实验室里50年,强迫一半人喝咖啡,另一半人戒掉,然后等着看谁会生病。我们只能观察,而不能实验。或者,我们真的无计可施了吗?

大自然的随机试验

如果有一个实验已经运行了数千年,而且是在全球范围内呢?如果在受孕的那一刻,大自然为我们每个人抛了一枚硬币,随机地将一些人分到终生平均胆固醇水平略高的组,而另一些人分到胆固醇水平略低的组呢?如果这种分配与财富、饮食或任何其他困扰观察性研究的混杂因素都毫无关系呢?

这就是​​孟德尔随机化(MR)​​背后惊人地简单而强大的思想。这里的“抛硬币”就是遗传学。得益于格雷戈尔·孟德尔(Gregor Mendel)首次发现的遗传定律,你从父母那里继承的基因集合是随机重组过程的结果。在减数分裂时,等位基因随机分离,这意味着你得到哪个版本的基因纯属偶然,就像从一副洗得很好的牌中发牌一样。

这种基因抽签提供了一个关键的洞见。一个人的基因构成在受孕时就已确定,并且不受其后来的生活方式选择或社会经济地位的影响。因此,如果我们能找到一个影响某种暴露(如胆固醇)的基因变异,我们就可以用它作为该暴露的无混杂代理。我们可以利用大自然自身的随机试验,最终从相关性中解开因果关系。

工具变量的逻辑:三点核查清单

当然,并非任何基因都可以。要被用作某种暴露的清晰代理,一个基因变异必须符合作为一个有效​​工具变量(instrumental variable, IV)​​的资格。可以把它想象成一个工具,在使用它来探索因果关系之前,必须通过严格的、三部分的“安全检查”。

假设1:相关性

首先,工具变量必须与手头的任务相关。如果我们想研究胆固醇的影响,我们需要一个确实能影响胆固醇水平的基因。一个决定眼睛颜色的基因是无用的。这就是​​相关性假设​​。遗传工具变量,我们称之为GGG,必须与暴露XXX有强关联。在数学上,这意味着它们的协方差不为零,即 Cov⁡(G,X)≠0\operatorname{Cov}(G,X) \neq 0Cov(G,X)=0。这一点我们可以也必须用数据来检验。我们需要证明,拥有某个基因版本的人群与拥有另一个版本的人群相比,其暴露水平有可测量的差异。

假设2:独立性

其次,工具变量必须独立于那些困扰观察性研究的混杂因素。这就是​​独立性假设​​,它是孟德尔随机化的哲学基石。根据孟德尔定律,基因变异GGG应该与可能影响结局的各种环境、社会和行为混杂因素UUU无关。例如,那些让你胆固醇略高的基因不应该也决定你的收入或者你是否喜欢锻炼。这个假设,写作G⊥UG \perp UG⊥U,使得基因能够打破混杂的僵局。然而,我们必须小心。这种随机分配在家族内部或相同祖源的人群中能很好地起作用。如果我们混合了不同的祖源群体,我们可能会发现某个基因在某个群体中更常见,而该群体由于其他原因恰好有更高的患病风险——这是一个我们必须防范的问题,称为​​群体分层​​。

假设3:排他性限定

第三,也是最微妙的一点,遗传工具变量只能通过我们正在研究的特定暴露来影响结局。它不能有任何其他的“旁路”或对结局的直接影响。这就是​​排他性限定​​。如果我们的基因变异GGG不仅提高了胆固醇(XXX),还直接促进了动脉炎症(一条绕过胆固醇导致心脏病YYY的路径),那么我们的工具变量就被污染了。它身兼数职,我们无法分辨是它的哪种效应导致了结局的变化。基因的这种“多任务”处理被称为​​水平多效性​​,它是对孟德尔随机化研究有效性的最大挑战之一。

综合应用:炼金术士的公式

如果我们能找到一个满足这三个严格条件的遗传工具变量GGG,我们就能施展一招美妙的逻辑炼金术。我们可以从两个我们能够清晰测量的关联中,推导出XXX对YYY的隐藏因果效应。

考虑我们想知道的因果效应:暴露XXX增加一个单位会使结局YYY改变多少?我们称这个效应为βXY\beta_{XY}βXY​。

  1. 首先,我们测量基因与暴露之间的关联,即βGX\beta_{GX}βGX​。这是“相关性”环节。例如,我们发现携带某个特定等位基因会使平均低密度脂蛋白胆固醇增加0.150.150.15个单位。这是一个无混杂的估计。

  2. 其次,我们测量同一个基因与结局之间的关联,即βGY\beta_{GY}βGY​。例如,我们发现同一个等位基因会使临床结局的风险降低0.060.060.06个单位。因为我们的工具变量是有效的(满足独立性和排他性限定),我们知道这个效应必须完全通过暴露XXX来传递。

现在,奇迹发生了。如果基因对结局的全部影响都是通过暴露来介导的,那么暴露对结局的因果效应就必然是这两个测量值的比率。

βXY=基因对结局的效应基因对暴露的效应=βGYβGX\beta_{XY} = \frac{\text{基因对结局的效应}}{\text{基因对暴露的效应}} = \frac{\beta_{GY}}{\beta_{GX}}βXY​=基因对暴露的效应基因对结局的效应​=βGX​βGY​​

这个简单而强大的公式被称为​​Wald比率估计量​​。使用我们例子中的数字,因果效应将是−0.060.15=−0.40\frac{-0.06}{0.15} = -0.400.15−0.06​=−0.40。这意味着暴露增加一个单位,会导致结局减少0.400.400.40个单位。我们从混乱、充满混杂的现实中提取出了一个纯粹的因果估计值。我们通过使用来自遗传学研究的两个独立的、清晰的测量值来做到这一点,这两个测量值甚至可以来自完全不同的人群——这种设置被称为​​双样本孟德尔随机化​​。

实践应用:好的、坏的与因果的

这不仅仅是理论上的好奇心;它已经彻底改变了我们对疾病的理解。思考一下“好”胆固醇和“坏”胆固醇及其与缺血性心脏病(IHD)关系的故事。

几十年来,观察性研究显示出一个清晰的模式:高水平的低密度脂蛋白胆固醇(LDL-C,或“坏胆固醇”)与更多的​​心脏病​​发作相关,而高水平的高密度脂蛋白胆固醇(HDL-C,或“好胆固醇”)与更少的心脏病发作相关。LDL-C的因果作用通过他汀类药物的试验得到证实,这类药物能降低LDL-C并预防心脏病发作。但HDL-C呢?提高HDL-C似乎显然具有保护作用,制药公司投入了数十亿美元来开发实现这一目标的药物。

然后,孟德尔随机化登场了。研究人员识别出那些能使人天生并终生提高HDL-C水平的基因变异。根据当时的普遍看法,那些在基因抽签中赢得更高HDL-C的人应该能免于心脏病。但他们并没有。孟德尔随机化研究发现,基因升高HDL-C对IHD风险没有影响。比值比几乎恰好是1.01.01.0,其置信区间稳稳地包含了无效应的空值 [OR=0.99\text{OR} = 0.99OR=0.99, 95% CI 0.92–1.0695\% \text{ CI } 0.92–1.0695% CI 0.92–1.06]。

相比之下,针对LDL-C、收缩压(SBP)和另一种称为脂蛋白(a)或Lp(a)的脂质颗粒的孟德尔随机化研究,都显示出强烈的因果关系证据。提高这些因素的基因变异也确实增加了IHD的风险,其置信区间远离空值。

这个结论是惊人的,并为毫无结果的研究节省了数十亿美元。高HDL-C并不是保护的原因,而仅仅是健康生活方式的标志。拥有健康习惯的人恰好HDL-C水平较高,但人为地提高它并无作用。孟德尔随机化扮演了最终仲裁者的角色,将真正的因果风险因素(LDL-C, SBP)与仅仅是关联的旁观者(HDL-C,以及其他研究显示的C反应蛋白)区分开来。

科学家的谦卑:当工具变量出错时

与任何强大的工具一样,孟德尔随机化并非万无一失。其结论的可靠性取决于其假设的可靠性,而一个好的科学家总是对其假设可能被违背保持警惕。

最大的威胁,那个让遗传流行病学家夜不能寐的,是​​水平多效性​​——对“无旁路”的排他性限定的违背。如果一个基因“手指太粗”,同时影响多个生物系统怎么办?想象一下,试图用一个影响苦味感知的基因来检验喝咖啡对癌症的因果效应。这个基因可能影响咖啡饮用量(相关性),但它也可能影响苦味蔬菜或酒精的摄入量,而这两者都可能对癌症风险有其自身的影响。这个工具变量不再是一个干净的探针;它对结局的影响是多种路径的混合体,其因果估计值将会存在偏倚。

此外,我们必须时刻警惕​​群体分层​​(违背了独立性假设)和​​弱工具变量偏倚​​(即基因对暴露的影响非常微小,以至于我们的估计变得不稳定且有偏倚)。

因果关系的侦探:追寻多效性

故事并未以一堆担忧告终。科学的美妙之处在于其不断的自我审视和创新。孟德尔随机化领域已经开发出了一套令人印象深刻的诊断测试工具箱,来寻找和纠正这些偏倚。

第一步是从使用单个基因变异转向使用多个,有时是数百个,组合成一个​​多基因风险评分(PRS)​​。但这可能是危险的,因为它有将许多无效的、多效性的变异与有效的变异捆绑在一起的风险,从而在无法检测的情况下“固化”了偏倚。

一个更聪明得多的方法是将众多基因变异中的每一个都视为因果效应的独立“证人”。如果所有的证人都讲述着同一个故事,我们就能更有信心。如果他们的故事出现分歧,这表明其中一些可能并不可靠(即具有多效性)。

其中一个最优雅的技术是​​MR-Egger回归​​。想象一下,对于我们(比如说)8个基因变异中的每一个,我们将其对结局的影响(在y轴上)与它对暴露的影响(在x轴上)作图。如果所有8个变异都是有效的工具变量,它们应该都落在一根穿过原点(0,0)的直线上。这条线的斜率就是我们的因果估计值。

但如果这些变异具有多效性效应,平均而言会使结局向上或向下移动呢?在这种情况下,这些点仍会形成一条直线,但那条直线会偏离原点。该直线的y轴截距将不为零,其值就是平均多效性偏倚的估计值!一个统计学上显著的截距是存在定向水平多效性的确凿证据。更棒的是,这条经过截距调整的新直线的斜率,为我们提供了一个校正后的因果效应估计值,它对检测到的多效性具有稳健性。

其他方法,如​​加权中位数估计量​​,其作用类似于一个“多数票”系统,只要至少一半的工具变量是有效的,就能提供一个有效的估计。而更先进的技术,如​​多变量孟德尔随机化(MVMR)​​,可以在我们怀疑存在通过特定、已知路径(如BMI或血压)的多效性时使用,使我们能够统计上解释并同时估计多个暴露的独立因果效应。

这一系列不断演进的敏感性分析展示了该领域的成熟性和严谨性。它让科学家们能够超越单一、可能有缺陷的估计,转向一种更细致的证据“三角验证”。我们从一个简单而美好的想法——大自然的随机试验——出发,抵达了一个用于审视因果关系的复杂科学框架,它拥有自己强大的逻辑、实际应用以及健康的、内置的怀疑精神。这便是我们如何带着信心与谦卑,学习关于生命隐藏的因果机制。

应用与跨学科联系

掌握了孟德尔随机化的原理,我们就像天文学家刚得到一种新型望远镜。突然之间,我们有了一种新方法来窥探生物学与疾病的复杂宇宙,来区分遥远因果恒星的闪烁与近处混杂因素的干扰眩光。这个新工具能带我们去向何方?事实证明,答案是几乎任何地方。孟德尔随机化的美妙之处不仅在于其巧妙,更在于其非凡的通用性。它是一个统一的原则,使我们能够在惊人广泛的科学学科中提出同样根本的问题——“A是否导致B?”。让我们踏上这段穿越其多样化应用的旅程,从我们的日常习惯到我们物种最深层的进化史。

从生活方式到疾病:流行病学家的工具箱

我们的旅程始于那些充斥新闻头条和日常对话的问题。喝咖啡能保护你的肝脏吗?这种营养素能预防那种疾病吗?几十年来,流行病学家一直使用观察性研究来应对这些问题,但他们始终被混杂因素的阴影所困扰。喝咖啡更多的人可能也吸烟更少、锻炼更多或有不同的饮食习惯,这使得分离咖啡本身的影响成为不可能。

在这里,孟德尔随机化提供了一个绝妙的解决方案。假设我们想检验一个长期存在的猜想,即习惯性饮用咖啡对肝病有因果保护作用。事实证明,大自然一直在为我们进行一项实验。有一种基因CYP1A2,它编码分解咖啡因的主要酶。这个基因中微小而常见的变异意味着一些人是“快代谢者”,而另一些人是“慢代谢者”。由于慢代谢者感受咖啡因的兴奋感时间更长,他们一生中平均饮用的咖啡量往往更少。由于你的基因是在受孕时像发牌一样分配给你的,这种饮用或多或少咖啡的遗传倾向与你日后的生活方式选择完全无关。

通过比较不同CYP1A2基因版本人群的肝脏健康状况,我们可以利用这种咖啡消费量的“自然”变异作为无混杂的代理,来估计咖啡本身对肝脏的因果效应。然而,这种方法要求我们保持警惕。孟德尔随机化的力量建立在其假设之上,特别是排他性限定——即基因仅通过暴露影响结局。例如,如果我们发现CYP1A2蛋白本身对肝细胞有次要的、直接的保护作用,而这与其代谢咖啡因的作用无关,那么我们的工具变量就会受到损害,我们的因果结论也将失效。

这种遗传学方法不仅能证实或否定我们的猜想,它还能揭示那些完全被隐藏的真相。设想一项大型观察性研究发现,血液中某种营养素与一种神经退行性疾病之间没有联系。故事可能就此结束。但一位聪明的科学家可能会想:如果一种真实的保护效应被混杂因素完美地“掩盖”了呢?如果营养素水平低的人恰好也有其他未测量的、增加风险的行为呢?孟德尔随机化可以充当决胜者。通过找到专门影响体内该营养素水平的基因变异,我们可以重新检验这个假说。如果这个由基因代理的暴露显示出保护效应,那将表明最初的阴性结果确实是由混杂造成的假象,而该营养素实际上具有因果上的重要性。

当我们从单个基因转向多个基因时,这种方法的力量会急剧增强。为了研究吸烟与帕金森病之间的联系,研究人员现在可以从大规模的全基因组关联研究(GWAS)中收集数十个已知与吸烟行为相关的基因变异。利用来自独立的、无重叠的吸烟研究和帕金森病研究的汇总统计数据,他们可以整合来自每个遗传工具变量的因果证据。像逆方差加权(IVW)这样的方法将这些估计综合成一个强有力的结论,并附有置信区间。当然,工具变量越多,其中一些违反假设的风险就越大。这催生了整个统计学工具箱的敏感性分析——如MR-Egger和加权中位数估计量——旨在检测和校正多效性的偏倚效应,确保最终结论尽可能稳健。

解析复杂生物学:从风险因素到机制

随着我们对新“望远镜”的信心增强,我们可以将其指向更复杂的生物系统。人类健康很少是单一原因导致单一结果。更多时候,它涉及一个相互作用的因素网络。孟德尔随机化在其更高级的形式中,提供了一种开始解开这个网络的方法。

考虑低密度脂蛋白胆固醇(“坏”胆固醇)和甘油三酯在引发冠状动脉疾病(CAD)中的作用。两者都是已知的风险因素,并且它们常常相关。是一个导致另一个吗?它们是独立起作用吗?它们会相互作用吗?为了剖析这一点,我们可以采用一种称为​​因子孟德尔随机化​​的策略。其思想是模拟一个2×22 \times 22×2的因子药物试验。首先,我们识别一组专门影响LDL水平但不影响甘油三酯的基因变异。然后,我们找到另一组不重叠的、影响甘油三酯但不影响LDL的变异。通过为这两种暴露创建遗传评分,我们可以将人群分为四组:遗传上低LDL/低TG、低LDL/高TG、高LDL/低TG和高LDL/高TG。通过比较这四个“自然”实验组的CAD发病率,我们可以估计这两种脂质的独立和联合因果效应,这用传统的观察性数据几乎是不可能做到的。

孟德尔随机化的触角甚至延伸到我们自身的人类生物学之外。我们并非孤立存在;我们的身体是生态系统,是数以万亿计微生物的家园,尤其是在我们的肠道中。这种微生物组的构成已知与许多疾病相关,但同样地,这是相关性还是因果关系?在一个惊人的跨学科飞跃中,我们可以将MR应用于这个问题。事实证明,我们自己的人类基因可以影响肠道中特定类型细菌的丰度。通过识别与(比如说)X菌属丰度相关的宿主基因变异,我们可以将这些变异用作工具变量。在双样本MR设计中,我们接着可以检验那些具有更多X菌属遗传倾向的人,是否也具有更高或更低的患炎症性肠病(IBD)等疾病的风险。这种非凡的方法利用我们自身的基因组作为工具,来探索生活在我们体内的独立基因组的因果效应,以一种深刻的新方式将人类遗传学与微生物学和免疫学联系起来。

基因的手术刀:探究生命机器

在探索了生物体和生态系统之后,我们现在将焦点转向内部,转向细胞的机器本身。在这里,MR从一个大笔触的工具转变为一把高精度的手术刀,能够剖析从基因到疾病的分子事件因果链。这一应用将该方法带回其在计量经济学中的历史根源,在那里,等效的技术,即两阶段最小二乘法(2SLS),被首次开发出来。

这个过程很优雅。在第一阶段,我们使用一个已知的、影响特定基因(我们称之为基因A)表达水平的基因变异(一个cis-eQTL)。我们建立一个模型,纯粹基于个体的基因型来预测基因A的表达。在第二阶段,我们检验这个*基因预测*的基因A表达是否与某种疾病相关。这个两步过程使我们能够估计一个基因的活性对临床结局的因果效应,这是现代功能基因组学的基石。

但我们可以更深入。一个基因成为蛋白质的旅程不仅仅关乎数量(表达水平),还关乎质量和形式。大多数人类基因可以被以不同的方式“剪接”,就像电影剪辑师从同样的原始素材中创作出不同版本的场景。这种选择性剪接过程从单个基因产生不同的蛋白质变体(异构体)。某个特定的剪接事件会导致疾病吗?MR使我们能够检验这一点。被称为剪接数量性状位点(sQTLs)的基因变异专门影响基因产生哪种剪接形式。通过使用这些sQTLs作为工具变量,我们可以检验产生一种异构体与另一种异构体的因果后果。这需要极其小心,使用像共定位这样的先进技术来确保剪接的遗传信号和疾病的遗传信号确实源于同一个因果变异。它代表了我们基因手术刀最精细的应用之一,分离了一个分子结构上的细微变化对整个生物体健康的影响。

基因如水晶球:革新医学与药物研发

或许孟德尔随机化最具影响力的应用是在转化医学中,它正在彻底改变我们发现和开发新药的方式。本质上,MR允许我们进行“自然临床试验”,这些试验能在药物在实验室中合成出来的数年之前,预测药物的效应——包括好的和坏的。

一个简单而有力的例子来自药物基因组学。他汀类药物是降低胆固醇的救命药,但它们可能在一些个体中引起肌肉疼痛(肌病)。风险与药物在血液中的浓度密切相关。一个名为SLCO1B1的基因编码一种转运蛋白,该蛋白将他汀类药物从血液中输送到肝脏。该基因中的一个常见变异会降低转运蛋白的功能。携带这种变异的人从血液中清除他汀类药物的速度更慢,导致更高的全身暴露。通过使用这个变异作为肝脏摄取的工具变量,我们可以因果地估计肝脏清除药物的能力每降低一个单位,肌病风险会增加多少。这提供了药物药代动力学与其不良反应之间清晰的因果联系,有助于预测哪些患者风险最高。

这种“药物靶点MR”方法可以大规模应用。想象一家制药公司想要开发一种药物来阻断一个特定的受体,例如白细胞介素-6受体(IL6R),以治疗类风湿关节炎等炎症性疾病。开发这样一种药物是一项长达十年、耗资数十亿美元的赌博。但如果大自然已经为我们运行了试验呢?研究人员可以识别IL6R基因本身的基因变异,这些变异模仿了药物的效果——也就是说,它们天生就导致IL6R信号传导减弱。

通过在大型生物样本库中检查携带这些变异的人的健康结局,我们可以创建一张全面的“地图”,展示终生、部分抑制IL6R会带来什么。我们可以预测药物的疗效:基因上较低的IL6R信号传导是否会导致类风湿关节炎和冠状动脉疾病的风险降低?我们还可以预测其不良反应:它是否也会导致某些感染的风险增高?通过将遗传效应按比例缩放到实际药物对生物标志物(如C反应蛋白)的影响大小,我们可以对药物的临床试验结果做出惊人准确的预测。这种将人类遗传学用作药物研发水晶球的做法是一次真正的范式转变,有潜力使药物开发更快、更便宜、更安全。

回答重大问题:适用于所有科学的工具

最后,我们的旅程将我们带到最宏大的尺度:人类进化的弧线。孟德尔随机化甚至可以用来检验关于我们物种历史及其对我们现代健康影响的宏大假说。

考虑进化医学中的“错配假说”。该理论提出,许多现代慢性病的出现是因为我们的身体,为了适应祖先稀缺的环境而进化,现在与富足的现代环境“错配”。例如,有假说认为,我们的高能量饮食导致胰岛素样生长因子1(IGF-1)等生长因子长期处于升高水平,这反过来又促进了某些癌症的发展。这是一个强大而优雅的想法,但人们如何才能检验它呢?

MR再次提供了一种方法。我们可以找到导致终生IGF-1水平较高的基因变异。在某种意义上,这些个体一生都处于一种模仿现代环境所提议效应的状态。通过检验这些基因变异是否与特定癌症(例如,结直肠癌)的风险增加相关,我们可以为错配假说链中的一个关键环节获得因果证据。当然,这并不能证明整个进化故事,但它为一个核心机制提供了关键支持。它表明,IGF-1确实在通往癌症的因果路径上,这使得“改变环境导致IGF-1升高也会增加癌症风险”这一假说变得更加可信。这一应用显示了MR的深远影响,将分子遗传学与我们物种的深厚历史以及我们与文明病的斗争联系起来。

从一杯咖啡到进化历程,原理始终如一。孟德尔随机化是科学统一性的证明——一个简单而美好的想法,它利用大自然自身的抽签来揭示因果真相,为复杂的世界带来清晰,并赋予我们理解和改善人类状况的力量。