try ai
科普
编辑
分享
反馈
  • 潜变量模型

潜变量模型

SciencePedia玻尔百科
核心要点
  • 潜变量模型假定,复杂且相关的观测现象是由一组更少、更简单的未观测(潜在)因子驱动的。
  • 与主成分分析 (PCA) 等纯描述性方法不同,真正的潜变量模型(如因子分析)提出了一个生成故事,将共享的有意义方差与独特的噪声分离开来。
  • 期望最大化 (EM) 算法是拟合潜变量模型的一种基础技术,它通过迭代推断隐藏状态,然后更新模型参数。
  • 潜变量模型为不同领域的科学探究提供了一个多功能框架,使得对心理构念的建模、生物过程的重建,乃至基础物理学理论的检验成为可能。

引言

在追求科学理解的过程中,我们常常为复杂现象寻求简单的解释。我们所观察的世界是一幅由错综复杂、相互关联的事件构成的织锦,从大脑中神经元的放电到疾病的症状。潜变量模型 (LVM) 提供了一个强大的统计框架来驾驭这种复杂性,其建立在一个前提之上:我们所看到的往往是一个更简单、隐藏的现实所投下的“影子”。这些模型解决了从我们能够收集的杂乱、高维数据中推断这些未被观察到的驱动因素这一根本性挑战。本文将引导您进入潜变量模型的世界,阐明其理论和实践上的力量。

首先,我们将探讨其核心的 ​​原理与机制​​,详细说明潜变量模型如何通过对未观测原因的建模来提供解释力。我们将区分因子分析和主成分分析等关键方法,讨论用于将这些模型拟合到数据的算法,并解决过拟合和不可识别性等关键陷阱。随后,我们将穿越 ​​应用与跨学科联系​​ 的广阔领域,展示这同一个理念如何被用来模拟人类心智、解读生物复杂性,甚至探索现实本身的基本性质。

原理与机制

科学的核心在于一个宏伟的抱负:在复杂性中寻找简单性。我们观察天体令人困惑的舞蹈,发现了优雅的万有引力定律。我们观察混乱的化学反应,揭示了有序的电子交换。潜变量模型是这种科学精神在数据世界中的完美体现。它们建立在一个单一而强大的前提之上:我们观察到的复杂、杂乱且相关的现象,通常是由一组更少、更简单的未观测——或称 ​​潜在​​——因子投下的“影子”。

表象之下的世界

想象一下,在一个刮着大风的日子里,你站在一个平静的池塘边。你看到水面上有上千片叶子,每一片都在以看似随机、混乱的方式抖动和漂移。然而,它们的运动并非完全独立。成片的叶子倾向于一起移动;它们的运动是相关的。一个简单的模型可能会试图描述每一片叶子的路径——这是一项艰巨且最终毫无启发性的任务。

潜变量模型则采用了一种不同的方法。它会问:是否存在一种看不见的力量导致了这种协调的舞蹈?答案当然是风。我们看不见风本身,但我们能看到它的效果。一个单一、相对简单的实体——一阵吹过池塘的风——就是 ​​潜变量​​,它生成了我们观察到的数百片叶子复杂且相关的运动。该模型将我们的焦点从描述无数种效应转移到理解那个单一的原因上。

这种由“隐藏”现实决定观测结果的想法在科学史上源远流长。20世纪初,当量子力学揭示了一个建立在概率之上的世界时,像 Albert Einstein 这样的物理学家感到不安。他们想知道,量子事件的表观随机性是否仅仅是更深层次确定性现实的一层外衣。也许每个粒子都携带一套内部的、未被观察到的属性——“隐变量”——这些属性预先决定了任何测量的结果。

虽然我们现在知道,简单的局域隐变量理论无法完全解释量子世界奇异的相关性,但这个思想实验本身完美地诠释了潜变量的概念。它体现了潜变量的核心思想:假设一个未观测状态 λ\lambdaλ,它支配着一个观测结果的概率。这是在观测的面纱背后寻找钟表机械装置的探索。

为何要费心于无形之物?解释的力量

提出看不见的实体似乎像是一种不科学的奇思妙想。为什么要用我们甚至无法测量的变量来使事情复杂化呢?答案在于它们提供的深刻解释力。潜变量模型不仅仅是描述数据,它们旨在解释其结构。

让我们走进神经科学的世界。想象一下,当一群脑细胞响应重复刺激时,记录它们的电“脉冲”。一个简单的模型,比如泊松过程,可能会假设一个神经元的放电是随机的,具有由刺激决定的某个平均速率。这个简单的模型做出了两个明确的预测:一次试验到下一次试验的脉冲数变异(方差)应等于平均脉冲数,并且在考虑了刺激之后,两个不同神经元的放电应该是相互独立的。

然而,真实的神经数据却持续违反这些预测。脉冲计数通常比平均值更具变异性(一种称为 ​​过度离散​​ 的现象),并且神经元表现出一种神秘的协同放电倾向,展现出刺激本身无法解释的 ​​共享协方差​​。

这时,潜变量就登场了。如果存在一个未被观察到的、波动的“大脑状态”——也许对应于动物的注意力或唤醒水平——它调节了所有神经元的放电概率,情况会怎样?让我们将这个潜变量在时间 ttt 和试验 jjj 的状态称为 zt,jz_{t,j}zt,j​。全方差定律是概率论的一条基本规则,它告诉我们,我们观察到的总方差是两部分之和:观测层面的平均噪声,加上底层过程本身的方差。

Var(y)=E[Var(y∣z)]+Var(E[y∣z])\mathrm{Var}(y) = \mathbb{E}[\mathrm{Var}(y|z)] + \mathrm{Var}(\mathbb{E}[y|z])Var(y)=E[Var(y∣z)]+Var(E[y∣z])

潜变量 zzz 引入了第二项。因为潜在的大脑状态 zzz 在不同试验间波动,放电 速率 本身成了一个随机变量。这种速率上增加的变异性解释了过度离散。此外,因为这同一个波动的状态影响了整个神经元群体,它自然地导致它们协同变化。当动物更专注时(高 zzz),某个特定组合中的所有神经元可能都变得更活跃。当它不那么专注时(低 zzz),它们都安静下来。潜变量为原本会是一个令人困惑的成对相关网络提供了一个单一、简约的原因。它用一个简单的共享故事取代了复杂的相关模式。

塑造无形之物:从描述到因果

并非所有潜变量模型都讲述相同的故事。它们的力量,以及它们的风险,在于它们对无形世界结构所做的假设。一个经典的混淆点出现在两种流行的技术之间:主成分分析 (PCA) 和因子分析 (FA)。

PCA 是数据压缩的绝佳工具。它审视高维数据点云,并找出数据分布最广的轴。这些轴,即主成分,提供了数据总方差的最有效总结。然而,PCA 并未就方差为何如此结构化做出强有力的论断。

因子分析,一个真正的潜变量模型,则更进一步。它提出了一个 ​​生成模型​​:一个关于数据如何产生的故事。它假定,少数潜在的“因子”是所有观测变量之间 共享协方差 的原因。所有剩余的部分都被认为是每个变量独特的、独立的噪声。这是一个深刻的区别。因子分析明确地将共享信号与特异性噪声分离开来。

再以神经记录为例。假设我们有两个神经元,它们确实是一个功能组合的一部分,由一个共同的潜在输入驱动,而第三个神经元只是嘈杂且独立的。PCA 旨在解释总方差,它可能会发现那个嘈杂的神经元变异性如此之大,以至于它的活动构成了第二重要的“主成分”。它会把信号和噪声混在一起。相比之下,因子分析的设计就是为了忽略独立的噪声。它会正确地识别出驱动前两个神经元协同活动的单一潜在因子,并将第三个神经元的变异性归因于其“唯一性”项,从而提供一个对底层神经回路更具解释性的图像 [@problem_id:4162163, @problem_id:3155662]。

这种在纯粹描述和因果建模之间的区别具有巨大的影响。例如,在精神病学中,一个传统的抑郁症 ​​反映性模型​​ 是一个经典的潜变量模型。它假设存在一个单一的潜在疾病“抑郁症”,它是所有观测症状(如失眠、疲劳和快感缺乏)的共同原因。这个模型做出了一个可检验的预测:这些症状之所以相关,仅仅是因为它们有共同的原因。如果你能直接干预潜在的抑郁症,所有症状都会改善。但如果你只针对一个症状——比如用安眠药治疗失眠——它应该不会对任何其他症状(如疲劳)产生直接影响,除非该干预也恰好缓解了潜在的抑郁症本身。

但是,如果一项实验表明,治疗失眠 确实 导致了疲劳的减轻,即使患者的整体情绪(我们对潜在“抑郁症”的代理指标)没有改变,这该如何解释?这个观察结果打破了反映性模型。它暗示了一个不同的因果故事,也许是一个 ​​网络模型​​,其中症状直接相互引起:失眠导致疲劳,疲劳导致注意力不集中。在这里,潜变量模型框架提供的不是一个答案,而是一个关于精神疾病根本性质的尖锐、可检验的问题。

可能性之艺术:将模型拟合到数据

提出这些优雅的模型是一回事;将它们与杂乱的真实世界数据联系起来是另一回事。这带来了一个经典的“鸡生蛋还是蛋生鸡”的困境。如果我们知道潜变量的值(风的方向),我们就能轻易地计算出模型参数(风如何影响树叶)。反之,如果我们知道参数,我们就能推断出潜变量。但我们两者都不知道。

​​期望最大化 (EM) 算法​​ 应运而生,这是一种巧妙且广泛使用的拟合潜变量模型的程序。EM 算法通过将其转化为一个迭代的两步舞来解决这个困境:

  1. ​​E步 (Expectation/期望):​​ 从模型参数 θ(k)\theta^{(k)}θ(k) 的一个初始猜测开始。基于这个当前的猜测,计算在给定观测数据 yyy 的情况下,潜变量 xxx 的期望值(或完整的后验分布)。这本质上是说:“假设我当前的世界理论是正确的,那么隐藏变量必须是什么样子才能产生我所看到的数据?” 这一步计算函数 Q(θ∣θ(k))=Ex∣y,θ(k)[log⁡p(y,x∣θ)]Q(\theta | \theta^{(k)}) = \mathbb{E}_{x|y,\theta^{(k)}}[\log p(y,x|\theta)]Q(θ∣θ(k))=Ex∣y,θ(k)​[logp(y,x∣θ)]。

  2. ​​M步 (Maximization/最大化):​​ 现在,将 E 步中推断出的潜变量当作它们是观测数据一样对待。找到新的模型参数 θ(k+1)\theta^{(k+1)}θ(k+1),以最大化这个“已完成”数据的似然。这相当于说:“现在我对隐藏变量有了一个合理的故事,我将更新我的世界理论以最好地匹配那个故事。”

通过在这两个步骤之间交替——猜测隐藏状态然后更新模型——EM 算法在似然度的山坡上稳步攀升,收敛到一组局部最优的参数。

EM 算法是一个主力工具,但它不是工具箱里唯一的工具。当我们需要的不仅是单一的最佳估计,而是对我们不确定性的全面了解时,我们可能会转向 ​​马尔可夫链蒙特卡洛 (MCMC)​​ 方法。MCMC 就像派出了一支探险队,去细致地绘制所有可能参数值的整个地形图,返回一个丰富的可能性分布。对于真正庞大的数据集,即使是单次遍历数据也过于缓慢,我们可以使用 ​​变分推断 (VI)​​。VI 是一个绝妙的折中方案:它试图找到一个更简单、近似的后验地形图,其计算速度要快得多,使得在其他方法无法企及的尺度上进行推断成为可能。

通往真理之路上的陷阱与悖论

寻找隐藏结构的探索是强大的,但这条道路上布满了为粗心者准备的微妙陷阱。一个好的科学家,就像一个好的侦探,必须意识到自己可能被愚弄的方式。

最常见的陷阱之一是 ​​过拟合​​。如果我们的潜变量模型过于复杂——如果我们允许过多的潜变量——它就会像一根可以弯曲以完美描摹我们数据轮廓的柔性金属丝。这个模型在训练数据上会达到“完美”的拟合,但它不仅学会了真实的底层信号,还学会了随机的、特异性的噪声。当面对新数据时,它的预测性能将非常糟糕。解决方法是 ​​交叉验证​​:我们保留一部分数据作为测试集。然后我们选择模型复杂度(例如,潜变量的数量),使其在它从未见过的数据上表现最好,而不是在训练数据上。这迫使我们找到一个能捕捉可推广信号而非特定噪声的模型。

一个更深层次、更具哲学性的挑战是 ​​不可识别性​​。如果存在一组唯一的参数可以产生观测到的数据分布,那么模型就是可识别的。然而,许多潜变量模型并非如此。它们具有一种“镜子大厅”的特性,即看起来不同的参数集会产生完全相同的观测结果。

  • ​​旋转模糊性:​​ 在因子分析中,潜在空间的轴是任意的。你可以在隐藏空间中旋转你的坐标系,得到的模型对观测数据的拟合程度完全相同。仅凭数据无法告诉你哪种旋转是“正确”的。

  • ​​标签交换:​​ 在一个将数据聚类成组的模型中,我们给这些组起的名字——“簇1”和“簇2”——是任意的。我们可以交换所有标签,而模型保持不变。

  • ​​尺度模糊性:​​ 在某些模型中,我们可以将一个参数乘以一个常数 ccc,同时将另一个参数除以 ccc,而最终的预测保持不变。

这似乎是一个致命的缺陷。如果数据无法区分不同的内部现实,我们又怎能声称知道“真实”的结构呢?答案是,我们不能——仅凭数据不能。不可识别性是通过引入 理论 来解决的。我们必须根据先前的科学知识施加约束。对于旋转模糊性,我们可以使用像普氏旋转 (Procrustes rotation) 这样的方法,来强制我们估计的潜在因子与一个预先指定的目标结构对齐,这个目标结构代表了我们关于这些因子应该是什么的假设。

这揭示了潜变量模型的最终作用。它不是一个自动寻找真理的机器。它是一种语言——一种精确的、数学的语法,用来陈述我们关于塑造我们世界的隐藏原因的理论。它让我们能够将直觉形式化,推导出其出人意料的后果,并用我们感官的证据来严格地检验它们。它不是一个终结科学对话的工具,而是一个提升对话层次的工具。

应用与跨学科联系

既然我们已经探讨了潜变量模型的原理和机制,你可能会感觉自己有点像一个刚刚学会了国际象棋规则的人。你知道棋子如何移动,你理解目标,但你还没有见证过特级大师对局中那令人叹为观止的美妙。魔力在哪里?这个抽象的机制在何处与世界、与我们的生活、与我们这个时代的伟大科学问题相连接?

这是我们旅程中最激动人心的部分。我们即将看到,这一个优雅的理念——即一个未观测的潜在结构塑造了我们 可以 观测的世界——如何在科学的版图上开花结果,催生出成千上万种不同的应用。它是一把万能钥匙,在那些表面上看起来毫无共同之处的领域里解锁深刻的见解。让我们开始一次巡游,看看这把钥匙的实际作用。

心智与社会的架构

也许潜变量模型最直接、最 relatable 的用途是在理解我们自身的探索中。我们用来描述人的许多概念——智力、焦虑、人格、自我效能——都不是我们可以用尺子或天平测量的东西。它们是潜在构念。我们只能在可观测的世界中看到它们的足迹:在问卷的答案中,在一个人的行为中,在他们的选择中。潜变量模型为我们提供了一种严谨的方法,可以追溯这些足迹,找到它们的源头。

思考一个医学上的难题:一个病人患有癌症,并且报告有抑郁症状。他们感到疲劳、睡眠困难、食欲不振。这些症状是由癌症及其治疗的生理负担引起的,还是一个独立的心理抑郁症的迹象?这就像试图同时收听两个电台。我们如何才能解开这些信号?

潜变量模型,特别是验证性因子分析,就像一个精细的调谐旋钮。研究人员可以指定一个包含两个独立的、未观测的因子的模型:一个“躯体疾病”因子和一个“情绪”因子。他们假设,像疼痛和疲劳这样的症状主要“载荷”在躯体因子上,而像快感缺乏(失去快乐的能力)和持续的低落情绪这样的症状则载荷在情绪因子上。通过分析所有症状指标之间的协方差,该模型可以检验这种结构是否成立。它可以定量地证明,情绪症状彼此之间共享的方差比它们与躯体疾病因子共享的方差更多,从而建立所谓的区分效度。这为为什么即使在身体患病的人中,快感缺乏和情绪低落也可以被视为抑郁症的核心症状提供了正式的理由,从而实现更精确的诊断和治疗。该模型不只是看到一堆混乱的症状;它揭示了产生这些症状的独立底层过程。

这种对心理构念的建模能力从诊断延伸到了公共卫生领域。想象一个公共卫生科学家团队正在设计一个项目,以鼓励护理专业的学生接种年度流感疫苗。他们受到一个名为社会认知理论的强大理念的指导,该理论假定一个人的行动意图是由自我效能(他们对自己能执行该行为的能力的信念)和结果预期(他们对行为后果的信念)等潜在构念所塑造的。但是你如何测量“自我效能”?你可以问一系列问题:“即使你很忙,你有多大信心能去接种疫苗?”、“即使你害怕打针,你有多大信心?”等等。潜变量模型,在这种情况下是结构方程模型 (SEM),将此形式化。它将自我效能建模为一个导致对这些具体问题答案的潜在因子。然后,它更进一步,对潜在因子之间的假设关系进行建模:例如,观察到教授接种疫苗(观察性学习)会增加学生的自我效能,这反过来又加强了他们接种疫苗的意愿。这不仅仅是一个学术练习;它让科学家能够检验理论,并找出改变行为、改善公共卫生的最有效杠杆。

同样的逻辑可以从个体扩展到整个系统。我们如何评判一家医院或一个健康计划的“质量”?我们有几十个指标:儿童免疫接种率、糖尿病控制情况、患者满意度调查等等。对这些分数进行简单平均可能会产生误导。一个在儿童免疫接种方面表现出色但在糖尿病护理方面较差的健康计划真的算是“高质量”吗?一个加法分数会允许高分完全补偿低分。潜变量模型提供了一个更复杂的解决方案。它们可以将“总体质量”视为一个潜在构念,由所有这些不同的指标所反映。这样做,模型可以考虑到一些指标更重要(具有更高的“载荷”),一些指标比其他指标更嘈杂,以及它们都是相互关联的。这种统计方法提供了一个比简单平均更稳健、更细致的绩效图景,从而可以进行更公平的比较和更明智的政策决策。

解读自然之书

从人类心理的错综复杂,我们转向生命本身的基本过程。在这里,在生物学和生态学的领域,潜变量模型已成为解读自然惊人复杂性的不可或缺的工具。

现代生物学最大的挑战之一来自于单细胞技术产生的海量数据。我们现在可以测量,例如,数万个单个细胞中数千个基因的活性。数据矩阵是巨大的,但它们也极其“稀疏”和“嘈杂”。一个基因可能在一个细胞中是活跃的,但由于技术原因,我们的测序机可能未能检测到它,记录下一个零。这就像试图阅读一本有一半字母缺失的书。我们如何可能从如此有缺陷的数据中重建细胞真实的生物学状态?

潜变量模型是这个故事中的英雄。它们基于一个强大的假设:数千个基因的表达不是随机的,而是由一个数量少得多的底层基因表达程序或“因子”协调的。通过同时分析所有细胞和所有基因的共表达模式,潜变量模型可以在数据中“借力”。如果一个基因的信号在一个细胞中缺失,但同一程序中的其他基因是活跃的,模型可以推断该基因很可能也是活跃的。它填补了空白,区分了“技术性零值”和“生物学零值”,揭示了真实的底层染色质状态或基因表达水平。它从破损的书页中重建了整本书。

有了这种透过噪声看本质的能力,我们可以提出更深层次的问题。发育生物学是研究单个受精卵如何转变为复杂有机体的学科。这是一个连续的过程,一条穿越时间的轨迹。但是当我们进行单细胞实验时,我们得到的是一个静态快照——成千上万个细胞在这条轨迹上不同点被冻结的云图。我们如何从一堆不连贯的静止图像中重建出电影?潜变量模型通过假设细胞位于高维基因表达空间中的一个低维“流形”上来实现这一点。模型的任务是找到这个潜在的路径。通过将细胞沿着这个推断出的路径排序,我们可以重建一个代表发育进程的“伪时间”。我们可以观察到祖细胞分化为神经元,并识别出在此过程中开启和关闭的基因。我们甚至可以将这个发育过程与其他混淆过程(如细胞周期)分离开来,后者可能会在数据中将发育路径扭曲成一个令人困惑的循环。潜变量模型让我们能够目睹一个因其本质而无法通过单次快照测量看到的过程序。

这些用于解开复杂原因的原则不仅适用于单个生物体内,也适用于整个生态系统。想象一下,研究一个同时受到多种环境压力源冲击的河口——比如,营养物污染和海洋热浪。这些因素如何影响当地的植物生命?它们是独立起作用吗?它们会相互放大吗?热浪有直接影响,还是通过在植物中诱发一种普遍的“生理压力”来间接起作用?结构方程模型可以将这些问题形式化。它可以假设一个潜在的“压力”因子,由细胞损伤和热休克蛋白等指标来衡量。然后它可以估计各个路径:热对光合作用的直接影响,通过压力因子产生的热的间接影响,以及——至关重要的——交互效应,即热和营养物共同产生的影响大于它们各自部分的总和。这使得生态学家能够超越简单的相关性,开始绘制出控制生态系统对全球变化响应的复杂因果网络。

伟大的综合

当潜变量框架不仅用于分析一种数据类型,而是用于同时综合多种不同类型的数据时,其真正的力量才最为彰显。这是生物学和医学中“多组学”的前沿领域。

分子生物学的中心法则告诉我们,信息从DNA(其可及性由染色质状态决定)流向RNA,再从RNA流向蛋白质。这是一个细胞现实的三个不同层面。借助现代技术,我们可以测量所有这些层面,通常来自同一个细胞:scATAC-seq测量染色质可及性,scRNA-seq测量RNA水平,而CITE-seq可以测量蛋白质水平。我们最终得到了三个巨大而嘈杂的数据集。我们如何将它们组合在一起,讲述一个单一、连贯的故事?

一个联合潜变量模型正是为此而生。它假设存在一个单一的、共享的潜在空间,代表细胞的基本生物学状态 ziz_izi​。然后它假设这个共享状态产生了所有三种观察到的数据模态,但通过不同的“解码器”或载荷矩阵 W(m)W^{(m)}W(m)。在条件独立性的假设下——即给定真实的潜在状态 ziz_izi​,RNA、ATAC和蛋白质的测量结果彼此独立——模型可以学习到最能同时解释所有三个数据集的潜在空间。这是一个深刻的综合。模型找到了贯穿于染色质、转录组和蛋白质组中的统一生物学过程。这种方法不仅限于“组学”数据;同样的逻辑也用于放射基因组学,以寻找连接医学图像(例如,MRI上肿瘤的纹理)与该肿瘤基因表达谱的共享潜在因子。我们正在寻找贯穿于看待同一生物对象的截然不同方式中的共同线索。

终极隐变量

我们已经从人类心智旅行到生态系统,再到单个细胞的内部运作。在我们的最后一站,让我们将这个理念推向其终极结论,并与基础物理学架起桥梁。因为还有什么问题比“我们观察到的现实就是全部现实吗?”更深刻呢?

在20世纪初,量子力学的奇异预测让一些物理学家,最著名的是 Albert Einstein,感到这个理论必然是不完整的。量子事件的表观随机性——例如,一个放射性原子是在现在还是在下一秒衰变——在这种观点下,并非根本性的。它仅仅是我们对更深层次现实无知的反映,是对一组“隐变量”的无知。如果我们知道这些隐变量的确切值,任何量子实验的结果都将是完全确定的,就像抛硬币的结果由其初始速度和旋转决定一样。这本质上是为宇宙本身提出的一个潜变量理论。

几十年来,这只是一个哲学辩论。但在1960年代,物理学家 John Stewart Bell 设计了一个定理,可以将这个想法付诸实验检验。其设置与我们的统计模型惊人地相似。想象一个源,它产生处于特殊量子“单线态”的粒子对,并将它们向相反方向发射。在两个站点,Alice 和 Bob 各自沿着他们选择的轴测量其粒子的自旋。量子力学对他们结果之间的相关性如何取决于他们测量轴之间的角度 θ\thetaθ 做出了具体的预测。这个相关函数是三角函数式的;它遵循一个余弦波。

但是一个简单的、符合常识的隐变量理论会预测什么呢?一个玩具模型,类似于“Bertlmann的袜子”(如果一只袜子是粉色的,你就知道另一只也是粉色的),预测得到不同结果的概率应该只是与探测器之间的角度成正比,一个简单的线性关系:PHV(disagree)=θ/πP_{HV}(\text{disagree}) = \theta / \piPHV​(disagree)=θ/π。当实验进行时,结果完美地匹配了量子力学的波浪状、三角函数式预测,并决定性地排除了这类简单的局域隐变量理论。

宇宙,似乎并不遵循简单潜变量模型的逻辑。这种联系令人叹为观止。我们用来理解抑郁症、构建生物标志物、绘制苍蝇发育图谱的同一种思维模式——即假设一个未观测的现实来解释观测到的相关性——也是用来探索现实本身基本性质的同一种思维模式。在这样做的时候,我们发现宇宙比我们经典直觉所能想象的要奇怪和美丽得多。事实证明,对无形之物的探索,正是科学的核心所在。