首页模拟星表生成：构建模拟宇宙

模拟星表生成：构建模拟宇宙

玻尔百科

定义

模拟星表生成：构建模拟宇宙是宇宙学研究中不可或缺的模拟过程，旨在为理论测试和分析方法提供已知真实情况的受控环境。该技术通过将离散的模拟快照转换为连续的过去光锥，并利用统计或物理模型在暗物质晕中填充星系。为了准确模拟真实观测，生成过程涵盖了红移空间畸变、巡天选择函数和K校正，广泛应用于校准测量技术和量化精密宇宙学中的系统误差。

核心要点

模拟星表是不可或缺的“模拟宇宙”，它允许宇宙学家在一个已知真实 underlying truth 的受控环境中检验理论和分析方法。
构建一个模拟星表涉及将离散的模拟快照转化为连续的过去光锥，识别暗物质晕，并使用统计或基于物理动机的模型将星系填充其中。
为了精确模仿真实观测，模拟星表必须包含一系列效应，包括本动速度（红移空间畸变）、巡天选择函数和K-校正。
模拟星表的主要应用包括校准测量技术、量化精确宇宙学中的系统误差，以及探索超出标准模型的新物理学。

引言

在我们探索宇宙的征途中，我们面临一个根本性的限制：我们只有一个宇宙可供观测，且无法让时间倒流或对其进行实验。那么，我们如何才能自信地检验我们的宇宙演化理论，或验证用于解读望远镜数据的复杂分析工具呢？答案在于在计算机中构建我们自己的宇宙。这些被称为模拟星表的合成宇宙，已成为现代宇宙学不可或缺的“飞行模拟器”，让科学家能够在一个受控的数字实验室中练习技术、量化不确定性，并探索“如果……会怎样”的情景。

本文全面概述了模拟星表生成背后的科学与方法论，旨在填补原始理论模拟与现实观测数据之间的关键知识鸿沟，解释我们如何将两者联系起来。读者将对从基本原理到前沿应用的整个过程获得深刻理解。

第一章“原理与机制”将引导您完成构建模拟星表的技术之旅。我们将探讨如何将静态的模拟快照拼接成动态的过去光锥，如何识别不可见的暗物质晕，以及如何使用不同的“配方”将我们看到的星系填充到这些暗晕中。第二章“应用与跨学科联系”将展示这些模拟宇宙在实践中的强大威力。我们将看到模拟星表如何被用来锻造发现的工具， refining 我们对星系-暗晕关系的理解，以及对抗那些挑战我们追求宇宙学精度的系统误差。

原理与机制

为了理解我们的宇宙，我们必须能够用观测来检验我们的理论。但是，当我们只有一个宇宙可看，且无法让时光倒流时，我们如何检验一个宇宙演化理论呢？答案是在计算机中构建我们自己的宇宙。这些被称为模拟星表的合成宇宙不仅仅是为了制作漂亮的图片；它们是现代宇宙学不可或缺的实验室。它们使我们能够演练测量技术，量化不确定性，并探索在真实宇宙中无法探究的“如果……会怎样”的情景。从原始的引力模拟到看起来与望远鏡所見完全一樣的模擬星表，這段旅程是物理學與數據科學的傑作，揭示了我們的理論模型与時空結構之間的深層統一性。

宇宙舞台：从快照到光锥

模拟星表的故事始于宇宙学模拟。这些模拟通常在一个膨胀的宇宙中追踪数十亿乃至数万亿个暗物质粒子在引力无情牵引下的演化。这类模拟的原始输出是一系列快照：在宇宙时间的特定离散时刻，宇宙的3D立方体。红移为零的快照向我们展示了“今天”的宇宙网，而更高红移的快照则向我们展示了一个更年轻、结构化程度更低的宇宙。

但我们永远无法将宇宙看作单一的快照。今晚到达我们眼睛的来自仙女座星系的星光是250万年前发出的。来自遥远类星体的光可能已经传播了超过100亿年。由于光速是有限的，向外太空看等同于回望过去。天文学家观测到的不是空间的一个3D切片；他们观测的是时空中一个称为过去光锥的4D表面。这个表面包含了所有光线刚好现在到达我们的物体，从不久前所见的邻近星系，到宇宙婴儿期所见的最遥远天体。

要构建模拟星表，我们必须从我们的模拟快照中构建这个光锥。这意味着我们不能只取一个模拟数据盒。相反，我们必须想象自己处于中心，并从不同的快照中收集粒子，这些快照对应于它们正确的“回溯时间”。这个过程的基本规则手册是一个物体的观测红移（ $z$ ），即其光因宇宙膨胀而被拉伸的程度，与其共动距离（ $\chi$ ），即它在膨胀的宇宙网格上与我们的距离，之间的关系。对于一个平坦宇宙，这种映射由膨胀历史决定，并 encapsulated 在哈勃参数 $H(z)$ 中：

\chi(z) = c \int_{0}^{z} \frac{dz'}{H(z')}

这个方程是将一系列静态快照转变为单个观测者所见的动态、演化宇宙景观的关键。它是回望过去的数学体现。

这种映射也揭示了宇宙学中的“距离”并非单一概念。我们需要不同的度量来满足不同的目的。光度距离（ $D_L$ ）告诉我们一个已知光度的物体看起来会有多暗，而角直径距离（ $D_A$ ）则告诉我们一个已知物理尺寸的物体看起来会有多大。这两者并不相同！它们通过宇宙学中最优雅、最深刻的关系之一——距离二元关系——联系在一起：

D_L = (1st+z)^2 D_A

这不仅仅是一个方便的公式；它是关于我们宇宙几何的深刻陈述。它直接源于引力由度规理论（如广义相对论）描述，且光子沿零测地线传播且其数量守恒的原理。值得注意的是，即使在我们这个充满团块、非均匀的宇宙中，光线因引力透镜效应而弯曲，这个关系依然成立。任何物理上忠实的模拟星表都必须遵守这一关系。

为星系寻找家园：暗晕及其特性

我们的模拟主要是针对暗物质，这种看不见的支架构成了宇宙中约85%的物质。我们实际看到的發光示蹤物——星系，被认为是在我们称为暗晕的致密、引力束缚的暗物质茧中形成和存在的。因此，在放置星系之前，我们必须首先在我们的粒子模拟中找到这些暗晕。

但是，你如何在一个包含数十亿个点的分布中定义一个“团块”呢？这个看似简单的问题具有深远的影响。两种最常见的方法在哲学上截然不同：

友邻算法（Friends-of-Friends, FOF）是一种简单的“连点成线”方法。它将任何两个距离小于指定连接长度（通常是平均粒子间距的20%）的粒子连接在一起。任何一组相互连接的粒子就形成一个暗晕。这是一种无需假设特定形状就能找到过密区域的直观方法。
球形过密度（Spherical Overdensity, SO）算法更具物理动机。简单的引力坍缩模型表明，当一个结构的密度达到背景密度的某个倍数时，它就成为一个独特的、束缚住的物体。SO方法找到粒子集中区域，并在其周围生长球体，直到球体内的平均密度达到预定义的阈值，例如宇宙临界密度的200倍。这个球体内的质量随后被定义为暗晕质量，记为 $M_{200\mathrm{c}}$ 。

至关重要的是，这两种方法不会给出相同的结果。FOF作为一种渗流方法，以将邻近但独立的暗晕“桥接”成单个物体而闻名，并且其边界是由比典型SO暗晕更低的密度阈值定义的。因此，对于同一个物体，FOF质量通常大于 $M_{200\mathrm{c}}$ 质量。这不仅仅是一个技术细节；暗晕的数量随着质量的增加而急剧下降。在一个用 $M_{200\mathrm{c}}$ 校准的模型中使用FOF质量，将导致对大質量星系团的严重过高预测，从而使从该模拟中得出的任何科学结论产生偏差。选择何种暗晕寻找器是一个根本性的建模决策，它塑造了整个星表。

星系-暗晕关系：填充模拟星表

在我们过去光锥上构建了暗物质晕星表之后，我们终于可以开始添加星系了。从第一性原理出发，模拟星系形成的复杂物理过程——气体冷却、恒星形成、超新星爆发、黑洞反馈——对于大体积来说计算成本过高。因此，我们使用巧妙的“配方”来建立星系-暗晕关系。

一种流行的配方是暗晕占据分布（Halo Occupation Distribution, HOD）。这是一种统计方法。我们不试图模拟物理过程，而是问一个更简单的问题：对于一个给定质量为 $M$ 的暗晕，它拥有 $N$ 个亮度高于某一阈值的星系的概率 $P(N|M)$ 是多少？一个标准的HOD模型假定，一个暗晕有机会拥有一个中心星系，然后拥有若干卫星星系，其数量遵循一个简单的统计分布（如泊松分布），其平均值随暗晕质量的增加而增加。然后调整该模型的参数，直到模拟星系的统计特性（如它们的成团性）与真实宇宙相匹配 [@problem⚫️_id:3512720]。
另一个强大的想法是子暗暈豐度匹配（Subhalo Abundance Matching, SHAM）。该方法建立在一个 beautifully simple 的假设上：质量最大的星系应该位于质量最大的暗物质晕中。人们只需将观测到的按恒星质量（或光度）排序的星系列表，与按质量排序的模拟暗晕（和子暗晕）列表进行一对一匹配。为了使之更稳健，人們通常不按暗暈的當前質量排序（因為潮汐剝離可能會減小質量），而是按其历史峰值质量 $M_{\mathrm{peak}}$ 排序。这为暗暈的原始大小，以及推测其形成大星系的能力，提供了一个更稳定的指标。

这些方法代表了两种弥合暗物质与光之间鸿沟的不同哲学，各有其长处。HOD是一个灵活的统计工具，而SHAM则是一个直接、有物理动机的假设。这两种方法之间的持续张力与协同作用，极大地推动了我们对星系如何填充宇宙网的理解。

眼见为实：创造逼真的可观测量

至此，我们有了一个包含星系位置和宿主暗晕的星表。但是天文学家看到的不是位置；他们看到的是天空中的角度、红移和视星等。模拟生成的最后关键步骤涉及将我们的“真实”物理星表转换为逼真的“观测”星表。

一个星系的观测红移并不仅仅是由宇宙的平滑膨胀引起的。它还包括了来自星系自身本动速度的多普勒频移。这种被称为红移空间畸变（Redshift-Space Distortion, RSD）的效应，系统性地改变了我们对宇宙网的感知。在大尺度上，流向大质量星系团的星系在我们视线方向上会显得更密集，使星系团看起来被压扁了。在小尺度上，在一个星系团内部，星系在暗晕深邃的引力势阱中随机 buzzing。这些由维里定理支配的随机运动，为观测到的红移增加了一个大的随机分量。这会使星系团沿视线方向被抹开，形成一个被称为上帝之指（Finger-of-God, FoG）的细长结构，仿佛指向观测者。一个逼真的模拟星表必须包含这些速度效应，以再现真实巡天中看到的各向异性成团性。

接下来，我们必须计算每个星系看起來有多亮。一个星系的內禀顏色和亮度由其谱能量分布（Spectral Energy Distribution, SED）描述，即其光度隨波長的函數。要找到它在给定滤光片中的视星等，我们必须考虑其光度距离 $D_L$ 。但我们还必须考虑红移会移动整个SED。一个最初在紫外波段发射的光谱特征，可能会被红移到望远镜滤光片敏感的蓝色光谱部分。这种效应被K-校正所捕捉，它是一个依赖于红移和SED的项，确保我们在将星系的观测星等与其内禀绝对星等联系起来时，是在比较同类事物。

最后，没有任何观测是完美的。一次巡天在天空中有一个有限的足迹（其窗函数），并且无法探测到太暗的物体。望远镜硬件可能会失灵，天空条件可能会变化。所有这些不完美之处都被捆绑在选择函数 $S(\vec{\theta}, m, z)$ 中。这是一个主函数，给出了一个位于给定天空位置 $\vec{\theta}$ 、视星等为 $m$ 、红移为 $z$ 的星系被成功探测并包含在最终星表中的概率。为了创建最终的模拟星表，我们将这个概率性过滤器应用于我们的理想化星表，将其“稀疏化”以模仿天文观测混乱的现实。

模拟星表动物园：保真度的光谱

从高分辨率的全N体模拟创建一个黄金标准的模拟星表是一项巨大的计算任务。对于许多应用，例如估计宇宙学测量的统计不确定性（或“协方差”），我们需要的不是一个，而是成千上万个模拟星表。这催生了各种更快、近似的模拟星表生成技术。

像COLA和PINOCCHIO这样的方法使用拉格朗日微扰理论的近似来快速预测大尺度结构和暗晕位置，牺牲了小尺度精度以换取巨大的速度提升。更快的是纯粹的统计方法，如对数正态模拟，它生成一个随机密度场，该密度场通过构造具有正确的两点统计量，而完全不模拟任何引力动力学 [@problem_t_id:3477623]。选择使用哪种工具是物理保真度与计算成本之间的经典权衡，并且完全取决于所要研究的科学问题。

推进前沿：宇宙边缘的广义相对论

基于牛顿引力在平滑膨胀背景上的标准模拟星表生成图像非常成功。然而，对于旨在绘制整个可观测宇宙的未来巡天来说，这种近似在边缘开始失效。在接近宇宙学视界的尺度上，通常可以忽略的广义相对论（GR）效应变得重要起来。

来自最遥远星系的光不仅穿过一个膨胀的空间；它还必须爬进爬出超星系团和宇宙空洞的引力势阱。这会印上额外的红移（Sachs-Wolfe效应和积分Sachs-Wolfe效应），并通过引力透镜效应扭曲星系的表观大小和数密度。标准的牛顿模拟完全忽略了这些微妙的大尺度GR特征。

模拟星表生成的前沿是构建包含这些效应的星表。这既可以通过“后处理”牛顿模拟——从密度场重建GR势并对其进行光线追踪——来实现，也可以使用下一代相对论N体代码，这些代码与粒子运动一起求解广义相对论的全套方程。这些先进的模拟星表不仅仅是改进；它们是在最宏大的尺度上检验爱因斯坦理论、将我们的模拟宇宙转变为基础物理实验室的必要工具。

应用与跨学科联系：盒子里的宇宙

如果你想学习驾驶一架现代喷气式客机，你不会仅仅阅读手册然后就从一个繁忙的机场起飞。你会在飞行模拟器上花费无数个小时。一个好的模拟器是工程学的杰作；它模拟了飞机的空气动力学、天气的怪癖以及世界各地机场的布局。它允许你练习、犯錯，並在一個後果只是螢幕上數字的世界裡測試飛機的極限。你使用模拟器来测试自己的能力，并理解你试图驾驭的机器。

在宇宙学中，我们的“喷气式客机”是整个宇宙，我们的“飞行手册”是我们认为支配它的物理定律集。我们从望远镜获得的数据是我们唯一的一次“飞行”。我们如何确定我们正在正确地解释它？我们如何测试我们的分析方法并理解它们的局限性？我们建造一个模拟器。我们在一个盒子里建造一个宇宙。这些被称为模拟星表的模拟宇宙，是我们的宇宙学飞行模拟器。它们是计算实验室，其中的“真相”是已知的，因为是我们编程输入的。通过尝试“观测”这些模拟宇宙并恢复我们嵌入的真相，我们可以磨砺我们的工具，量化我们的不确定性，并获得我们需要的信心来解释我们能看到的唯一真实的宇宙。

锻造发现的工具

在物理学家声称一项新发现之前，他们必须首先证明他们的测量设备工作正常。对于宇宙学家来说，“测量设备”不仅仅是一架望远镜；它是将原始数据转换为对宇宙膨胀历史等量的测量的整个复杂的统计分析链。模拟星表是这个分析机器的终极校准工具。

想象一下你想测量星系如何聚集在一起。主要工具是两点相关函数 $\xi(r)$ ，它告诉你发现两个相距为 $r$ 的星系的超额概率。然而，这里有一个难题。我们不直接测量距离；我们测量红移。一个星系的红移部分是由于宇宙的膨胀，但它也受到星系自身本动速度的影响，因为它落入星系团或沿着宇宙灯丝流动。这种被称为红移空间畸变（RSD）的效应，使得结构在视线方向上在大尺度上显得被压扁，在小尺度上被拉伸成“上帝之指”。

这种畸变污染了我们对 $\xi(r)$ 的测量。一个标准的缓解技术是在2D中测量相关函数，按垂直于视线的距离（ $r_p$ ）和平行于视线的距离（ $\pi$ ）来分隔星系对，然后积分掉视线方向的分量以获得投影相关函数 $w_p(r_p)$ 。但是积分极限 $\pi_{\max}$ 应该是多少呢？如果它太小，我们会丢弃真实的成团信号。如果它太大，我们会包含物理上不相关的星系对，增加噪音和残留的RSD污染。

这就是模拟星表变得不可或缺的地方。我们可以创建一个模拟宇宙，其中我们知道每个星系的真实、实空间位置。然后，我们可以从模拟中加入本动速度来创建“观测到的”红移空间位置。我们现在可以在这个模拟星表上测试我们的 $w_p(r_p)$ 分析。我们可以为各种 $\pi_{\max}$ 的选择计算 $w_p(r_p)$ ，看看哪一个最好地恢复了我们已经从模拟星表的实空间数据中知道的真实相关函数。我们寻找 $\pi_{\max}$ 的值，使得结果停止改变——即达到一个稳定的平台期。这给了我们一个优化、经过验证的程序，然后我们可以放心地应用于真实的、混乱的、且 infinitely more precious 的观测数据。模拟星表作为我们的陪练伙伴，让我们在与真实宇宙较量之前完善了我们的技术。

从黑暗到光明：连接理论与观测

宇宙学中最宏大的模拟追踪了暗物质的演化，这是 luminous 宇宙赖以建立的无形支架。这些模拟产生了巨大的暗物质晕宇宙网——引力将物质聚集在一起的致密节点。但我们的望远镜看不到暗物质；它们看到的是星系。制作模拟星表的核心挑战是弥合这一鸿沟，将黑暗的骨架转变为一个活生生的、闪耀的宇宙。这就是“星系-暗晕关系”的艺术与科学。

你可能有的最简单的想法是，更大的暗晕应该拥有更大、更亮的星系。我们可以将这种直觉转化为一个称为恒星质量-暗晕质量关系（SHMR）的定量“配方”。通过观测和更详细的流体动力学模拟，我们可以建立一个经验模型，告诉我们，平均而言，如果一个星系生活在一个质量为 $M_{\rm halo}$ 的暗物质晕中，它应该具有什么样的恒星质量 $M_\star$ 。为了创建一个基本的模拟星表，我们可以遍历我们的暗物质模拟，对于每个暗晕，我们使用这个SHMR配方来为其内的星系分配一个恒星质量。当然，大自然有其创造性，所以星系形成并非完全确定性的；我们为恒星质量添加一点随机的“散射”来反映这一点。然后，利用我们的宇宙学知识——支配宇宙距离和体积的弗里德曼-勒梅特-罗伯逊-沃尔克度规——我们可以将这些星系放置在一个虚拟的天空中，创建一个模仿真实望远镜所见的 lightcone。

但是这个简单的配方足够好吗？也许暗晕的质量并不是唯一重要的东西。也许其中粒子的峰值速度 $V_{\rm peak}$ 是星系光度的更好预测指标。我们如何决定呢？我们可以再次求助于模拟星表，这次是作为科学研究的工具。我们可以将一个高度详细（且计算成本非常高）的流体动力学模拟——一个模拟了气体物理、恒星形成和反馈的模拟——作为我们的“地面实况”。在这个模拟中，我们既有暗物质晕的属性（ $M_{\rm peak}$ , $V_{\rm peak}$ ），也有在其中形成的星系的“真实”恒星质量 $M_\star$ 。然后我们可以问：在固定的恒星质量下， $M_{\rm peak}$ 的散射是比 $V_{\rm peak}$ 的散射更小还是更大？散射更小的代理是更好的预测指标。通过进行这种分析，我们使用模拟星表来 refining 我们对星系-暗晕关系本身的理解，从而提高下一代大体积模拟星表的保真度。

当我们考虑到任何真实观测固有的偏差时，这个过程变得更加关键。望远镜有灵敏度极限；它看不到无限暗的物体。这个“星等极限”意味着当我们向太空深处看时，我们优先只看到最亮的星系。这种选择效应会欺骗我们。想象一下你正在尝试为你的模拟星系分配颜色。你从观测中知道有一个年轻、正在形成恒星的星系的“蓝云”和一个年老、被动演化的星系的“红序”。红色星系的比例随光度和红移而变化。如果你没有正确地建模这一点，并且你还忘记了一个星系的颜色会影响它的光如何被红移以及它是否能进入你的样本（一种称为 $K$ -校正的颜色依赖效应），你最终的模拟星表将会有一个完全错误的颜色分布。唯一可靠的前进方式是使用内禀的物理规则来构建模拟星表，然后应用与真实巡天完全相同的数字选择效应。通过比较“内禀”宇宙和“观测到”的模拟宇宙，我们可以学会将物理从选择偏差中解脱出来，这是一项仅凭观测数据几乎不可能完成的壮举。

追求宇宙学精度

现代宇宙学是一场精度的游戏。我们正试图将某些数字——暗能量的量、中微子的质量、空间的几何形状——测量到百分之一的精度甚至更高。在这个精度水平上，微小的系统误差，如果不加以考虑，可能会引导我们得出完全错误的结论。模拟星表是我们对抗系统误差的主要武器。

一个典型的例子是重子声学振荡（BAO）尺度的测量。BAO是星系分布中的微弱涟漪，是早期宇宙热等离子体中传播的声波的遗迹。这个涟漪提供了一个已知物理尺寸的“标准尺”，我们可以用它来绘制宇宙的膨胀历史。然而，经过数十亿年，宇宙结构的引力作用模糊了这个原始的标尺。由非线性演化引起的模糊量随红移而变化。为了进行精确测量，我们必须运行一种算法来“重建”初始密度场，从而有效地 sharpening 标尺。但是我们如何信任我们的重建算法呢？我们在高保真度的模拟星表上测试它。这些不是你简单的静态模拟；它们必须是通过拼接许多模拟快照构建的完整光锥，仔细地根据我们的理论按红移缩放结构生长和本动速度。只有一个与真实宇宙具有相同、不断演变的“模糊度”的模拟星表，才能为我们的去模糊工具提供公正的测试。

另一个微妙的系统误差源于我们自己的假设。为了将我们观测到的角度和红移转换成3D地图，我们必须假设一个“参考”背景宇宙学。但如果那个假设的宇宙学略有错误怎么办？Alcock-Paczynski效应告诉我们，这将引入几何畸变，人为地沿视线方向拉伸或压缩结构。这将改变我们BAO标准尺的表观长度，从而使我们的宇宙学结果产生偏差。模拟星表让我们能够完美地量化这种效应。我们可以生成一个已知“真实”宇宙学的模拟宇宙，然后假设一个不同的“参考”宇宙学来分析它。输入真相与测量结果之间的差异就是我们的假设引入的精确偏差。这使我们能够在最终测量中恰当地考虑这一误差源。

也许最阴险的系统误差是那些源于新的、未建模的物理学的误差。以“星系并合偏见”为例。我们最简单的模型假设暗晕的质量是决定其内部星系属性的全部因素。但如果一个暗晕的历史也很重要呢？在相同质量下，一个早期形成的暗晕会比一个晚期形成的暗晕更紧凑，并生活在更密的环境中。这就是并合偏见。由于星系的年龄和颜色与暗晕的形成历史有关，一个根据颜色选择星系的巡天可能会优先选择具有特定并合历史从而具有不同成团强度的暗晕。这可能在测量的BAO尺度上引入一个微小但系统的偏移。如果没有模拟星表，调查这种微妙的效应几乎是不可能的。我们可以构建明确包含并合偏见的复杂模拟星表，按颜色选择星系，并测量BAO尺度产生的偏移。这就是我们如何寻找那些可能破坏我们追求精度之路的“未知的未知”。

拓展视野：新物理学与新信使

模拟星表的作用超出了理解标准宇宙学模型。它们正在成为探索基础物理学前沿和新天文学领域的重要工具。

一个世纪以来，爱因斯坦的广义相对论（GR）通过了每一次检验。但它在宇宙尺度上是否依然成立？许多替代理论，通常被用来解释暗能量，预测了与GR的微妙偏差。例如，在 $f(R)$ 引力中，会出现一种“第五种力”，但它通过“变色龙屏蔽”机制隐藏在像太阳系这样的致密环境中。这意味着引力在星系团内部可能表现得像GR，但在宇宙空洞中则不同。我们如何检验这一点？模拟星表可以指明道路。我们可以取一个标准的星系模拟星表，对每一个星系，根据其自身质量和所有邻近星系的质量计算局部引力势。使用来自修正引力理论的屏蔽判据，我们可以创建一张虚拟天空的地图，用颜色编码第五种力应该活跃（“未屏蔽”）和应该隐藏（“已屏蔽”）的区域。这张地图告诉观测者应该在哪里寻找与GR的潜在偏差，将模拟星表变成了新物理学的藏宝图。

宇宙学巡天的威力也可以通过结合不同的探针来放大。我们不仅可以绘制一种类型的星系图，还可以绘制生活在同一宇宙体积中的两种或多种不同星系群体（例如，亮的红星系和暗的蓝星系）的图。因为两者都追踪相同的底层暗物质场，我们可以巧妙地组合它们的信号来消除“宇宙方差”——即由于我们只有一个宇宙可供观测而产生的不确定性。为了开发和测试这些“多示踪物”方法，我们需要将不同类型的星系绘制在同一个暗物质模拟上的模拟星表。同样的原理允许我们将星系巡天与来自弱引力透镜的宇宙剪切图结合起来，这是另一种强大的暗物质探针。构建这些多探针、相关的模拟宇宙对于实现下一代巡天的全部潜力至关重要。

这个范式甚至延伸到了天文学最新的信使：引力波。两个中子星的灾难性合并产生的引力波传播到我们这里，充当了一个告诉我们其距离的“标准汽笛”。如果我们也能看到合并的电磁辉光并获得红移，我们就可以对哈勃常数 $H_0$ 进行独立测量。通过在天空中收集许多这样的事件，我们可以问一个深刻的问题： $H_0$ 在每个方向上都相同吗？如果探测到各向异性，将挑战宇宙学原理，即我们标准模型的基础。在我们能够做出这样的声明之前，我们必须理解所有的偏差：引力波探测器不能平等地看到整个天空，而且源的位置可能非常不确定。我们可以构建包含所有这些混乱的现实世界效应的模拟标准汽笛星表。我们可以模拟一个具有真实 $H_0$ 各向异性的宇宙，看看我们的分析流程是否能恢复它。或者，我们可以模拟一个完全各向同性的宇宙，看看噪音和系统误差有多大几率会欺骗我们，让我们以为发现了什么。这些模拟星表是我们导航多信使宇宙学黎明的飞行模拟器。

从校准我们的基本工具到压力测试我们最基本的假设，盒子里的宇宙已成为我们最强大的资产之一。它是宇宙的数字孪生，一个我们可以实验、学习并为理解真实事物的宏伟挑战做准备的实验室。