当下偏见

玻尔百科

核心要点

当下偏见是我们在权衡两个未来时刻的得失时，赋予更接近当前时刻的回报以更强权重的内在倾向。
这种偏见在数学上由双曲贴现模型捕捉，该模型解释了时间不一致行为和偏好逆转，这与经典的指数贴现模型不同。
当下偏见具有深远影响，它导致了个人健康领域的拖延、公共政策领域的投资不足，以及在应对气候变化等长期问题时面临的挑战。
承诺机制和即时激励等策略可以通过使我们的短期行动与长期目标保持一致，来有效对抗当下偏见。

引言

您是否曾满怀壮志地制定计划——开始节食、多存钱或完成一个大项目——却在关键时刻放弃了它？这种在我们的长期愿望和短期冲动之间的常见斗争，并不仅仅是意志力的失败。它是一种可预测且强大的认知偏差，被称为“当下偏见”。这一现象解释了为什么按下贪睡按钮的即时满足感，常常会战胜晨练所带来的遥远益处。它揭示了我们理性的、为未来制定目标的“计划自我”，与我们冲动的、活在此时此地的“行动自我”之间的根本鸿沟。

本文将揭示这种内心冲突背后的科学原理。在接下来的章节中，我们将首先探讨当下偏见的核心“原理与机制”，将优雅但有缺陷的指数贴现模型与更切合实际的双曲贴现模型进行对比。我们将看到，数学曲线上的一个简单改变如何能够解释令人费解的偏好逆转现象。随后，“应用与跨学科联系”一章将揭示当下偏见的深远影响，展示这一个概念如何影响从个人健康和拖延，到公共政策、金融决策，乃至人工智能设计的方方面面。通过理解其运作机制，我们便可以开始在我们今天的自己和我们希望成为的自己之间架起桥梁。

原理与机制

想象一下，现在是周一早上。您满怀好意地决定，这个周五要放弃办公室的庆祝比萨，改吃健康的沙拉。从周一的角度来看，这是一个轻松的选择。与健康的长期目标相比，遥远的比萨乐趣显得微不足道。但当周五午餐时间到来，融化奶酪的香气飘过办公室时，选择不再是两个未来事件之间的权衡，而是在一个诱人的即时奖励和一个抽象的遥远利益之间的抉择。突然之间，您周一用理性的“计划者”自我制定的计划，似乎在周五冲动的“行动者”自我的欲望面前土崩瓦解。这场内心的斗争，这种长期计划被短期欲望破坏的倾向，并非个人失败。它是人类决策中一个基本的、可预测的、并且可以用数学描述的特征，即当下偏见。

未来的平滑斜坡：指数贴现

要理解“当下”的特殊性，我们必须首先理解我们通常如何看待未来。经济学家和心理学家早就知道我们会贴现未来。一年后收到100美元的承诺，对今天的你来说，其价值低于现在就握在手中的100美元。这并非不理性；未来是不确定的，而即时资源更有用。

对此，经典而优雅的模型被称为指数贴现。可以把它想象成反向的复利。每等待一段时间，未来回报的价值就会按一个固定的比例减少。如果你以每年10%的速率贴现未来，那么一年后的100美元对现在的你来说价值90美元。同样的100美元在两年后，其价值是在90美元的基础上再贴现10%，即81美元。价值的衰减是平滑且可预测的。在数学上，在时间 $t$ 收到的回报 $V$ 的现值由贴现函数 $D(t)$ 给出，其值为 $V \cdot D(t)$ 。对于指数贴现，在离散时间段内，该函数为 $D(t) = \delta^t$ ，或者更一般地，为 $D(t) = \exp(-rt)$ ，其中 $r$ 是一个恒定的贴现率。

这个模型有一个优美而强大的特性：时间一致性。它遵循数学家称之为平稳性的规则。该公理指出，如果你今天偏好选项A胜过选项B，那么一年后当你在它们之间做同样的选择时（假设两个选项也同样延迟了一年），你仍然会偏好A胜过B。两个未来事件之间的相对偏好仅取决于它们之间的时间间隔，而与它们距离当前时刻的远近无关。在数学上，这由属性 $D(t+s) = D(t)D(s)$ 捕捉。因此，“指数贴现主体”是完全一致的。他们的“计划者”自我和所有未来的“行动者”自我都处于完美和谐之中。如果他们在周一制定计划，他们会在周五坚持执行。

“当下”的悬崖：双曲贴现

尽管优雅，指数模型却未能捕捉到即时当下的巨大吸引力。人类的偏好似乎并非沿着平滑的指数曲线下降。相反，似乎存在一个悬崖——在“此时此刻”和“任何非此时此刻的时间”之间，价值评估会出现一个急剧且不成比例的下降。这就是当下偏见的本质。

为了对此建模，我们需要一种不同的贴现函数。于是，双曲贴现应运而生。该函数的一种常见形式是 $D(t) = \frac{1}{1+kt}$ ，其中 $k$ 是一个衡量贴现程度的参数。如果你绘制这个函数，你会发现它在开始时下降得非常陡峭——今天（ $t=0$ ）和明天（ $t=1$ ）之间的价值下降是巨大的。但曲线很快就变得平缓。从现在起一年后和一年零一天后的价值下降则微乎其微。这种数学形状完美地捕捉了我们的直觉：当奖励现在就可获得时，一天的延迟感觉非常痛苦；但当它已经是一年之后的事情时，一天的延迟就显得微不足道了。

一个特别有洞察力的建模方法是准双曲或 $(\beta, \delta)$ 模型。该模型采用了标准的指数贴现因子（ $\delta$ 部分），并加入了一个转折：一个参数 $\beta$ (beta)，其中 $0 \beta 1$ 。这个 $\beta$ 就像一种特殊的税，施加于所有未来的回报，但对现在可获得的回报无效。因此，从今天的角度来看，时间 $t > 0$ 时的回报不仅被 $\delta^t$ 贴现，而是被 $\beta \delta^t$ 贴现。那个小小的 $\beta$ 因子就是当下偏见的数学体现，是我们对任何需要哪怕一点点等待的事物所施加的特殊惩罚。

逆转：未来计划如何瓦解

这种“现在 vs. 未来”的估值体系最深远的影响是偏好逆转现象。与指数贴现主体不同，双曲贴现主体的偏好是时间不一致的。最周密的计划也可能并且确实会瓦解。

让我们通过一个具体的例子来看看这是如何发生的。想象一位患者正在决定是否服用一种一次性的预防性药物。该药物有即时、不愉快的副作用（成本 $c$ ），但能在两周后提供显著的健康益处（收益 $b$ ）。一项研究可能会用两种方式来框定这个选择，以了解患者的偏好：

近期框架：“您现在愿意服药吗？它在今天会产生 $c=0.15$ QALD（质量调整生命天数）的成本，但在 $T=14$ 天后会带来 $b=0.25$ QALD 的收益。”
远期框架：“您愿意现在承诺在 $S=30$ 天后服用同样的药物吗？它将在第30天产生 $c=0.15$ QALD 的成本，并在第44天带来 $b=0.25$ QALD 的收益。”

一个指数贴现者的选择在两种框架下都会是相同的。如果他们认为在远期框架下是值得的，那么在近期框架下他们也会认为值得。但让我们看看一个每日贴现参数为 $k=0.05$ 的双曲贴现者会怎么做。

在远期框架下，成本和收益都在未来。贴现后的效用为： $U_{\text{far}} = \frac{b}{1+k(S+T)} - \frac{c}{1+kS} = \frac{0.25}{1+0.05(44)} - \frac{0.15}{1+0.05(30)} = \frac{0.25}{3.2} - \frac{0.15}{2.5} \approx 0.078 - 0.06 = 0.018$ 净效用是正的。从今天的角度看，计划一个月后服药是个好主意。患者同意了。

现在，30天过去了。“远期框架”变成了近期框架。成本是即时的。贴现后的效用现在从这个新的“现在”开始计算： $U_{\text{near}} = \frac{b}{1+kT} - c = \frac{0.25}{1+0.05(14)} - 0.15 = \frac{0.25}{1.7} - 0.15 \approx 0.147 - 0.15 = -0.003$ 净效用变成了负值！副作用的即时成本现在显得如此之大，以至于超过了贴现后的未来收益。患者逆转了他们的偏好，拒绝服药，尽管药物本身没有任何变化。这种逆转不是品格的失败；这是他们时间偏好背后数学原理的一个可预测的结果。

涟漪效应：从个人健康到地球命运

这种看似简单的认知偏差具有深远的影响，其涟漪效应遍及我们生活和社会的方方面面。

个人健康： 它是拖延和不遵从医嘱的引擎。高血压患者明白每天服药以在五年内降低中风风险的抽象益处，但即时成本——副作用、每天的麻烦——是现在就能感受到的，因此被过度加权。同样，接种疫苗的即时不适感，可能比避免疾病的贴现后未来益处显得更重要，导致预防性护理的接种率降低。

公共政策与财政： 当下偏见困扰着长期的社会投资。为什么我们难以资助基础设施维护或制定有意义的气候变化政策？因为成本是即时的，且在政治上是痛苦的，而收益虽然巨大，却分布在遥远的未来，并且往往是为了后代人的利益。指数贴现由于其快速衰减的特性，甚至可以使未来的灾难性损害在今天看来也微不足道。矛盾的是，双曲贴现虽然导致近期的拖延，但与指数贴现相比，它实际上赋予了非常遥远的未来更多的权重。在指数贴现下，永续的收益流可能具有有限的价值，但在双曲贴现下却可能具有无限的价值。这造成了一种深刻的紧张关系：我们在哲学上更关心遥远的未来，但在实践中却无法采取即时措施来保护它。

克服偏见： 理解当下偏见的机制是掌握它的第一步。我们可以设计系统和“助推”来帮助我们深谋远虑的计划者自我引导我们冲动的行动者自我。

一个强大的工具是承诺机制。这是你在当下做出的一个选择，用以将自己锁定在未来的行动路线上，就像Ulysses将自己绑在桅杆上以抵抗塞壬女妖的歌声一样。预付不可退款的私人教练费用、设置每月自动转账到储蓄账户，或使用屏蔽社交媒体网站的应用程序，都是我们约束未来自我以坚持长期目标的方式。

另一种方法是以毒攻毒。如果问题在于即时成本，那么即时激励可以是解决方案。卫生机构可以为接种疫苗提供小额的现场现金奖励。数学模型的美妙之处在于，我们甚至可以计算出扭转局势所需的最小激励。弥合当下偏见造成的估值差距所需的激励 $I$ 简单地表示为 $I = (1 - \beta)\delta B$ ，其中 $B$ 是未来收益。这是一个协调我们即时欲望与长期利益的公式。

随着我们设计出日益复杂的人工智能系统来辅助医疗和政策等领域，理解这种偏见至关重要。一个能够模拟患者真实双曲偏好的人工智能临床医生可以预测不遵从医嘱的行为，并在知情同意的情况下，提供这些承诺策略，帮助患者实现他们真正想要的健康结果。

归根结底，对当下偏见的研究揭示了关于我们本性的一个深刻真理。我们并非完全理性、时间一致的主体。我们是被束缚于当下的生物，对我们来说，未来是一个异国。但通过理解那个国家的地图以及我们自身感知的奇特扭曲，我们可以学会驾驭它，在我们今天的自己和我们希望成为的明天的自己之间架起桥梁。

应用与跨学科联系

您是否曾下定决心设置早晨的闹钟，打算早起锻炼，结果却发现，当那一刻来临时，温暖床铺的吸引力，远比未来健康的遥远承诺更难以抗拒？您是否曾连续好几天对自己承诺“我明天就开始那个大项目”？这并非简单的意志力薄弱。它是一个深刻、可预测且可用数学描述的特征，关乎智能生物——从人类到机构，甚至可能到人工心智——如何感知时间的流逝。我们刚才探讨的原理并不仅限于教科书的纸页；它们是驱动我们日常生活和周遭世界中无数决策的隐藏齿轮。现在，让我们踏上一段旅程，看看“当下偏见”这个简单的理念究竟能延伸多远，从关乎我们健康的最个人选择，到关乎我们星球未来的最宏大问题。

自我之战：个人健康与福祉

我们自己的身体和心灵是当下自我与未来自我冲突的主要战场。考虑一下是否去赴约看医生这个简单而平凡的决定。从几周前预约的“计划自我”的角度来看，选择是显而易见的：小小的麻烦是为获得显著的长期健康益处而付出的微不足道的代价。然而，当预约的早晨到来时，“当下自我”接管了。出行的麻烦、在候诊室花费的时间以及可能的不适都是即时且确定的。相比之下，健康益处是抽象的、统计性的，并且遥遥无期。当下偏见极大地放大了即时成本，缩小了延迟的收益，使得“爽约”这个看似不理性的选择在当下感觉完全是理性的。

同样的剧情每天在数百万家庭中上演。对于高血压患者来说，每天服药的长期益处是几年后心脏病发作或中风的风险在统计上会降低。但成本——麻烦、味道、对副作用的持续担忧——是现在就能感受到的。对于吸烟者来说，一支烟的快感是即时的，而戒烟的成本——戒断反应的剧烈不适——也是即时的。戒烟的巨大益处，即更长久、更健康的生活，则分布在遥远的未来。在这两种情况下，“当下自我”都面临着艰难的权衡。长期的、时间一致的观点会压倒性地支持服药和戒烟。但具有当下偏见的头脑，会对所有未来事件施加额外的、沉重的贴现，可能会将即时的成本或快乐视为决定性因素。

值得庆幸的是，理解问题本身就指明了解决方案。如果问题在于即时因素被过度加权，那么解决方案就是增加一个新的、有利于长期选择的即时因素。这就是承诺机制的精妙之处。想象一个吸烟者将一笔钱存入一个账户，如果他尼古丁测试失败，这笔钱就会被没收。突然之间，吸烟的成本不再只是一个遥远的健康风险，而是一个即时的经济损失。或者考虑一位患者，他的智能药瓶在他服药的瞬间就会给他一小笔金钱奖励。这提供了一个即时的小小“胜利”，以抵消即时的麻烦。这些机制是我们有远见的计划自我可以用来对付我们冲动的当下自我的巧妙伎俩，将我们的行为重新调整到与我们自己的长期目标一致的轨道上。

这种内心冲突不仅限于身体健康。想想与身体中心重复性行为相关的挣扎，如强迫性抠皮或拔毛。从长远来看，个人迫切希望停止，以便让皮肤和头发愈合。但在焦虑的时刻，拔或抠的冲动提供了一种即时的、强烈的解脱感。当下偏见告诉我们，这种即时的解脱感很容易压倒贴现后的未来愈合目标，导致一个充满懊悔的循环。在这里，承诺机制同样可以提供帮助。戴手套使得抠皮的即时行为更加困难。使用带时间锁的盒子存放镊子，在冲动和行动之间引入了强制性的延迟。这些策略都遵循相同的原则：它们重塑了成本和收益的即时格局，以帮助长期目标胜出。

这种意图行善，却在关键时刻功亏一篑的模式，正是拖延的本质。我们可以将其形式化。想象一下今天决定是否打流感疫苗。你可以现在打（即时成本，未来收益），下周打（未来成本，未来收益），或者根本不打。你那具有当下偏见的自我几乎总是会更喜欢“下周”而不是“现在”，因为延迟的成本总是比即时的成本更不痛苦。你真诚地制定了下周去打针的计划。但当下周到来时，它就变成了“现在”，同样的逻辑也适用。你再次面临即时成本，而再次拖延的诱惑同样强烈。这就是偏好逆转的实际体现：你过去的自我制定的计划被你现在的自我推翻了。

现实世界往往更加复杂，交织着多种行为偏差。例如，一个考虑避孕的青少年，不仅受到当下偏见的影响——每日服药的即时麻烦或植入长效可逆避孕方法（LARC）的显著前期负效用——还受到对风险的扭曲感知的影响。我们倾向于高估小概率事件。这可能使得 LARC 并发症的微小风险感觉比实际更显著，而来自效果较差方法的更大、重复的怀孕风险则更难被体会。一种基于行为科学的、成熟的咨询方法会同时处理这两个问题：使用小额的即时激励来抵消最有效方法的前期成本，同时以更直观的方式（例如，用“100名女性中有1人”代替“0.01的概率”）来框定风险，以纠正认知扭曲。

集体斗争：组织与社会

想到那个让我们按下贪睡按钮的心理机制，同样也能影响公司和国家的命运，这不禁令人感到谦卑。当下偏见不仅仅是个人的心理缺陷；它是任何决策系统的特征，只要该系统对即时成本和收益的权重高于未来。

考虑一个在“按绩效付费”体系下运营的医疗诊所，它明年获得的奖金取决于今年提供的医疗服务质量。为了提高质量，诊所必须现在投入金钱和精力。这是一个组织层面的典型当下偏见困境。成本是即时且确定的；回报是延迟且不确定的。就像个人一样，该组织也会有投资不足的倾向。一位开明的监管者，理解这一点后，可以重新设计激励合同。通过将预期奖金的一部分作为“前置”奖励预先支付，并在之后收回，监管者将部分未来收益转移到了现在，从而精确地抵消了诊所的偏见，并鼓励其在质量上进行最优投资。

这种动态在政治舞台上更为明显。市长或州长通常在4年的选举周期内运作。他们面临一个选择：是投资于一个预防性公共卫生项目（如新的水卫生基础设施），该项目有巨大的长期回报但前期成本高且短期能见度低；还是投资于一个华而不实的短期项目（如一个新的城镇广场），该项目有即时、可见的益处，并且会受到当下选民的欢迎。一个以连任为动机的政治家会感到一股巨大的力量将他拉向短期项目。预防性项目的遥远益处被如此严重地贴现——既因为他们自己的认知偏见，也因为选举周期的现实——以至于与即时的政治胜利相比，它们可能显得一文不值。解决方案，同样是承诺。这表现为制度性规则：法定的多年期预算、监督长期项目的独立委员会，或受到法律保护、不会因短期优先事项而被挪用的“圈定”资金。

但为什么会发生这种情况？这种行为的数学核心是什么？区别在于贴现函数的形式。一个“有耐心的”、时间一致的决策者使用指数贴现，无论你展望多远的未来，未来回报的价值都会在固定的时间间隔内减半。贴现率是恒定的。但一个有当下偏见的代理人使用双曲贴现，其价值在开始时急剧下降，然后下降得更慢。瞬时贴现率不是恒定的；它对于近期延迟最高，而对于远期延迟则较低。

这种“递减的不耐烦”正是产生偏好逆转的原因。在100天后与101天后获得奖励之间的选择，感觉与今天与明天获得奖励之间的选择非常不同。在第一种情况下，两者都在“遥远”的未来，那里的贴现率很低，所以你会耐心地等待更大的奖励。在第二种情况下，“今天”的选项绕过了贴现曲线陡峭的初始部分，使其具有不成比例的吸引力。这种数学形式上简单而优雅的差异，正是我们在有冲动控制问题（如赌博障碍）的个体以及我们自己身上看到的无休止的复杂且常常是自我挫败行为的根源。

最长远的视角：世代与人工心智

这条微妙数学曲线的含义延伸到了最宏大的时间和智能尺度。思考一下气候变化这一至关重要的挑战。这是一个在代际舞台上演的终极当下偏见问题。有意义的气候行动的成本——改造我们的能源系统、改变我们的经济——必须由我们这一代人来支付。然而，不作为的最灾难性后果将由几十年或几百年后的子孙后代来承担。

在这里，贴现的数学揭示了一个惊人的悖论。如果我们匹配指数模型和双曲模型，使它们对一年的延迟有相同的贴现因子，那么双曲模型实际上比指数模型更看重非常遥远的未来。它的贴现率会趋于平缓，而指数贴现率则会持续无情地复合。从这个角度看，一个双曲贴现者似乎更关心他们的曾曾孙辈。然而，同一个代理人却是动态不一致的。他们可能会制定一个大胆的、长期的拯救地球计划，但当明年到来时，他们的“当下自我”会倾向于为了短期利益而放弃它。这就是为什么全球气候政策如此困难的原因：它需要可信的、有约束力的承诺机制——国际条约、不可逆转的绿色基础设施投资——来锁定我们自己有远见的意图，以对抗未来可预见的诱惑。

也许，这个概念的最后一个、最引人深思的前沿领域是在人工智能领域。我们常常认为“非理性”是人类独有的缺陷。但事实并非如此。人工智能代理的行为纯粹是其编程的函数。如果我们设计一个使用指数贴现函数来最大化奖励的人工智能，它将表现出完美的时间一致性，耐心地执行长期计划。但是，如果我们出于任何原因，用双曲贴现函数来编程它，那么这个人工智能将表现出所有典型的当下偏见症状。它会拖延。它会选择较小但较早的奖励，而非较大但较晚的奖励，从而颠覆其自身的长期目标。它可能会陷入类似于成瘾的行为循环中。这告诉我们，当下偏见并非我们生物“湿件”中的一个“缺陷”。它是某种评估时间方式的一个基本的、数学上的属性。

从决定不去赴约看医生，到努力拯救一个星球，甚至到一个人工心智的逻辑，我们都看到了一个统一原则的回响：那强大、发自内心且扭曲的“当下”的诱惑。理解这个原则不仅仅是解释我们的怪癖。它赋予我们力量。它为设计更好的习惯、更好的疗法、更好的制度，以及或许有一天，更好的心智提供了一份蓝图。这是在我们今天的自己和我们想成为的明天的自己之间达成和解的、至关重要的第一步。