
模型是理解世界的强大工具,但在用其预测未来和用其改变未来之间存在着关键的区别。虽然一个模型可能完美预测稳定系统中的模式,但在用于评估一项新政策时,它可能会变得极其误导。预测与政策干预之间的这种差距,正是现代经济学和社会科学中最重要思想之一——卢卡斯批判所要解决的核心问题。它警示我们,当我们改变“游戏规则”时,聪明的人们不会一成不变地继续玩下去,这会导致我们模型所依赖的统计关系本身崩溃。本文将剖析这一深刻概念,首先探讨其基本原理和机制,然后展示其在不同领域的广泛应用和跨学科联系。通过探寻其逻辑,我们将理解为什么改变世界需要一种比仅仅描述世界更深层次的建模方式。
想象一下,你是一位杰出的国际象棋历史学家。你分析了过去一个世纪里每一位特级大师的每一局有记录的对弈。你建立了一个宏大的统计模型,在给定一局棋的前十步后,能以惊人的准确性预测接下来的五步。你的模型捕捉了高水平国际象棋一直以来的深层模式、节奏和起伏。现在,有人提出一个对游戏规则的彻底改变:如果兵也可以向后移动呢?他们问你这位专家,预测在新规则下棋局将如何展开。
你的模型能说什么?什么也说不了。历史数据现在变得毫无用处。游戏的基本逻辑已被改变。棋手的每一个策略、每一个开局、每一次计算都发生了根本性的变化。要预测新的棋局,你需要的不是历史学家,而是一位理解棋手思维的理论家——他们如何思考,如何适应,以及他们将如何在一套新的约束条件下寻求胜利。
这个简单的寓言包含了现代科学中最深刻和实用的思想之一的精髓:卢卡斯批判。对于任何希望使用模型不仅来预测世界现状,更为了解如何将其变得更好的人来说,它是一个警告、一项原则和一份指南。
科学似乎常在玩两种不同的游戏。第一种是预测游戏。这是天文学家预测日食或气象学家预报明日天气的游戏。它涉及在数据中寻找稳定的模式和相关性,以便从过去推断未来。例如,像ARIMA这样的时间序列模型是这个游戏的大师;它可以查看股票回报的历史记录,并对下一分钟的走势做出有根据的猜测,而且通常相当成功。这个游戏好比是顺势而为。
第二种游戏是政策游戏,或称因果推断。这是工程师设计桥梁、医生开具处方、或政府实施经济政策的游戏。这里的目标不是预测将要发生什么,而是要促成某事发生。这个游戏不是顺势而为,而是要筑坝拦水。要取得成功,你需要理解起作用的基本力量——河流的物理学,而不仅仅是其涟漪的统计模式。像回归断点设计这样的方法,它在一个明确的阈值处分离出特定干预的效果,就是为这第二种游戏而生的工具。
卢卡斯批判是一个至关重要的警告:你不能用第一种游戏的工具来玩第二种游戏。一个为预测而建立的模型,无论多么准确,在用于评估政策时都可能具有危险的误导性。原因在于我们试图改变的系统具有独特性质:它们充满了智能的、具有前瞻性的代理人。
行星不关心我们对其轨道的预测。台球不会因为我们通过了动量守恒定律就改变其轨迹。但人会。公司、消费者、投资者——他们都会对环境做出反应。更重要的是,他们会对未来环境的预期做出反应。
这就是批判的核心所在。我们在经济和社会数据中观察到的统计关系,并不像物理学的基本定律。相反,它们是数以百万计的个体解决自身优化问题的综合结果。人们有目标(追求幸福、盈利、保持健康),他们根据当前的“游戏规则”设计策略来实现这些目标。
正如我们的一个问题所优美地形式化的那样,我们可以将每个人的决策过程看作一个“算法”。这个算法接收关于世界的信息,并输出一个决策。当政府或监管机构实施一项新政策时——无论是税收、补贴还是新法规——他们不仅仅是在推动一个被动的系统。他们在改变游戏规则本身。当规则改变时,理性的参与者会怎么做?他们会改变自己的策略。他们会更新自己的内部算法。
结果是,你煞费苦心基于历史数据建立的、捕捉了旧策略结果的统计模型,变得过时了。你模型中那些你以为是稳定常数的参数,实际上只是特定政策体制的反映。当体制改变时,参数也随之改变,你的模型预测就变得一文不值。
让我们通过一个引人注目(尽管是假设的)且基于常见建模场景的例子来具体说明这一点。想象一个公共卫生机构想要评估一项保护性健康措施,比如采用一种特殊饮食。他们收集数据后注意到一个惊人的相关性:采用该饮食的人群中,某种健康问题的发病率更高。一个简单的回归模型——预测游戏的经典工具——会得出结论,认为这种饮食有害。它会建议制定政策不鼓励使用这种饮食。
但这个结论大错特错。该模型掉入了一个称为混淆的陷阱。假设人群由两组构成:高风险个体和低风险个体。高风险个体理所当然地担心自己的健康,因此更倾向于寻求并采纳这种保护性饮食。而低风险个体觉得安全,则不屑一顾。
这个简单的回归模型没有进行同类比较。它比较的是一群采纳了该饮食的高风险人群和一群未采纳的低风险人群。饮食组健康问题发病率较高与饮食本身无关;这是因为该组本身就处于更高的风险之中!事实上,这种饮食是有益的——它降低了每个采纳者的风险——但其有益效果被两组之间巨大的既有风险差异所掩盖了。
基于这种有缺陷的“简化式”模型的政策将是一场灾难。卢卡斯批判正是警告我们这种危险。观察到的饮食与健康结果之间的相关性并非结构性的因果定律,而是旧环境下人们选择所产生的暂时性统计假象。一项新政策——比如提供补贴使人人都能负担得起这种饮食——会鼓励低风险和高风险人群都采纳它。这将彻底打破旧有的相关性,饮食的真正有益效果最终将显现出来。唯一能预见这一点的方法是使用结构性模型——一种将代理人(他们的风险类型和选择)和结果的机制(饮食的效果)作为独立的、明确的组成部分进行建模的模型。
这一原理远远超出了经济学的范畴。它适用于任何干预可能改变其底层机制的复杂系统。
考虑对河口的硝酸盐污染进行建模。一个经验模型可能会发现上游“排放指数”与河口硝酸盐浓度之间存在简单的关系。对于一个稳定系统来说,这可能是一个很好的预测模型。但现在,考虑一项为改善航运而疏浚河道的政策。这改变了河口的水动力学特性——其流速和扩散属性。基于物理学的机理模型,建立在质量守恒定律之上,并包含流体流动方程,可以处理这种情况。你只需输入新的流速和扩散值,它就能计算出新的结果。然而,经验回归模型对此一无所知。其参数隐含地依赖于旧的河流物理特性。随着物理特性的改变,该模型的预测便失效了。
或者思考一下新技术(如太阳能电池板)的成本。一个众所周知的现象是,当我们生产某样东西越多,我们生产它的技术就越好,成本也越低——这个过程被称为“边做边学”。政府可能会考虑通过补贴来鼓励太阳能电池板的普及。一个真正的内生模型会捕捉到这个反馈循环:补贴增加了部署量,增加的部署量降低了未来成本,而更低的未来成本又鼓励了更多的部署。而一个外生模型,仅仅根据外部预测假设未来成本遵循预定路径,则会忽略这一关键反馈。它切断了政策(补贴)与系统结构演变(技术成本)之间的联系。结果,它会系统性地低估补贴的长期力量,并可能导致胆怯、无效的政策。
如果简单的统计关系是流沙,那么我们可以在什么基石上建立可靠的政策模型呢?答案在于寻找不变性。结构性建模的目标是建立模型,其组成部分代表现实中真正稳定、政策不变的方面。
结构性模型不仅仅是将曲线拟合到数据点上,它试图代表系统底层的因果机制。在经济学中,这意味着对行为的“基元”进行建模:人们的偏好、他们的约束以及他们使用的技术。人们希望这些“深层”参数——你对风险的基本厌恶程度、发电厂的物理效率——比在总体数据中观察到的表面相关性更稳定,在政策调整时更不容易改变。
这就是为什么结构性建模要困难得多的原因。它需要的不仅是统计上的高超技巧,还需要对系统有深刻的理论理解。它要求我们明确地写下我们关于世界如何运作的假设。但它的回报是一个原则上能够回答“如果……会怎样”问题的模型。它允许我们在模型内部改变游戏规则,并观察理性的、具有前瞻性的代理人如何调整他们的策略。这是在政策试行前对其进行评估的唯一连贯方式。
因此,卢卡斯批判并非绝望的忠告。它不是说我们永远无法预测我们行动的后果。它是对思想诚实和科学严谨的呼吁。它告诉我们,如果我们想要改变世界,我们必须首先努力在更深层次上理解它。我们不能满足于仅仅描述世界的模型;我们必须要求能够解释世界的模型。因为在人类与其环境之间复杂的舞蹈中,规则永远是游戏的一部分。
我们已经看到了卢卡斯批判的核心原理:当游戏规则改变时,玩家不会一成不变地继续游戏。这似乎简单,近乎显而易见,但忘记这一点却已成为科学和政策中巨大错误的根源。它是我们模型中“机器里的幽灵”,是我们常常视为静态和机械的系统中适应性的火花。要真正领会其力量和普遍性,我们必须超越其经济学的起源,去看看这个单一而优雅的思想如何在工程学、医学乃至人脑研究的殿堂中回响。它是一条统一的线索,教导我们以一种更深刻、更谦卑的方式看待世界。
卢卡斯批判的天然归宿是经济学,它诞生于1970年代大规模模型在预测通货膨胀和失业同时上升(“滞胀”)方面的惊人失败。政策制定者们在拉动那些似乎一直有效的杠杆,却发现机器的连接方式已经不同。为什么?因为人们对通胀的预期改变了,他们的行为也随之改变。模型的“定律”仅仅是从前一个时代观察到的习惯。
我们可以在一个简单的虚拟股票市场中清晰地看到这一点。想象一位政策制定者想要引入资本利得税。他们查看历史数据,并建立一个将股票价格与其预期未来回报联系起来的模型。“很简单,”他们想。“税收会降低预期回报,我的模型能准确告诉我价格会下跌多少。”政策得以实施。但价格下跌幅度远小于预期。发生了什么?政策制定者忘记了交易员不是被动的齿轮。他们是面对新现实的智能代理人。他们重新进行优化。他们因应税收改变了整个需求策略,因为税收本身已成为他们个人盈亏方程中的一个新变量。价格与预期回报之间的旧关系——政策制定者模型的基础——在政策宣布的那一刻就失效了。代理人的适应行为部分抵消了政策的预期效果,而简单的模型对此完全视而不见。
这个批判不仅仅关乎预测的失败,更关乎设计的失败。在应对气候变化这一巨大挑战中,这一点尤为清晰。我们最有希望的工具之一是“边做边学”——我们建造的太阳能电池板或风力涡轮机越多,我们建造它们的技术就越精湛,成本也越低。
现在,想象你是一名能源系统建模师,为政府的气候政策提供建议。你建立一个庞大的计算机模型来决定绿色能源补贴的最佳水平。如果你的模型假设太阳能电池板的成本将遵循一个预定路径——比如,无论政府做什么,每年下降5%——你就犯了一个典型的卢卡斯批判错误。你将技术进步的速度视为一个外部的、不可改变的事实,而实际上,它正是你正在考虑的政策的直接后果。一项大胆的、加速部署的补贴,反过来会加速成本的降低,从而形成一个强大的良性循环。一个对这种反馈循环视而不见——将技术成本的“规则”视为固定不变——的模型,将会系统性地过于保守。它将无法捕捉到雄心勃勃行动的真正潜力,并可能将我们锁定在一个次优的未来中。在这里,卢卡斯批判不仅仅是一个学术脚注;它是一个警告,警示我们自己的模型可能成为想象和创造一个更美好世界的障碍。
世界很少是政策制定者与同质化的“公众”之间的简单双人博弈。更多时候,它是一个复杂的多代理人生态系统,其中每个人都在适应其他所有人。思考一下现代医疗保健系统的复杂网络,医院、紧急医疗服务(EMS)、保险支付方和政府监管机构都在相互作用。
医院可能会使用人工智能来优化病患分流。紧急医疗服务(EMS)的调度员使用人工智能来优先安排救护车路线。保险公司调整其承保门槛以管理成本。现在,一个监管机构想要引入一项新政策——也许是对医院获得性感染的新罚款,或是救护车调度公平性的新标准。
一种简单的方法是为医院、EMS和支付方建模,将监管机构的政策视为一个固定的外部约束。我们甚至可以找到一个“均衡点”,在这个子系统中,没有一个代理人想要改变其策略。但这只是稳定性的幻觉。我们忘记了监管机构也是游戏中的一个参与者,它有自己的目标,比如最大化公共健康。如果其他代理人达到的均衡导致了,比如说,等待时间飙升或医疗服务获取不公,监管机构就会再次改变规则。
原始模型对于预测系统的真实长期行为毫无用处,因为它包含一个致命缺陷:它假设裁判没有在观看比赛。这是提升到博弈论层面的卢卡斯批判。政策本身是“内生的”——它是系统反馈循环的一部分。任何在参与者行为可能导致规则被重写时仍将规则视为固定的模型,不仅是错误的,它所描述的系统根本不可能存在。
这种适应性原则远远超出了人类社会系统的范围。它迫使我们在所有科学领域寻求因果理解的过程中变得更加谦逊。例如,在神经科学中,研究人员使用像动态因果建模(Dynamic Causal Modeling)这样的强大技术,根据功能性磁共振成像(fMRI)数据来绘制大脑区域之间的“有效连接”。当一个人在扫描仪中休息时,这些模型可以创建一个精美的“线路图”,完美地描述信息流。
但是当我们进行干预时会发生什么?如果我们给这个人看一张可怕的图片,或者给他用药,会发生什么?我们能安全地假设我们的“线路图”会预测大脑的反应吗?卢卡斯批判敦促我们要谨慎。大脑是终极的适应性系统。一个能很好地拟合观测数据的模型,并不能保证它在“政策干预”下仍然有效。大脑自身的信息处理内部规则可能会因应新的刺激而改变,从而使旧模型过时。
同样的逻辑适用于任何复杂的适应性系统,从微生物生态系统到社交网络。科学家们经常使用像格兰杰因果关系(Granger Causality)或传递熵(Transfer Entropy)这样的统计量度,在时间序列数据中寻找“因果联系”。这些强大的工具可以告诉我们一个变量的过去值是否有助于预测另一个变量的未来值。它们衡量的是预测性影响。但预测性影响不一定等同于干预性控制。发现蟋蟀的鸣叫可以预测温度,并不意味着我们可以通过强迫蟋蟀鸣叫来使天气变暖。在一个所有部分都在相互适应、共同演化的网络中,今天观察到的一个预测性联系可能只是当前状态的暂时性假象,一个在对系统进行干预时可能会消失甚至逆转的路径。将这些统计上的幽灵误认为是不变的因果杠杆,就是再次掉入卢卡斯批判的陷阱。
卢卡斯批判并非绝望的陈述。它并不意味着建模是徒劳的。相反,它呼吁一种更深刻、更复杂的方 法。它告诉我们,要预测一项变化的效果,我们不能仅仅对我们碰巧观察到的表层行为进行建模。我们必须尝试对更深层次的结构进行建模:即生成这些行为的目标、约束和优化规则。
它教导我们,一个模型的有效性不是普适的;它取决于其被估计时所处的体制。它还提醒我们,在任何有智能、适应性代理人的系统中,最有趣和最重要的动态往往是参与者与规则本身之间的反馈循环。世界不是一台简单、可预测的机器,而是一场动态且充满惊喜的游戏,这正是其魅力所在。卢卡斯批判是我们构建能够匹配这种复杂性的模型的指南——这些模型将“机器里的幽灵”作为故事的主角,而不是一个不方便的误差项来拥抱。