预测编码模型

玻尔百科

核心要点

大脑并非被动的信息接收器，而是一个主动的预测引擎，它不断地生成世界模型，并利用感觉输入来修正误差。
这种最小化预测误差的过程是贝叶斯推断的一种生物学实现，使大脑能够以最优方式更新其信念。
“精度加权”机制调节着感觉证据与先验信念之间的影响，该系统中的失衡与心理健康状况有关。
预测编码为解释知觉、内部身体感觉（内感受）、精神病理学乃至社会认知提供了一个统一的框架。

引言

人脑常被比作一台相机，被动地记录着我们周围的世界。但如果这个比喻从根本上就是错的呢？预测编码模型提出了一个革命性的替代方案：大脑不是记录器，而是一个动态的预测引擎，一个从内到外主动生成我们现实的器官。这一理论解决了我们理解上的一个关键空白：我们是如何从感官提供的嘈杂、模糊的数据中感知到一个稳定、连贯的世界的。本文将全面概述这一强大的框架。

首先，我们将深入探讨预测编码的核心原则与机制，探索定义了知觉的自上而下的预测与自下而上的误差信号之间持续的“对话”。我们将揭示这一优雅过程如何实现贝叶斯推断，以及“精度加权”如何让大脑在先验信念与新证据之间取得平衡。随后，在应用与跨学科联系一节中，我们将揭示该模型的巨大解释力，说明一个单一原则如何能阐明从视觉知觉、我们的自我感觉到精神疾病的根源和社会理解的机制等一切事物。

原则与机制

想象一下你正伸手去接一个球。你不会简单地等待球击中你的手。相反，你会观察它的弧线，你的大脑会对其轨迹进行一次迅速、无意识的模拟，以便在正确的时间将手放在正确的位置。你的心智不是一台被动的相机，仅仅记录世界呈现的一切。它是一个动态的、前瞻性的预测引擎。这正是预测编码模型所带来的革命性视角转变。大脑的业务不仅仅是处理世界；它的业务是主动地生成世界。

跨越皮层的对话

那么，大脑是如何完成这一非凡壮举的呢？其核心思想出人意料地优雅，最好被理解为大脑皮层不同层次之间持续不断的对话。让我们想象一个简化的层级结构，其中有一个负责抽象概念的“较高级”层次，以及一个更接近原始感觉数据的“较低级”层次。

这场对话朝两个方向展开：

自上而下的预测： 较高级区域持有一个关于世界的抽象信念（例如，“我正在看一张脸”），它向较低级区域发送一个预测。这个预测不仅仅是一个模糊的想法；它是一个具体的、生成性的信号：“根据我的脸部模型，我预计会接收到对应于两只眼睛、中间一个鼻子和下方一张嘴的感觉信号。”这些自上而下的信号是大脑自身的虚拟现实，是其对即将到来的感觉流的最佳猜测。
自下而上的预测误差： 较低级区域接收到这个预测，并时时刻刻地将其与从眼睛传入的实际感觉数据进行比较。然后它计算出差异：即预测误差。这个误差是“意外”——信号中较高级模型未能正确预测的部分。也许鼻子比预期的稍大，或者嘴巴弯成了一个愁容而非中性的线条。

至关重要的是，只有这个误差信号被传回皮层层级的上层。大脑不是传输整个数据丰富的感觉输入，而是利用自己的预测来减去冗余的、预料之中的部分。向前传播的只有新的、信息丰富的、令人意外的内容。这是一种极其高效的策略。大脑不会浪费资源告诉自己它已经知道的事情。

目标：在嘈杂世界中拥有一颗宁静的心智

这场永恒对话的最终目标是最小化预测误差。一个拥有良好世界生成模型——即对感觉事件如何产生的准确内部模拟——的大脑是一个“安静”的大脑。当你的预测与现实相符时，误差信号就会被平息，世界也就顺理成章了。

这种“解释掉”预测误差的过程被认为是意识知觉的基础。当你的皮层层级的不同层次达到一种一致状态，即自上而下的预测成功地抵消了自下而上的感觉流时，一个稳定、连贯的知觉便产生了。识别的瞬间——在阴影中看到猫——就是你的大脑找到了一个假设（一个“猫”的生成模型），这个假设成功地平息了感觉预测误差的风暴。世界变得清晰，不是因为大脑接收到了一个信号，而是因为它成功地预测了它。

贝叶斯推断之美

至此，我们触及了整个神经科学中最美的思想之一。这个简单的、局部的、向下发送预测和向上发送误差的过程，是一种在生物学上极为巧妙的方式，用以实现统计学的一个基石：贝叶斯法则。

贝叶斯大脑假说认为，大脑的计算目标是找出其感觉的最可能原因。它通过将其关于世界的先验信念与接收到的新感觉证据相结合来做到这一点。这个著名的法则可以直观地表述为：

更新后的信念（后验）= 先验信念 $\times$ 感觉证据（似然）

预测编码为神经元如何实际执行这种计算提供了一个貌似可信的算法：

先验信念是自上而下的预测，代表大脑现有的模型。
感觉证据是自下而上的数据流。
预测误差是两者之间的关键不匹配，它驱动着更新过程。

大脑不断调整其内部模型，以找到一个能够最好地调和其先验与证据的后验信念，从而最小化预测误差。令人惊叹的数学洞见在于，最小误差状态——即预测编码动力学自然寻求的平衡点——恰恰是贝叶斯法则所规定的最优后验信念。大脑不需要一个中央计算器来解贝叶斯方程；解决方案从其神经元集体的、纠错的对话中涌现出来。

信念的音量旋钮：精度加权

当然，并非所有信息都是平等的。你在安静图书馆里听到的耳语比在喧闹体育场里的耳语更可靠。大脑需要一种处理不确定性的方法，它通过一种称为精度加权的机制来实现这一点。

精度是大脑对信号可靠性或置信度的估计；在数学上，它是方差（噪声）的倒数。一个清晰、锐利的信号具有高精度；一个嘈杂、模糊的信号具有低精度。精度就像预测误差的“音量旋钮”，调节它们对你信念的影响：

如果一个预测误差具有高精度（感觉数据清晰可靠），大脑会调高其音量。这个强大的误差信号会迫使较高级模型更新其信念。如果你期望钥匙在桌子上，但一次清晰的观察表明它们不在那里，高精度的视觉误差信号会迅速更新你关于钥匙位置的信念。
如果一个预测误差具有低精度（数据嘈杂或模糊），大脑会调低其音量。你更依赖于你的先验信念。如果你在雾中瞥见一个形状，低精度的视觉误差不足以推翻你认为它可能只是一棵树的先验信念。

这种在先验和证据之间，由精度介导的平衡行为，是知觉的基础。它也为心理健康提供了深刻的见解。例如，在焦虑症中，大脑可能会错误地计算精度，将内部身体感觉或潜在威胁线索的音量旋钮调得过高。一次无害的心悸被当作“危险”的高精度信号来处理，产生了一个强大的预测误差，压倒了自己是安全的先验信念。相反，在抑郁症中，一个强烈的、悲观的先验（“任何事都不会有好结果”）本身可能被赋予了病态的高精度，导致大脑将任何模糊或轻微积极的感觉证据当作“噪声”而忽略。

大脑自身的预测微回路

这个理论框架不仅仅是一个抽象模型；它与已知的大脑皮层解剖结构有着惊人具体且貌似可信的对应关系。经典的预测编码微回路提出，不同皮层层中的特定细胞类型执行着所需的计算。

深层（例如，第5/6层）： 这些层充满了大型锥体神经元，它们充当预测单元。它们在更长的时间尺度上整合信息，体现了大脑的生成模型或“信念”。它们的长轴突向下投射到较低的皮层区域（或在一个区域内横向投射），携带自上而下的预测。这些反馈连接的节律通常与β波段脑电波相关。
浅层（例如，第2/3层）： 这些层包含较小的锥体神经元，它们充当误差单元。一个单一的误差神经元可能在其较低的（基底）树突上接收自下而上的感觉数据，并在其较高的（顶端）树突上接收自上而下的预测。预测起抑制作用，抵消来自感觉输入的兴奋。神经元由此产生的放电率与差异——即预测误差——成正比。这些神经元随后将此误差信号向前、向上传递到层级上层，其节律通常与γ波段脑电波相关。

精度的“音量旋钮”被认为是由多种因素共同实现的，包括乙酰胆碱和去甲肾上腺素等神经调节剂，以及一类特定的局部抑制性中间神经元（表达Parvalbumin的细胞），它们可以精细调节报告误差的锥体细胞的增益。

推动边界：科学如何检验理论

预测编码是一个强大而优雅的理论，但它不仅仅是一个故事。它做出了具体的、可检验的、可证伪的预测，神经科学家们正在积极研究这些预测。例如，科学家可以设计实验，在实验中，情境改变了受试者的期望（先验），而所显示的物理刺激保持不变。预测编码模型预测，即使对于完全相同的刺激，当刺激是预期之中时，代表预测误差的神经活动也会更低。

更巧妙的是，可以设计实验来试图推翻这个理论。一个关键的预测是误差信号应该是特征特异性的。如果大脑对颜色和运动有独立的模型，那么关于颜色的预测不应影响与运动相关的预测误差。一个聪明的实验可以创造一种情境，受试者期望某种颜色，而物体的运动是不可预测的。如果做出正确的颜色预测也减少了大脑运动处理部分的预测误差信号，这将挑战该理论最简单的形式，并迫使我们完善我们的理解。这就是科学的最佳状态：构建一个美丽的想法，然后尽最大努力去证明它错误，所有这一切都是为了更接近真理。

应用与跨学科联系

在科学中，一个单一、优雅的思想能够突然照亮一个广阔且看似毫无关联的现象领域，这是一件引人注目的事情。大脑不是一个被动吸收感觉信息的海绵，而是一个主动、不知疲倦的预测者——这个观念就是这样的思想之一。一旦你掌握了这个原则——即大脑从根本上是一个生成性器官，不断创造其对世界的最佳猜测，并仅仅利用感官来更新这个猜测——你就会开始在各处看到它的杰作。预测编码模型的应用范围从我们如何看到一个苹果的平凡机制，延伸到意识、精神疾病以及我们与他人心智连接能力的深奥奥秘。

让我们踏上一段旅程，从简单的看这一行为开始，去发现这一个原则是如何贯穿我们经验的整个结构。

预测之眼：作为推断的视觉

你如何在一个光线昏暗的房间里认出一个朋友，或者读出一个部分被涂抹的单词？如果大脑是一个简单的前馈式相机，将像素从眼睛向上传送到一个“识别中心”，这将是一个令人困惑的问题。一个嘈杂或不完整的信号应该导致一个嘈杂或不完整的知觉。但实际情况并非如此。我们感知到一个完整的朋友，一个完整的单词。为什么？因为大脑期望看到他们。

预测编码框架表明，知觉是一场对话，而不是独白。视觉皮层的较高级别，编码了诸如“朋友的脸”或“苹果”等抽象概念，它们不会被动地等待信息。相反，它们向下层的视觉区域发送预测——一种“草图”。这种自上而下的预测本质上是说：“鉴于当前情境，我期望看到类似这样的东西。”然后，下层区域将这个预测与实际投射到视网膜上的光线进行比较。关键部分在于：向层级上方传递的不是原始的感觉数据，而只是未被预测的部分——预测误差。大脑是一台高效的机器；它只费心报告新闻，报告意外。

这个过程，一个持续的预测和误差校正循环，带来了一个显著的结果。通过“解释掉”感觉流中可预测的部分，大脑有效地消除了噪声并填补了空白。你大脑中关于朋友脸庞的高级模型提供了一个强大的先验信念，它锐化了模糊的感觉证据，从而产生一个稳定、清晰的知觉。这就是为什么世界显得如此稳定和连贯，尽管从我们感官流入的原始数据是一团混乱、嘈杂的杂波。这种预测性对话不仅仅是高级皮层的事情；它始于处理的最早阶段。丘脑，通常被认为是感觉信号通往皮层途中的一个简单中继站，现在被理解为一个关键枢纽，来自皮层的预测在这里与从眼睛流入的现实相遇，计算出一些最初和最基本的预测误差。

内心世界：感知我们自己的身体

这种预测过程不仅限于外部世界。大脑还必须理解来自我们身体内部的持续信号流——这个过程称为内感受。我们对疼痛、呼吸困难、饥饿和心率的感觉，并非我们生理机能的直接读数。它们和视觉一样，是构建出来的知觉，受制于同样的预测与误差逻辑。

思考一下慢性疼痛这个悲剧性的难题，患者即使在没有持续组织损伤的情况下也承受着巨大的痛苦。在诸如纤维肌痛症等疾病中，预测编码模型提供了一个深刻的洞见。大脑可以发展出一种强大的、高精度的疼痛先验。这种期望变得如此根深蒂固，以至于它开始像一个自我实现的预言一样运作。大脑“我正处于疼痛中”的预测是如此强烈，以至于它压倒了来自身体的、实际的、良性的感觉信号。神经的微弱、正常的喋喋不休，通过这个强大先验的透镜被错误解读，最终的后验信念——即有意识的体验——便是疼痛。这种疼痛并非“想象出来的”；它是一种真实的知觉，由一个陷入适应不良预测循环的大脑所生成。

在焦虑症中也上演着类似的故事。一个患有焦虑症的人可能会经历可怕的呼吸困难（即dyspnea）发作，即使他们的肺部完全健康，血氧也正常。在这里，一个与威胁或危险相关的先验信念导致大脑错误地解释了呼吸中正常、微妙的波动。脑岛皮层，一个内感受的关键脑区，可能会给这些内部信号分配异常高的精度，实际上是在大喊：“这很重要！出问题了！”由此产生的、被放大的预测误差就是那种令人窒息的呼吸困难感，一种由良性感觉和恐惧预测共同构建的痛苦知觉。

当预测出错时：精神病理学的根源

如果日常知觉是自上而下的预测与自下而上的感觉数据之间的一种精妙平衡，那么很容易看出，打破这种平衡可能会导致体验的深刻改变。精神疾病的许多症状可以被重新定义，不是“大脑坏了”，而是大脑在以不同的方式进行预测。

例如，在自闭症谱系障碍（ASD）中，最常见的特征之一是感觉超敏，即普通的景象和声音会让人感到难以承受。预测编码的解释表明，这可能源于一种失衡，即大脑低估了其先验，并对感觉预测误差赋予了异常高的精度。世界以一种原始、未经过滤的强度被体验，因为每一个与预期的小偏差——每一束光的闪烁，每一片叶子的沙沙声——都被当作高度显著的事件来处理。在这种观点下，大脑并非失灵；它是在病态地忠实于世界的感觉真相，无法将微小的细节作为不相关的噪声而忽略。

另一个极端是幻觉，尤其是在精神分裂症等疾病中体验到的幻觉。在这里，知觉被自上而下的预测病态地主导了。在一个安静的环境中，一个拥有异常强大且精确的先验信念——例如期望听到一个声音——的大脑可以从上到下完全生成这种知觉体验。这个先验是如此强大，以至于它“解释掉”了声音的缺失，而有意识的知觉是听到了一个并不存在的声音。

同样的原则也解释了熟悉而又神秘的安慰剂和反安慰剂效应。如果我们有一个强大、精确的期望（一个先验），认为一颗糖丸能真正缓解疼痛，它就真的能做到。这种期望不仅仅是让我们“认为”疼痛减轻了；它实际上改变了我们的知觉推断，导致大脑降低对传入的伤害性感受信号的权重。这种自上而下的信念甚至可以调动大脑自身的下行疼痛控制通路，释放内源性阿片类物质，使期望成为生理现实。安慰剂效应不是医学的失败，而是我们先验在塑造现实方面的惊人证明。该框架不仅提供了一个定性的故事，而且提供了一个完全定量的故事，让科学家能够模拟不同个体可能如何反应，并正式检验群体在感觉精度等参数上的差异。

社会预测器：解读心智与语言

也许预测编码最令人惊叹的应用在于高级认知和社会理解领域。事实证明，大脑的预测机制是我们如何理解彼此以及我们所共有的意义世界的关键。

当你读一个句子时，你的大脑并不是被动地逐词处理。它处于一种狂热的预测状态，不断猜测下一个词和即将到来的语法结构。像左侧额下回（Broca区的一部分）这样的脑区似乎对于生成这些句法预测至关重要。当你遇到一个语法错误时，你的大脑不只是感到困惑；它会产生一个巨大的预测误差信号。神经科学家实际上可以看到这一点！一个句法违规会导致β波段脑电波急剧下降，而β波被认为反映了当前预测模型的维持。这种β抑制是大脑在说：“等等，我的模型错了。是时候更新了！”的方式。

这种预测性架构的最高成就可能在于其在社会认知中的作用。仅仅通过观察我伸手去拿一杯水，你如何知道我是打算喝掉它还是把它移开？可观察到的运动学几乎完全相同。区别在于隐藏的原因——我的意图。预测编码框架提供了一个优美的解决方案，重新诠释了著名的“镜像神经元系统”。当你观察我的行为时，你的大脑不只是被动地镜像它。它使用自己的运动系统作为生成模型来主动推断我的意图。你的大脑运行模拟：“如果我的目标是喝水，我自己的运动指令会是什么，感觉后果会是什么样的？”它将这个预测与它实际看到的运动学进行比较。它对移动这个目标也做同样的事情。那个预测后果与传入视觉数据最匹配的意图，就是你的大脑所推断出的意图。我们通过使用我们自己对世界的预测模型来理解他人，来推断导致他们行为的隐藏心理状态。

从看到一个苹果，到感受我们自己的心跳，到理解一个句子，再到揣测他人的意图——其原理都是相同的。大脑是一位讲故事的大师，不断地书写着我们现实的故事。我们体验到的世界并非世界本来的样子，而是大脑关于世界是什么的最佳假说。而感官那持续、安静的低语，仅仅是为了让这个故事保持真实。