try ai
科普
编辑
分享
反馈
  • 贝叶斯大脑假说

贝叶斯大脑假说

SciencePedia玻尔百科
核心要点
  • 大脑通过生成预测并根据感官预测误差更新这些预测,从而主动构建其对世界的感知,而非被动地处理信息。
  • 预测编码是一种被提出的神经机制,它通过一个自上而下的预测和自下而上的误差信号的层级结构来实现贝叶斯推断。
  • 主动推断统一了知觉和行动,认为我们采取行动是为了最小化预测误差,并使大脑的世界模型成真。
  • 计算精神病学利用这一框架来理解精神分裂症和抑郁症等精神疾病,将其视为大脑预测机制中的特定故障,例如错误的精度加权。

引言

大脑是如何将来自我们感官的混乱、嘈杂的数据流,转化为稳定而有意义的现实体验的?我们通常假设大脑是一个被动的接收者,仅仅记录世界的原貌。贝叶斯大脑假说以一个革命性的观点挑战了这一直觉:大脑是一台主动的预测机器。该假说提出,我们的大脑在不断地构建一个世界模型,对传入的感官信息生成预测,然后利用任何不匹配之处——即“预测误差”——来更新其模型。本文旨在揭开这一强大的大脑功能理论的神秘面纱。

我们将首先探讨贝叶斯大脑的基础性“原理与机制”,剖析统计学中的概念,如先验信念和似然性,是如何通过预测编码和主动推断等神经过程得以实现的。随后,“应用与跨学科联系”一章将揭示该理论卓越的解释力,展示它如何为从知觉错觉、安慰剂效应到精神疾病的潜在本质以及心理治疗的机制等一切事物提供一个统一的理解。

原理与机制

想象一下,你正走过一个光线昏暗的房间。你看到地板上有一个形状。它是一卷绳子?一只睡着的猫?还是一个影子?你的大脑必须在瞬间解决这个难题。它必须处理从眼睛传入的模糊、嘈杂的数据,并产生一个连贯的感知。但它是如何做到的呢?许多神经科学家认为,答案在于现代科学中最优雅、最强大的思想之一:​​贝叶斯大脑假说​​。

该假说提出,大脑本质上是一位科学家。它并非被动地从感官接收信息,而是主动构建一个世界模型,并根据证据不断更新这个模型。这种面对新数据时更新信念的过程,是贝叶斯推断的核心,这是一种在不确定性下进行推理的形式化程序,几个世纪以来一直是统计学的基石。

大脑的科学方法:先验、似然与后验

为了理解大脑如何像科学家一样行事,让我们将其“科学方法”分解为三个核心组成部分。

理论:先验信念

每一位优秀的科学家都从一个理论开始,一个基于现有知识的假说。大脑也是如此。这个起点被称为​​先验信念​​,或简称​​先验​​。它是大脑在接收到新的感官信息之前对世界状态的期望。这个先验不是凭空猜测;它是一个由毕生经验塑造的复杂的概率分布。例如,如果你正坐在诊所的虚拟现实模拟器里,你对自己运动状态的先验信念是你很可能是静止的。毕竟,你在诊所里。大幅度的突然移动是不太可能的。你的大脑将此编码为一个以零速度为中心的强烈信念。

证据:感官似然性

接下来,科学家收集数据。对大脑而言,这些数据来自感官。但感官数据很少是完美的;它们充满噪音且常常模棱两可。大脑通过形成一个​​似然性​​来解释这一点。似然性不是数据本身,而是关于在给定世界某种状态的情况下,接收到该感官数据的概率的判断。

让我们回到虚拟现实座椅的例子。你的眼睛看到世界飞速掠过,其光流与以每秒2度的速度向右移动相符。这是你的视觉证据。然而,你内耳的前庭系统报告没有加速度。这是你的前庭证据。大脑必须发问:“如果我真的以每秒2度的速度移动,我的眼睛看到这种光流的可能性有多大?我的前庭系统感觉不到任何东西的可能性又有多大?”这些问题的答案构成了每种感官的似然性。

更新后的理论:后验信念

最后,科学家将先前的理论与新的证据结合起来,形成一个更新的结论。在大脑中,这就是​​后验信念​​——在考虑了其先验期望和新的感官数据之后,大脑对世界状态的最佳猜测。奇妙之处就在于此。大脑不只是选择一个证据而放弃另一个,而是以一种极其智能的方式,利用贝叶斯法则将它们融合在一起。

这种融合的结果不是简单的平均值,而是一个加权平均值,其中赋予每条信息——先验、视觉线索、前庭线索——的权重由其​​精度​​决定。

信念的通货:精度

什么是精度?在此背景下,精度就是方差的倒数(π=1/σ2\pi = 1/\sigma^2π=1/σ2)。你可以把它看作是确定性或可靠性的度量。一个方差小(噪音或离散度很小)的信号是高度可靠的,因此被赋予高精度。一个方差大(噪音多且不确定)的信号是不可靠的,因此精度低。

在我们的虚拟现实例子中,假设你的视觉系统相当可靠,所以其测量的方差很低(例如,σv2=1\sigma_v^2 = 1σv2​=1)。你的前庭系统,可能因为缺乏其他线索而感到困惑,可靠性较低,方差较高(σvest2=9\sigma_{vest}^2 = 9σvest2​=9)。你认为自己是静止的先验信念强度适中(σp2=4\sigma_p^2 = 4σp2​=4)。

为了形成最终的感知,大脑结合了这三个来源的“意见”:

  • 先验说:“速度是0。”(精度 = 1/4=0.251/4 = 0.251/4=0.25)
  • 视觉系统说:“速度是2。”(精度 = 1/1=1.01/1 = 1.01/1=1.0)
  • 前庭系统说:“速度是0。”(精度 = 1/9≈0.111/9 \approx 0.111/9≈0.11)

视觉系统的报告精度最高,因此它获得最大的“投票权”。先验的意见次之,而前庭系统的意见最弱。最终的后验信念将是一个介于0和2之间的速度,但由于视觉数据的高精度,它会更接近2。代表大脑最佳单一估计的后验均值,是所有可用信息的精度加权平均值,。这是一种极其优雅和高效的方式,用以解决冲突并从不完美的信息中做出最佳推断。

从‘是什么’到‘如何做’:预测编码算法

贝叶斯大脑假说是一个优美的“是什么”的理论——它描述了大脑试图实现的目标。但它没有具体说明大脑如何实际执行这些计算。这就是​​预测编码​​发挥作用的地方。预测编码是一种神经上似乎合理的算法,它实现了这种贝叶斯推断。

想象大脑皮层像公司的层级结构一样组织起来。

  • ​​自上而下的预测:​​ 高级皮层区域(“高管”)持有世界的抽象模型。它们将预测向下传递。例如,CEO可能会预测:“视觉场景中包含一张脸。”这个预测被发送给中层管理者。
  • ​​自下而上的预测误差:​​ 中层区域将这个自上而下的预测与它从下层接收到的信息进行比较。如果下层看到的线条和曲线与脸部匹配,预测就得到证实。但如果存在不匹配——比如说,特征看起来更像一个花瓶——就会产生一个​​预测误差​​。关键在于,只有这个误差信号,即“意外”,才会被传回上层。这是极其高效的;如果世界如预测般运行,就不需要传输新信息。
  • ​​信念更新:​​ “高管”们接收到这个误差信号,并用它来更新他们的模型。也许他们将假说从“脸”改为“花瓶”。这个过程不断重复,预测向下流动,误差向上流动,直到预测误差被尽可能地最小化。

在这个机制中,知觉是寻找能够最好地解释掉感官输入的假说的过程。大脑不是一个被动吸收数据的海绵,而是一个不断试图猜测其下一次感官体验的主动预测机器。这个过程的稳态,即误差被最小化的状态,对应于最佳的后验信念,。

知觉与行动的统一:主动推断

这个框架优美地从知觉领域扩展到了行动领域,这个概念被称为​​主动推断​​。如果说知觉是为了更新我们的模型以适应世界,那么行动就是为了改变世界以适应我们的模型。

想一想伸手去拿一杯咖啡的过程。根据主动推断,你的大脑首先生成一个你希望进入的感官状态的预测——即你的手抓住杯子的状态。这个预测产生了一个本体感觉(身体位置)预测误差:你预测的感官状态与你当前状态之间的差异。然后你的运动系统开始行动,但其目标不是执行一个预先编程的动作,而是​​最小化本体感觉预测误差​​。你的肌肉以恰到好处的方式收缩,使来自你手臂的真实感官反馈与预测的感官反馈相匹配。

在这种观点下,即使是我们简单的反射也是一种推断形式。反射弧是一个优美的、硬连接的机制,通过移动身体来解决预测误差。这在单一原则下统一了知觉和行动:最小化预测误差。

当机器失灵时:计算精神病学

预测编码框架的强大之处在于,它不仅解释了正常的大脑功能,还提供了一个看待精神疾病的新视角。它表明,许多精神障碍可以被理解为推断障碍——大脑预测机制的崩溃。

以精神分裂症为例。一个前沿的计算理论认为,它可能是一种​​精度加权​​错误的疾病 [@problem-id:2714861]。

  • ​​异常显著性:​​ 神经递质多巴胺被认为在传递预测误差的精度方面起着关键作用。在精神病中,过度的多巴胺活动可能像一个有故障的增益旋钮,调高了所有感官预测误差的精度。即使是随机的神经噪音也被标记为高度精确、重要的信号。大脑为了解释这些“异常显著”的误差,可能会构建出详尽而错误的信念(妄想)。
  • ​​弱先验:​​ 与此同时,谷氨酸信号传导(特别是在NMDAR受体处)的功能障碍可能会削弱大脑自上而下模型(即先验)的稳定性和精度。没有强大、稳定的先验来提供背景并解释掉微小的不一致,大脑就只能任由这些异常精确的、自下而上的误差信号摆布。

这种观点将精神疾病重新定义为大脑推断过程中一种具体的、可以用数学描述的小故障,而不再是模糊的“化学失衡”。

最深层的原理:平衡准确性与复杂性

在其核心,贝叶斯大脑一直在进行一种微妙的平衡。为了生存,它必须建立一个既​​准确​​又​​简单​​的世界模型。

  • ​​准确性​​意味着模型必须能很好地解释它接收到的感官数据。一个不符合证据的模型是无用的。
  • ​​复杂性​​指的是模型的简洁性。一个过于复杂的模型会“过拟合”数据,在实际是随机噪音中看到有意义的模式。这就是奥卡姆剃刀原理:如无必要,勿增实体。

大脑必须找到那个最佳点:一个刚好足够复杂以准确预测其感官世界,但又不过于复杂的模型。大脑被认为试图最小化的数学目标——一个称为​​变分自由能​​的量——优雅地捕捉了这种在准确性和复杂性之间的权衡。通过不断最小化这个自由能,大脑确保它总是在学习其环境的最佳可能模型,将感官信息那混乱而不确定的洪流,转化为我们体验到的稳定、可预测且有意义的世界。

应用与跨学科联系

在探索了贝叶斯大脑的原理之后,我们现在来到了探索中最激动人心的部分:见证这一美妙思想的实际运作。如果贝叶斯大脑假说仅仅是一个抽象的好奇心,那么它将鲜有价值。它真正的力量,它声称自己是神经组织基本原则的依据,在于其惊人的跨学科能力,它将知觉、行动、心理学、医学乃至哲学编织成一根连贯的线索。它向我们展示了,像魔术师的幻觉、糖丸的治愈力以及精神疾病的悲惨症状这样截然不同的现象,可能都源于同一个深层的计算逻辑:大脑坚持不懈地预测其世界的探索。

感官的交响乐:作为主动推断的知觉

让我们从我们体验世界的起点——我们的感官——开始。我们常常认为知觉是一条单行道:世界将自身印在我们的眼睛和耳朵上,大脑只是读取信息。预测编码框架颠覆了这一观念。大脑不是一个被动的接收者;它是一个活跃、不知疲倦的预言家,不断地对它期望看到和听到的内容生成预测。感官输入不是信息本身,而是修正大脑持续预测的误差信号。

一个经典而有趣的例子是麦格克效应。想象一下,你正在观看一个人说“ga-ga-ga”的视频,但音轨被替换成了“ba-ba-ba”的声音。大多数人报告听到了什么?既不是“ba”也不是“ga”,而是一个完全不同的声音:“da-da-da”。这不是我们线路的错误或故障;这是一个最佳统计学家工作的标志。你的大脑接收到两个相互矛盾的数据:一个与声音/b/一致的听觉信号和一个与声音/g/一致的视觉信号(嘴部动作)。面对这种模糊性,大脑会问:“世界上最可能导致这两个看似矛盾的感官事件的单一原因是什么?”它结合证据,根据每个证据的感知可靠性或精度进行加权。在许多情况下,能够调和这两个输入的最可能假说是,说话者实际上发出了中间音/d/。大脑不只是简单地平均输入;它推断出一个能够最好地解释两者的全新现实。

这种预测之舞并不仅限于被动观察。它正是我们如何控制身体并区分自我与世界的精髓。当你决定移动眼睛时,你的大脑不会等到世界突然移动时才感到惊讶。它会将运动指令的副本——一个“传出副本”——发送到一个非凡的内部模拟器,一个主要由小脑实现的前向模型。这个模型迅速预测你行动的感官后果:“当眼睛移动时,世界即将看起来是这个样子。”这个预测被发送到视觉皮层,并有效地从传入的感官流中减去。结果呢?世界看起来是稳定的,而你自己眼球运动的感觉被“解释掉”或减弱了。小脑的损伤会破坏这个快速的预测通道。没有准确的预报,实际的感官输入现在会在皮层中产生巨大的预测误差,这是一种神经上的“惊叫”,可以通过脑电图(EEG)等技术测量到。这一个想法完美地解释了为什么我们移动时世界感觉是稳定的,以及为什么小脑损伤会导致笨拙、不协调的运动——大脑不断地被自己行动的后果所惊吓。

机器中的幽灵:当信念塑造身体现实时

大脑的预测机制并不仅限于我们皮肤的边界。它也在不断地试图预测、调节和理解来自我们身体内部的源源不断的信息流——这一过程称为内感受。我们对疼痛、疲劳、恶心或心跳加速的感觉,并非对我们生理状况的直接解读。它们是推断,是大脑关于我们内部状态的最佳猜测,并受到我们的信念和期望的强烈影响。

这为安慰剂和反安慰剂效应提供了最有说服力的科学解释。安慰剂,比如病人相信是强效止痛药的惰性糖丸,通过灌输一种强烈的、高精度的疼痛缓解的*先验信念*而起作用。这种“低痛”的期望作为一种强大的自上而下预测。当大脑将这个强烈的预测与来自身体的嘈杂、模糊的疼痛信号(似然性)结合时,预测可以压倒证据。最终的意识体验——后验信念——是疼痛减轻,即使潜在的生理状况并未改变。信念变成了自我实现的预言,写入了我们知觉的通货之中。

反安慰剂效应是这一机制的黑暗孪生兄弟。如果病人被警告一种无害物质可能引起恶心,他们可能会对“即将恶心”产生一个高精度的先验。这种来自大脑高级中枢(如前脑岛)的自上而下预测,可以放大并误解良性的肠道感觉,从而产生它所预期的症状。同样的逻辑帮助我们理解像躯体症状障碍这样令人困惑的病症,在这种病症中,尽管心脏完全健康,病人仍可能经历使人衰弱的心脏症状。大脑可能被锁定在一个强大的、高精度的“心脏威胁”先验中,这个先验持续压倒正常生理的感官证据,产生一种持久而可怕的疾病幻觉。

信念的影响甚至可以更加微妙。考虑一个对疼痛进行灾难化思考的病人。这种认知风格不仅创造了一个对高疼痛的强烈先验。心理状态可以对感官通道的“音量旋钮”施加自上而下的控制。灾难化思考似乎会增加上行伤害性感受通路的增益或精度。这是一个毁灭性的双重打击:大脑既期望更多的疼痛(更高的先验均值),又更“专注地倾听”疼痛信号(更高的似然性精度),将知觉系统锁定在一种放大的痛苦状态中。

水晶球的裂痕:计算精神病学

如果一个健康的心智是一台校准良好的预测机器,那么精神疾病在许多情况下可以被理解为一种推断疾病——先验信念和感官证据之间微妙平衡的崩溃。这种“计算精神病学”的视角为理解广泛的障碍提供了一个强大的、统一的框架。

思考一下精神分裂症患者和自闭症谱系障碍(ASD)患者所处的截然不同的世界。预测编码框架表明,他们可能代表了同一系统中两种相反类型的不平衡。在精神分裂症中,像幻觉这样的阳性症状可能源于病态地强大和精确的先验。大脑的内部模型变得如此主导,以至于它自上而下地产生知觉,几乎不需要支持性的感官证据。听到一个声音的预测变得如此强大,以至于它表现为真正听到声音的体验。

相比之下,ASD的感官敏感性可能反映了相反的问题:先验太弱或不精确(“先验过弱”),或者感官证据被赋予了过重的权重。没有强大的先验来提供背景和“解释掉”不相关的细节,世界以其原始、未加修饰和压倒性的强度被感知。大脑被它无法平息的自下而上的预测误差所淹没,导致感官超载的体验。

这种异常精度的模式在其他病症中也回响着。重度抑郁症中持续的负面解读可以看作是过度精确的负面先验(“世界是暗淡的”,“我是一个失败者”)的结果,它过滤所有模糊的社交线索和生活事件,证实其自身的悲观预测。同样,偏执型人格风格中持久的猜疑可以被框定为对威胁的病态精确的先验,加上行动策略(如社交回避),阻止了证伪性证据的收集,将个体锁定在一个自我验证的、充满敌意的感知世界中。

重塑预测引擎:治疗的新视角

这个框架的最终承诺不仅在于解释,更在于治愈。如果精神疾病是一种推断障碍,那么治疗就是重新校准大脑预测引擎的过程。这个视角为现有疗法为何有效提供了深刻的、机理性的理解,并为干预开辟了新的途径。

思考一下认知行为疗法(CBT),我们最有效的心理疗法之一。从预测编码的角度来看,CBT是一套用于重新调整先验和改进证据收集的工具。当治疗师帮助病人“挑战他们的核心信念”时,他们正在努力降低不适应先验的精度。当他们设计一个“行为实验”时,他们正在引导病人进行一种主动推断——一种从世界中采样数据的新策略,旨在产生强烈的、纠正性的预测误差,并更新错误的模型。

这个框架也阐明了其他方法的机制。正念训练培养对当下感觉的不加评判的注意力,其作用可能是通过增加感官证据的精度。通过学习“相信他们感官的数据”,个体可以给予自下而上的信号更多权重,从而使他们能够突破僵化、负面先验的主导,例如在抑郁症中。

最后,它能为药理学提供关键的见解。为什么在针对惊恐障碍的暴露疗法前服用苯二氮䓬类药物有时会妨碍长期进展?该模型提供了一个深刻的答案。药物可能通过减弱内感受预测误差的精度来减少短期恐惧。但这个预测误差正是大脑更新其灾难性信念(即身体感觉是危险的)所需要的学习信号。通过化学方式压制“意外”信号,药物无意中阻止了作为整个疗法核心的纠正性学习。

从幻觉的闪现到人类最深层的痛苦,贝叶斯大脑假说提供了一个深刻而统一的视野。它将大脑重新定义为一个动态、主动、极具美感的信念引擎,而非静态的信息处理器,这个引擎不断努力猜测其世界背后隐藏的原因。在理解这个过程中,我们向理解自我迈出了一大步。