try ai
科普
编辑
分享
反馈
  • 概率性群体编码

概率性群体编码

SciencePedia玻尔百科
核心要点
  • 大脑通过利用整个神经元群体的活动模式来编码一个完整的概率分布,而不仅仅是单个最佳猜测值,从而表征不确定性。
  • 贝叶斯推断,即用新证据更新信念的过程,在大脑中变得计算简单,因为神经回路可以表征对数概率,从而将乘法运算转变为简单的加法运算。
  • 注意力可以被理解为一种通过倍增相关神经元的增益(放电率)来提高神经编码精度的机制。
  • 除法归一化是一种常见的神经回路基序,它执行了关键的数学步骤,以确保大脑的概率表征得到适当的缩放。

引言

大脑是如何从我们感官接收到的充满噪声和模糊不清的信号中,构建出对世界稳定而确切的感知的?一个有力的答案在于概率性群体编码(PPCs)这一概念,它是一个计算框架,认为大脑不仅表征其所感知的内容,还表征其对该感知的确定程度。本文旨在探讨神经活动的混沌现实与我们体验的连贯世界之间的根本差距。它提出,大脑扮演着统计学家的角色,不断地进行概率推断。本文将引导您了解这一强大理论的核心原则。首先,我们将深入探讨PPCs的“原理与机制”,探索神经元群体如何编码概率分布,以及大脑如何用简单的运算执行复杂的贝叶斯计算。接着,我们将探讨其“应用与跨学科联系”,揭示这些原理如何为从感觉解码、注意力到决策等广泛的认知功能提供统一的解释。

原理与机制

我们所感知的世界感觉是确定而明确的。咖啡杯放在桌上;鸟儿在窗外歌唱。然而,到达我们大脑的信息却远非确定。它是由神经元的电脉冲所承载的、充满噪声和模糊信号的洪流。大脑是如何将这种嘈杂的声音转化为连贯、稳定的感知的?更深层次的问题是,大脑如何不仅表征它认为外界存在什么,还表征其信念的确定程度?许多神经科学家认为,答案在于一个优美的计算原理,即​​概率性群体编码(PPCs)​​。要理解它们,我们必须踏上一段旅程,从单个神经元开始,到计算的交响乐结束。

神经元群体的语言

让我们从单个神经元开始。它有一个偏好的刺激——可能是一条线的特定角度、一个特定的声音频率或一个运动方向。当这个偏好的刺激出现时,神经元会更剧烈地发放动作电位,即“脉冲”。我们可以绘制其放电率与刺激值之间的关系图,这种关系被称为​​调谐曲线​​。但神经元并非一个完美、确定性的设备。它的脉冲发放从根本上说是充满噪声的。如果你两次呈现完全相同的刺激,它发放的脉冲数量会有所不同,其变异模式通常可以用​​泊松分布​​很好地描述。

如果单个神经元是一个不可靠的叙述者,那么大脑如何能达到它显然拥有的非凡精度呢?它是通过倾听一个委员会——一个完整的神经元群体——来实现的。但是这个委员会应该如何组织呢?

想象一下两种可能的策略。一种是​​标记线编码​​,类似于钢琴。每个神经元就像一个琴键,只负责一个特定的刺激。当“升C调”神经元放电时,大脑可以确定地知道升C调刺激存在。这看起来简单直接。然而,它也很脆弱。如果一个神经元死亡,或者只是有噪声,大脑的世界中就失去了一个完整的“音符”,从而产生一个盲点。这种表征是离散的;那么落在“音符”之间的刺激该如何处理呢?

现在考虑另一种选择:​​分布式群体编码​​。这更像画家的调色板。每个神经元不是只对狭窄范围的刺激有反应,而是对广泛的刺激都有反应,其响应在其偏好值处达到峰值。任何给定的刺激,比如一种特定的蓝色,都会在不同程度上激活大量神经元——一点“天蓝色”神经元,大量“蔚蓝色”神经元,少量“青色”神经元。刺激不是由单个活跃的神经元来表征,而是由整个群体的活动模式来表征。这种方法要稳健得多。单个神经元的损失就像从一大堆颜料中丢失了一管;画家仍然可以用剩下的颜料调出想要的颜色。此外,通过解读混合的活动,大脑可以以远高于任何单个神经元调谐宽度的精度来表征刺激。这种具有重叠、宽调谐神经元的分布式方案,构成了概率性群体编码的基础。

从脉冲到信念:贝叶斯大脑

分布式编码的想法很强大,但我们可以将其提升到更高的层面。如果神经活动模式所表征的不仅仅是单个最佳猜测值呢?如果它表征的是一个完整的可能性景观——一个​​概率分布​​呢?这就是​​贝叶斯大脑假说​​的核心宗旨:大脑的基本目标是执行概率推断,而神经元群体是实现这种计算的媒介。

要理解这一点,我们必须首先掌握信念更新的逻辑,这是由18世纪的数学家Thomas Bayes形式化的。​​贝叶斯定理​​是理性推断的黄金法则。它告诉我们如何根据新证据更新我们的信念。在知觉的背景下,它看起来是这样的:

p(s∣o)∝p(o∣s)p(s)p(s|o) \propto p(o|s)p(s)p(s∣o)∝p(o∣s)p(s)

让我们来分解一下。这里,sss 是世界中的潜在刺激(我们想要知道的‘自然状态’),而 ooo 是我们充满噪声的感觉观测。

  • p(s)p(s)p(s) 是​​先验分布​​。它代表了我们在进行观测之前对刺激的初始信念。这是大脑关于世界统计规律性的累积知识——例如,物体更可能从上方被照亮,或者人类语音倾向于落在某个频率范围内。在神经层面,这可能通过自上而下的反馈信号来实现,这些信号用预期来启动感觉区域。
  • p(o∣s)p(o|s)p(o∣s) 是​​似然函数​​。它捕捉了前向过程:如果真实刺激是 sss,观测到 ooo 的概率是多少?这个函数由我们感觉器官的物理特性和神经转导中固有的噪声决定。刺激在我们感觉神经元中引起的活动模式可以被看作是表征了这种似然。
  • p(s∣o)p(s|o)p(s∣o) 是​​后验分布​​。这是我们在考虑了感觉观测之后对刺激的更新信念。它是一个概率性答案,回答了这个问题:“鉴于我刚刚看到(或听到、或感觉到)的,世界最可能的状态是什么,以及我有多确定?”

贝叶斯大脑假说提出,大脑是一台为计算这个后验分布而构建的机器。而概率性群体编码就是被提议的实现方式。

线性的魔力:神经元如何用概率进行计算

这一切听起来很美妙,但它带来了一个巨大的挑战。这个方程涉及乘法,这对于神经回路来说并非一个直接能实现的运算。一个由简单神经元组成的网络如何能执行这种复杂的计算呢?

这里蕴含着一个数学魔术,它正是PPCs的核心。我们不直接处理概率,而是考虑它们的对数。贝叶斯法则中的乘法优雅地转变成了加法:

log⁡p(s∣o)∝log⁡p(o∣s)+log⁡p(s)\log p(s|o) \propto \log p(o|s) + \log p(s)logp(s∣o)∝logp(o∣s)+logp(s)

加法是神经元天生就会做的事情——它们将输入信号相加。这提示了一种强大的实现策略:如果神经活动能够表征这些概率分布的对数,那么贝叶斯推断将简化为神经信号的简单求和。

令人惊讶的是,这正是在具有类泊松放电统计特性的神经元群体中发生的情况。在给定刺激 sss 的情况下,观测到脉冲计数向量 k=(k1,k2,…,kN)\mathbf{k} = (k_1, k_2, \dots, k_N)k=(k1​,k2​,…,kN​) 的对数似然可以写成:

log⁡P(k∣s)=∑i=1N(kilog⁡(λi(s))−λi(s)−log⁡(ki!))\log P(\mathbf{k}|s) = \sum_{i=1}^{N} \left( k_i \log(\lambda_i(s)) - \lambda_i(s) - \log(k_i!) \right)logP(k∣s)=i=1∑N​(ki​log(λi​(s))−λi​(s)−log(ki​!))

仔细观察刺激 sss 和观测到的脉冲计数 kik_iki​ 是如何相互作用的。关键项是 ∑i=1Nkilog⁡(λi(s))\sum_{i=1}^{N} k_i \log(\lambda_i(s))∑i=1N​ki​log(λi​(s))。对数似然中与刺激相关的部分是一组基函数(对数调谐曲线)的​​线性组合​​,其中的系数正是来自神经元的脉冲计数。混乱的、随机的脉冲计数已经成为关于刺激的概率分布的参数。脉冲计数向量 k\mathbf{k}k 是一个​​充分统计量​​;它携带了神经响应中包含的关于刺激的所有信息。这就是为什么这类编码被称为​​线性概率性群体编码(LPPCs)​​。

让我们通过一个具体的例子来看看这是如何运作的。想象一个神经元群体,其中每个神经元对刺激 sss 的响应是线性的,并受到高斯噪声的干扰。我们还假设我们对 sss 的先验信念是高斯分布。高斯分布的一个显著特性是,两个高斯分布的乘积是另一个高斯分布。当我们应用贝叶斯法则时,我们的后验信念也是一个完美的高斯分布。这个新的后验分布的均值是先验均值和来自感觉证据的估计值的加权平均。至关重要的是,后验分布的精度(即方差的倒数,一种确定性的度量)就是先验精度与每个神经元提供的证据所贡献的精度的总和。我们的确定性是加性增长的——这是一个优美而直观的结果,得益于该编码底层的线性结构。

衡量编码质量:费雪信息

我们有了一种表征概率分布的编码。但它有多好呢?一个给定的脉冲模式实际上包含了多少关于刺激的信息?要回答这个问题,我们需要一种通用的货币来衡量统计表征的质量。这种货币就是​​费雪信息​​,记为 J(s)J(s)J(s)。

费雪信息量化了似然函数随刺激 sss 的微小变化而变化的程度。如果对 sss 的微小调整导致神经活动模式发生巨大、明确的变化,那么费雪信息就高,我们就能高精度地估计 sss。反之,如果模式变化很小,信息就低。对于一个由独立的泊松神经元组成的群体,总费雪信息就是每个神经元信息之和:

J(s)=∑i=1N(dλi(s)ds)2λi(s)J(s) = \sum_{i=1}^{N} \frac{\left(\frac{d\lambda_i(s)}{ds}\right)^{2}}{\lambda_i(s)}J(s)=i=1∑N​λi​(s)(dsdλi​(s)​)2​

这个公式非常直观。一个神经元在以下情况下贡献更多信息:

  1. 其调谐曲线的斜率很陡(dλi(s)ds\frac{d\lambda_i(s)}{ds}dsdλi​(s)​ 很大)。这意味着刺激的微小变化会产生放电率的巨大变化,从而容易被注意到。
  2. 其放电率 λi(s)\lambda_i(s)λi​(s) 相对较低。这是因为泊松过程中的噪声与平均放电率成正比。更高的放电率意味着更多的噪声,这会掩盖信号。

当我们考虑一个由具有高斯形调谐曲线的神经元组成的大群体,这些神经元均匀地覆盖了刺激空间时,我们可以为该编码推导出一个非常简单的“设计原则”。总费雪信息变为:

J∝g⋅ρσJ \propto \frac{g \cdot \rho}{\sigma}J∝σg⋅ρ​

这里,ggg 是​​增益​​(峰值放电率),ρ\rhoρ 是神经元的​​密度​​(每单位刺激的神经元数量),σ\sigmaσ 是​​调谐宽度​​。要构建一个高保真度的编码,大脑应该使用高增益的神经元并将它们密集地排列。它还应该,或许有些违反直觉地,使其调谐宽度(σ\sigmaσ)相对较窄。这个公式将信息的抽象概念与神经元群体的生物物理参数直接联系起来。

真实世界充满噪声且复杂

到目前为止,我们的故事假设了一个理想化的世界,其中每个神经元的噪声都与其他神经元无关。但大脑中的神经元是大规模相互连接的,它们的噪声通常是​​相关的​​。这会破坏我们描绘的美好图景吗?完全不会——它增加了一个引人入胜的、新的复杂层面。

天真地看,人们可能会认为所有噪声都是坏的,所有相关性都是有害的。但真正重要的是噪声的结构。想象一下我们神经元群体中噪声相关性的两种情况:

  1. ​​“有益的”噪声:​​ 假设噪声倾向于使所有神经元一起向上或向下波动(一种等相关噪声)。如果刺激本身是由群体中活动差异编码的(如在许多分布式编码中那样),那么这种全局性的、共享的噪声不会影响与刺激相关的模式。大脑可以有效地忽略它。在这种情况下,编码维度中的有效噪声减小了,并且违反直觉的是,费雪信息实际上可以增加。

  2. ​​“恶魔般的”噪声:​​ 现在,想象一下噪声的结构模仿了那些标志着刺激变化的活动变化本身(信号对齐噪声)。当刺激向右轻微移动时,会发生特定的活动模式变化。如果噪声本身产生了相同的模式,那么就无法判断是刺激发生了变化,还是仅仅是一次随机波动。这种噪声的破坏性最大,可能导致费雪信息急剧下降。

这揭示了一个深刻的原则:大脑不仅仅是在对抗噪声,它是在一个高度结构化的噪声环境中运作。其编码的保真度关键取决于信号与噪声相关结构之间错综复杂的相互作用。

保持诚实:归一化与编码的局限

我们还有最后一块拼图。为了让我们的神经活动能够表征一个有效的概率分布,所有可能假设的概率之和必须为一。如果我们解码假设 iii 的概率与放电率 rir_iri​ 成正比,即 pi=ri∑jrjp_i = \frac{r_i}{\sum_j r_j}pi​=∑j​rj​ri​​,那么神经回路必须以某种方式计算或约束这个分母,即总的群体活动。

大脑中一个优美而普遍存在的回路基序,称为​​除法归一化​​,似乎非常适合这项工作。在这种机制中,每个神经元的活动被一大群附近神经元的汇集活动所除,这些汇集活动通常由一个局部的抑制性中间神经元群体提供。当整体刺激驱动增加时(例如,由于对比度增加),抑制池变得更加活跃,从而增加了其除法抑制作用。这会自动将群体的总输出维持在一个稳定范围内,有效地实现了概率编码所需的归一化。这是一个惊人的例子,展示了一个简单的局部神经回路如何能执行一个基础且必要的数学运算。

最后,我们必须承认这个优雅框架的局限性。线性PPCs的力量来自于用一个简单的单峰分布(如单个高斯分布)来近似大脑的信念。这对于许多任务来说是快速而高效的。但如果真实的信念本身就是模糊的呢?想象一下看到一个模糊的、旋转的内克尔方块。你的大脑不会满足于一个单一、模糊的平均旋转方向;它会考虑两种截然不同的可能性——向左旋转或向右旋转。此时的后验分布是​​双峰的​​。

一个简单的PPC,就其本质而言,在这里会失败。它会试图用一个位于中间的、宽泛的单峰来表示这两个不同的峰值——这是一个对两种可能性都不真实的总结。对于这类任务,大脑可能会采用不同的策略,例如​​基于采样的编码​​。在采样方案中,随时间变化的神经活动代表了从完整的、复杂的后验分布中进行的一系列抽取,或称样本。这速度较慢,需要更多时间来构建准确的图像,但它的灵活性是无限的。它可以表示任何形状的分布,无论多么复杂。

这些不同策略的存在提醒我们,大脑是一台务实的机器。它可能拥有一个包含不同编码方案的工具箱,在世界明确且时间紧迫时部署快速简单的PPCs,而在面临模糊性时转向更灵活但较慢的基于采样的方法。探索大脑编码的旅程远未结束,但概率性群体编码的原理提供了一个强大而优雅的框架,用于理解一个由充满噪声的、简单的部件构成的大脑如何能够产生我们丰富而确定的感知世界。

应用与跨学科联系

我们已经探索了概率性群体编码的基本原理,发现了神经元的集体“交谈”如何不仅能表征一个值,还能表征一个完整的可能性景观——一个概率分布。这是一个深刻的视角转变。大脑不仅仅是一个探测器;它是一个统计学家,不断地权衡证据并更新其信念。

但是,这样一台非凡的机器有什么用呢?事实证明,它的用途几乎无所不包。这个单一而优雅的想法——神经元群体编码概率——为了解从最简单的视觉行为到最复杂的注意力和决策等认知壮举这一系列令人惊叹的大脑功能,提供了一个统一的框架。现在让我们来探索这个新领域,看看这些原理是如何运作的。

解码世界:从感觉信号到有意识的知觉

想象一下,你正在为一位病人设计一个假肢臂,一个将神经指令转化为流畅运动的脑机接口。大脑必须指定一个运动方向。它是如何做到的?单个神经元噪声太大,太不可靠。大脑的解决方案是一个“神经元议会”,其中每个神经元通过发放动作电位来为其偏好的方向“投票”。概率性群体编码为计算这些选票提供了完美的规则。

在一个极其简单的安排中,大脑可以通过计算所有活跃神经元偏好方向的加权平均值来确定最可能的意图方向。而权重是什么呢?它们就是每个神经元发放的脉冲数量! 一个放电剧烈的神经元,其“意见”的权重就更大。从这种集体活动中产生的是对意图运动的单一、稳健的估计。在某些常见条件下,用于计算最可能刺激的复杂贝叶斯计算,简化为这种优美简单且生物学上可行的机制。大脑似乎已经发现了加权最小二乘法的力量,只不过它不是在硅片上实现的,而是在活体组织中实现的。

这个原理不仅限于像方向这样的连续值。考虑一下丰富的嗅觉世界。当气味分子与鼻子中的受体结合时,它会在嗅球的僧帽细胞中触发一种独特的活动模式。大脑如何决定它闻到的是玫瑰还是柠檬?我们可以把这看作一个假设检验问题。一个神经元群体可能代表“玫瑰”的证据,其集体活动与似然的对数成正比,即 ln⁡p(感觉输入∣玫瑰)\ln p(\text{感觉输入} | \text{玫瑰})lnp(感觉输入∣玫瑰)。另一个群体可能对“柠檬”做同样的事情。

然后,一个下游大脑区域可以简单地比较这些竞争群体的活动,将其与任何先验预期相结合,并得出每种气味的后验概率。最活跃的群体获胜,你就会感知到相应的气味。从连续估计到离散分类,同样的基本逻辑适用:大脑使用概率的语言,以脉冲为货币进行书写。

主动的大脑:信念和注意力如何塑造现实

到目前为止,我们一直将大脑描绘成一个被动的观察者,忠实地解码它接收到的信号。但这远非故事的全部。知觉是一个主动的过程,是传入的感觉数据与大脑自身的世界内部模型之间持续的对话。PPCs为理解这种对话提供了一种语言。

预期的力量

我们都经历过:在黑暗的房子里听到微弱的噪音,我们的想象力会驰骋,而同样的声音在忙碌的白天却被忽略。这就是预期的力量,或者贝叶斯统计学家称之为先验。我们的知觉是实际存在的东西(似然)和我们预期存在的东西(先验)的混合体。

概率性群体编码向我们展示了这种混合如何导致系统性的知觉偏差。假设大脑有一个内部先验信念,认为某个刺激可能接近某个值 μ0\mu_0μ0​。当一个新的、充满噪声的感觉证据到达时,大脑的最佳猜测不是感觉值本身,而是一个折衷方案——一个从感觉证据拉向先验均值 μ0\mu_0μ0​ 的值。由此产生的知觉偏差可以用一个优美简单的线性规则来描述:知觉误差的大小与真实刺激和大脑期望值之间的距离成正比。

这不是系统的缺陷。这是应对不确定世界的一种最优策略。当感觉信息不可靠时,依靠过去的经验是值得的。这些“偏差”仅仅是大脑正在充分利用其所拥有的所有信息的标志。

大脑可能如何实现这一点?想象一下来自更高认知区域(如已知编码背景和预期的眶额皮层)的自上而下信号。这些信号不需要重写梨状皮层(初级嗅皮层)中的原始感觉编码。相反,它们可以在决策阶段起作用,增加一个代表对数先验几率的“偏置”信号。这在计算上是优雅的;感觉区域负责报告似然,而其他区域提供背景先验,决策回路将它们结合起来形成最终的知觉。

作为精度的注意力

预期并不是大脑主动塑造知觉的唯一方式。它还利用注意力来选择性地增强信息。当你在嘈杂的房间里专注于朋友的声音时,他们的话语会变得更清晰。这是如何发生的?贝叶斯大脑框架提供了一个惊人而优雅的答案:注意力是精度的神经实现。

考虑一个编码刺激的神经元群体。像注意力这样的自上而下信号如何能使这种表征“更好”?一个看似直接的方法是简单地增加该群体中所有神经元的放电率——即调高它们的增益。在泊松脉冲模型中,这种简单的乘法增益的后果是深远的。通过推导其对费雪信息——衡量群体携带多少关于刺激信息的度量——的影响,我们发现整个群体编码的精度随增益线性增加。

换句话说,通过简单地让神经元更多地放电,大脑实际上在告诉系统的其他部分:“更多地关注这个信号;它现在更可靠了。”这产生了一些具体的、可检验的预测。被注意的刺激应该由放电更多的神经元来表征,其调谐曲线在振幅上被放大,但不一定更尖锐。此外,在结合来自多种感觉(例如,视觉和听觉)的信息时,一个最优的贝叶斯观察者应该给予被注意的线索更多的权重。这正是在众多心理学和神经生理学实验中观察到的现象。注意力不是一个神奇的聚光灯;它是一种动态加权整个大脑信息通道可靠性的机制。

计算的统一性:窥探其内在机制

我们已经看到了各种非凡的现象——解码、分类、偏差、注意力——所有这些都可以通过概率性群体编码的视角来解释。人们可能会好奇是什么让这个框架如此强大和多功能。秘密在于一个深层的数学特性。

我们讨论过的、基于泊松脉冲和指数族调谐曲线的编码,具有一种特殊的结构。在这种结构内,贝叶斯更新——即结合先验信念与新证据以形成新的后验信念——这一极其复杂的行为,在机制上变得微不足道。它简化为简单的加法。

当一个新的脉冲到达时,大脑可以通过简单地将一个相应的值添加到一个代表其知识状态的运行总计中,来更新其对世界的信念。整个后验分布,包括其均值和不确定性,可以通过基于传入脉冲计数的简单线性更新来跟踪。这使得一度被认为对于生物系统来说计算要求过高的贝叶斯推断,不仅变得可行,而且效率惊人。

从脑机接口的静谧嗡鸣到我们自身知觉充满活力且带有偏见的本质,概率性群体编码揭示了一条共同的线索。它们向我们展示了一个并非由互不相干的模块组成的集合体,而是一个统一的计算系统,一个掌握了在不确定性下进行推理艺术的大脑。这个想法的美妙之处在于,它能够将神经脉冲的微观世界与我们自身意识体验的宏观世界联系起来,揭示了支配心智的优雅统计原理。