
当您看到一张熟悉的脸或伸手去拿一杯咖啡时,感知行为感觉是瞬时且完整的。然而,在这种无缝的体验之下,您的大脑内部存在着深刻的分工。识别您所见何物的能力由一个神经系统处理,而计算如何与之互动的神经系统则几乎与之完全分离。这种根本性的分工是视觉神经科学的基石,理解它便能解开我们如何从光线中构建一个有意义世界的秘密。
本文聚焦于“是什么”通路,一个被称为腹侧通路的复杂网络。我们将探讨该系统如何将视网膜上一片混乱的像素拼贴转化为稳定、可识别的物体。通过剖析其结构和计算原理,我们可以开始回答生物学中最引人入胜的问题之一:大脑是如何创造意义的?
我们将首先深入探讨腹侧通路的原理与机制,追溯其在大脑中的解剖路径,并探索其用以构建物体表征的优雅、层级化的策略。随后,应用与跨学科联系一章将揭示这单一概念如何解释一系列令人困惑的临床障碍,阐明信念的本质,并反映出一种延伸至视觉之外的大脑组织的普遍原则。
想象一下,您看到书桌上一个熟悉的咖啡杯。您立刻认出了它——它的颜色、杯沿上的缺口、您最喜欢的咖啡馆的标志。现在,您伸手去拿它。您的手毫不费力地贴合杯柄的形状,手指施加恰到好处的压力,您不假思索地将它拿起。这似乎是一个连贯的动作,一个单一、统一的“看”的行为。但如果并非如此呢?
神经科学揭示了一个惊人的事实:识别杯子的行为和伸手去拿它的行为,是由您大脑中两条几乎完全分离的处理流来处理的。这种根本性的分工是视觉系统最深刻的组织原则之一,它为我们理解视觉这一奇妙机制提供了切入点。
思考一个奇怪但真实的病例:一名患者在遭受特定类型的脑损伤后,可以看着一个咖啡杯并完美地描述其细节,但却完全无法引导自己的手去抓住它。他的手部动作笨拙、瞄准不准,并且无法正确定位手指,就好像他正在伸手去拿一个看不见的物体一样。这种情况被称为视性共济失调 (optic ataxia)。
现在,想象另一位不同的患者。这个人可以完美地伸手抓住杯子,手掌优雅地贴合杯柄。然而,当被问及这个物体是什么时,他却一无所知。他无法说出它的名字,也无法描述它的用途或特征。他失去了所见之物的意义。这就是视觉失认症 (visual agnosia)。
这两种病症,视性共济失调和视觉失认症,构成了科学家所说的双重分离 (double dissociation)。它们是有力的证据,证明我们的大脑将视觉问题分解为两个主要任务。一个系统,即腹侧通路,致力于识别物体是什么。这是负责物体识别、记忆和意义的通路。另一个系统,即背侧通路,则致力于确定物体在哪里以及如何与之互动。这是负责行动、引导我们在空间中运动的通路。
那么,这两条通路位于何处?视觉信号的旅程就像一条从单一源头——视网膜——开始,然后分叉成两条大支流的河流。在您头部后方的视觉皮层最初几个阶段(名为V1、V2 和 V3 的区域)进行初步处理后,路径开始分化。
腹侧通路,即我们的“是什么”通路,走的是一条向下并向前的路线,沿着大脑底部进入颞叶。可以把它想象成低路。它的旅程经过像V4区这样的关键站点,该区域对于处理颜色和形状至关重要,并最终汇集于颞下皮层 (IT) ,即大脑的高级物体识别中心。
背侧通路,即我们的“在哪里/如何做”通路,走的是高路。它向上投射到顶叶,这是大脑中对空间意识和协调运动至关重要的区域。这里的一个关键站点是中颞区 (MT),它对运动极为敏感。
这些通路不仅仅是图表上的抽象箭头;它们是被称为白质束的大量神经“线路”束。腹侧通路的主要高速公路是一条名为下纵束 (ILF)的神经束,它物理上连接着枕叶和颞叶。另一条下额枕束 (IFOF)则提供了与额叶的直接连接,使我们能将所见之物与更高级的意义和目标联系起来。与此同时,背侧通路依赖于其自己的高速公路——上纵束 (SLF),它将顶叶与规划我们行动的额叶区域连接起来。大脑的结构,其布线本身,就反映了这种根本性的分工。
现在,让我们沿着腹侧通路走下去,并提问:视网膜上的一堆光点、暗点和色点是如何变成对“咖啡杯”的丰富、有意义的感知的?答案在于一个优美而简洁的原则:层级处理 (hierarchical processing)。腹侧通路就像一条精密的装配线,每个阶段都从前一阶段创造的更简单的部件中构建出更复杂的东西。
在通路的最初端,V1区,神经元的“世界之窗”非常小。每个神经元的感受野 (receptive field)——它所“看见”的视觉空间范围——是微不足道的。这些神经元是简单的专家;它们只对非常特定的事物感到兴奋,比如在某个特定位置呈度角的一个小边缘。它们对杯子或面孔一无所知。
但在下一个阶段,比如在V4区,一个神经元接收来自许多V1神经元的输入。通过组合来自各种边缘探测器神经元的信号,这个V4神经元可以调整自己以适应更复杂的事物,比如一条曲线或一个角落。它的感受野更大,因为它汇集了来自V1区更广泛区域的信息。
这个过程不断重复。在最终阶段,即IT皮层,神经元接收来自大量V4神经元的输入。通过组合关于各种曲线、角落和彩色表面的信号,一个IT神经元最终可以学会对一个完整的物体做出反应,比如您的咖啡杯。它的感受野现在变得巨大,有时覆盖您一半的视野。
我们可以通过一个简单的计算模型看到这个原则的运作。想象每个阶段都涉及两个操作:滤波和池化。滤波步骤寻找一个模式(如边缘)。池化步骤总结一个小邻域内的结果,有效地使下一阶段不太关心确切的位置。通过重复这些简单的步骤——滤波、池化、滤波、池化——我们可以构建一个系统,其中感受野呈指数级增长,而特征复杂度在每一层都增加。这个模型虽然是简化的,但抓住了腹侧通路如何从最卑微的开端构建出丰富的世界感知的精髓。这是一个复杂性如何从简单的、重复的规则中涌现的惊人例子。
腹侧通路的层级结构解决了一个视觉领域最深层次的难题:当一个物体在您视网膜上的外观发生巨大变化时,您如何识别出它是同一个物体?您能认出祖母的脸,无论她是站得近还是远(尺寸变化),在您的左边还是右边(平移变化),甚至部分被植物遮挡(遮挡变化)。
腹侧通路的主要计算目标是实现对这些保持身份的变换的不变性 (invariance)——或者更准确地说,是容忍度。它必须为“祖母”创建一个稳定的神经编码,这个编码对这些“无关”变量具有鲁棒性。层级结构是关键。每个阶段的池化操作,增加了感受野的大小,也建立了容忍度。通过对一个局部区域的信息进行总结,一个神经元对该区域内特征的精确位置变得不那么敏感。经过几个阶段的池化后,IT皮层中的一个高级神经元几乎无论其偏好的物体出现在视野大部分区域的何处,都会做出反应。
这与背侧通路形成鲜明对比。为了引导您的手抓住一个杯子,背侧通路必须知道它此刻的精确尺寸和位置。它不能容忍不变性;它必须对这些特性极为敏感。我们再次看到了双通路设计的美妙逻辑:一条通路致力于丢弃空间信息以获得稳定的身份,而另一条通路则致力于保留空间信息以实现有效的行动。
当我们看到这个系统的因果结构时,它的力量就变得清晰了。如果我们暂时性地抑制像V4这样的中间区域,高级的IT皮层不仅仅是接收到更弱的信号;它本身的泛化能力——在新的位置或尺寸下识别物体的能力——就会崩溃。装配线被打破了。这表明层级结构不仅仅是一个描述性模型;它是一个功能依赖链,其中每个阶段都执行着下一个阶段所依赖的关键转换。
当我们到达腹侧通路的顶峰,即IT皮层时,我们发现它不是一个同质化的处理团块。相反,它更像一个拥有专门区域的城市,一个专家画廊,其中每位专家都对在我们进化或个体历史中特别重要的物体类别进行了调谐。
使用像fMRI这样的技术,我们可以看到这些区域被点亮。在一个称为梭状回面孔区 (FFA) 的区域,神经元对面孔“着迷”。它们对独特的面孔构型——鼻子上方两只眼睛,嘴巴在鼻子下方——产生强烈反应,并对尺寸、位置和光照的变化表现出令人印象深刻的容忍度。如果打乱这些特征,FFA的反应就会急剧下降。
在附近,海马旁回场景区 (PPA) 是一个地理专家。它对场景、风景和房间的空间布局感到兴奋。它关心您所在空间的几何形状,表现出忽略其中具体物体或家具变化的非凡能力。
此外,还有一些通用专家,比如外侧枕叶区 (LO),一个“形状专家”,对各种各样的物体都有反应。它关心物体的形式和轮廓,能跨越颜色和纹理等线索进行泛化,但它可能比高度专业化的FFA对视角的变化更敏感。这些专门化的模块代表了腹侧通路的最终输出:对视觉世界丰富、分类的理解。
也许腹侧通路最奇妙的方面在于它不是一台静态、硬接线的机器。它是一个动态的、活生生的系统,能从经验中学习,不断更新和完善其对世界的表征。这种被称为神经可塑性的特性,使识别随着时间的推移变得更快、更精确。
这种学习的一种形式是启动效应 (priming)。当您第二次看到一个物体时,您识别它的速度会更快。在大脑中,发生了一件有趣的事情:编码该物体的IT神经元的放电实际上会减弱。这种现象被称为重复抑制 (repetition suppression),是效率的标志。网络已经学会了这个模式,现在可以用更少的能量来表征它。就好像大脑在说:“啊,又是那个东西。我知道它是什么了,不必大声嚷嚷。”
另一种更深层次的学习形式是知觉学习 (perceptual learning)。通过练习,您可以成为区分非常相似事物的专家——放射科医生发现肿瘤,观鸟者识别鸣鸟。这种进步反映在像V4区这样的区域中神经元调谐的变化。负责编码关键特征的神经元变得更具选择性。描述它们偏好刺激范围的调谐曲线变得更窄。这种表征锐化 (representational sharpening)意味着大脑的探测器变得更加精确,从而能够进行更精细的辨别。
从“是什么”与“如何做”的优雅划分,到构建复杂性和不变性的巧妙层级结构,再到从经验中学习的最终可塑性表征,腹侧通路是生物工程的杰作。它是一个将我们视网膜上原始、无意义的光子泼溅转化为我们每个清醒时刻所栖居的丰富、稳定且有意义的物体世界的系统。
在遍历了腹侧视觉通路错综复杂的机制之后,您可能会想将它归档为神经解剖学中一个精巧但小众的知识点。然而,事实远非如此。“是什么”通路的概念不仅仅是神经科学教科书中的一个章节;它是一把万能钥匙,能解开关于知觉、信念和身份本质的深刻见解。它帮助我们理解特定脑损伤患者的令人困惑的经历,阐明精神痛苦的根源,甚至揭示了一种大脑组织的普遍原则,这种原则在语言和儿童发展等迥异的能力中得到呼应。现在,让我们来探索这一个理念如何向外辐射,连接不同学科并解释那些看似无法解释的现象。
想象一下,你遇到一个男人,尽管视力完全清晰,却无法认出自己妻子的脸。他可以描述她的特征——眼睛的颜色、鼻子的形状——但他无法将它们合成为一个熟悉的整体。只有当她说话时,他才知道是她。这不是思想实验,而是一种真实存在的病症,称为面孔失认症 (prosopagnosia),或称面盲症。这怎么可能呢?
腹侧通路提供了美妙的答案。基础视力测试,比如眼科医生用来绘制您视野的那些测试,主要评估从眼睛到初级视觉皮层 (V1) 的通路完整性。这是大脑的“屏幕”,视觉世界的原始像素在这里抵达。但识别一张脸不仅仅是看像素;它关乎访问一个存储的概念,一个关于“我妻子”的整体表征。这是腹侧通路更高级别的工作,尤其是一个被称为梭状回的区域。在面孔失认症中,V1工作完美——像素都在那里——但下游的“面孔识别库”已离线。大脑能看到特征,但无法检索到那个写着“这是简”的文件。这种看见与识别之间的清晰分离,是大脑层级化和专业化本质最有力的证明之一。
这种选择性崩溃的原则帮助我们理解神经退行性疾病多样且毁灭性的表现。像阿尔茨海默病这样的病症并非单一性的;它们是特定神经网络的病理。虽然典型形式的阿尔茨海默病攻击内侧颞叶并损害记忆,但某些变异体则优先攻击大脑的后部。一个阿尔茨heimer病理集中在背侧“在哪里/如何做”通路的患者,可能会在判断距离或伸手取物时遇到困难,而他们的物体识别能力相对完好。这与记忆受损的患者形成鲜明对比,构成了一个只有通过理解大脑独特的处理通路才能解决的临床难题。在其他病症中,如路易体痴呆 (DLB),病理通常始于枕叶,即两条视觉通路的起源地。这解释了为什么DLB患者典型地表现出双重缺陷:他们难以识别物体(腹侧通路功能)并且难以在环境中导航(背侧通路功能),常常伴有复杂的视幻觉。解剖结构预示了悲剧。
腹侧通路不仅仅是给物体贴标签;它为我们的现实感提供了原材料。当它的信号变得扭曲时,我们最根本的信念可能会瓦解。思考一下令人不寒而栗的卡普格拉综合征 (Capgras delusion),这是一种精神病综合征,患者会变得坚信一个所爱之人——配偶、父母、孩子——已经被一个长相一模一样的冒名顶替者所取代。
几十年来,这是一个深奥的谜团。如今,一个得到大量证据支持的强有力的双因素理论指出,腹侧通路是最初的罪魁祸首。第一个因素是一种知觉异常:腹侧通路的面部识别区域与大脑的情感中心(如杏仁核)之间的连接断开。当患者看到他的妻子时,他的梭状回正确地判断:“这张脸与我为‘妻子’存储的模式相匹配。”但由于连接断开,本应传递到杏仁核的信号——那个产生温暖的、自主神经产生的熟悉“光晕”的信号——丢失了。患者面临一个悖论:“她看起来和我妻子一模一样,但她感觉上不像我妻子。”
用现代计算神经科学的语言来说,大脑是一台预测机器。它不断地对世界产生预测,并将它们与传入的感官数据进行比较。在这种情况下,看到一张熟悉的面孔会产生对熟悉感的强烈预测。然而,腹侧通路传递了一个违反这一预测的信号,产生了一个巨大的“预测误差”。大脑必须解释这个错误。一个健康的大脑可能会得出结论:“我一定是累了。”但在这些患者中,第二个因素起了作用:大脑“信念评估”回路的功能障碍,通常发生在前额叶皮层。这个系统未能抑制最离奇的假设:“她看起来对但感觉不对的原因是她是个冒名顶替者。”腹侧通路受损的信号,加上错误的推理,为患者催生了一个新的、不可动摇的现实。
腹侧通路在精神健康中的作用不仅限于此类罕见的妄想。在躯体变形障碍 (BDD) 中,一种以对感知到的身体缺陷的强迫性关注为特征的病症,腹侧通路似乎并非损坏,而是病态地存在偏向。神经影像学研究表明,在BDD患者中,视觉系统对高分辨率、精细细节过度活跃,而处理整体、宏观信息的网络则参与不足。就好像他们大脑的“视觉均衡器”把高音调到了最大。他们对每一个微小的毛孔、每一丝轻微的不对称都变得极其敏感,却失去了看到整体、完全正常的面孔的能力。这种知觉扭曲,被杏仁核中的威胁检测回路放大,助长了定义该障碍的焦虑和强迫行为。BDD的痛苦,部分始于一个见木不见林的视觉通路。
这种分工——一个用于识别的“是什么”通路和一个用于行动和定位的“如何做/在哪里”通路——是视觉系统的一个特殊技巧,还是反映了皮层设计中一个更深层、更普遍的原则?越来越多的证据支持后者。
看看语言就知道了。正如视觉有两条通路一样,语言处理的双通路模型也有令人信服的证据。一条腹侧语言通路从颞叶的听觉皮层向前延伸到更靠前的颞叶区域,其工作是将声音映射到意义。它是大脑的词典和语义引擎;它是语言的“是什么”通路。与之并行,一条背侧语言通路向上拱入顶叶和额叶,将声音映射到言语所需的发音运动程序。它是语言的“如何做”通路。其证据再次来自患者。一个腹侧语言通路受损的人可能在理解词义方面有严重困难,但却保留了惊人的完美复述能力——这种情况被称为经皮质感觉性失语症。他们可以执行“如何做”(复述)却没有“是什么”(意义),这与那个能描述面部特征却不认识脸的视觉病患形成了完美的听觉类比。
这个原则甚至阐明了儿童学习掌握其世界的简单而美好的过程。为什么一个三岁的孩子在被要求时能立刻指出一个圆形,却在画它时困难重重,画出摇摇晃晃、不闭合的圈?答案在于两条视觉通路的成熟时间不一。负责物体识别的腹侧通路成熟得相对较早。到三岁时,它毫不费力地将一个形状识别为“圆形”。但画画的行为要求背侧通路将那个抽象概念转化为给手的一系列精确的运动指令,这是一个复杂得多的“如何做”问题。这条背侧视动觉通路及其与额叶的连接成熟得更慢。孩子知道是什么圆形,但还不知道如何画一个。知与行之间的分离,是大脑深层结构的一个可见回响,在一张手工纸上上演。
在最根本的层面上,腹侧通路的计算挑战是实现不变性表征 (invariant representation)。它必须学会,无论你从侧面、上方、亮光下还是阴影中看,咖啡杯都是咖啡杯。它的工作是摒弃视角和光照的偶然细节,提取出一个物体的稳定、本质的身份。通过这样做,它构建了我们视觉世界的词汇。
从诊所到摇篮,从一张脸的感知到我们信念的根本结构,腹侧通路都是一个核心角色。这个听起来简单的“是什么”通路的概念, ternyata是现代神经科学中最富有成果的概念之一,揭示了大脑设计的优雅和内在统一性。