
要理解心智,首先要学习大脑的母语:神经编码。这套复杂的规则系统将光、声、触等外部世界转化为知觉、思想和行动的内在现实。几个世纪以来,连接感觉与体验的生物过程一直是一个深奥的谜,一个计算的“黑箱”。神经编码的研究提供了打开这个黑箱的钥匙,揭示了简单、刻板的电脉冲——动作电位或“脉冲”——如何共同产生大脑惊人的计算能力。本文旨在探讨意义是如何在这些神经活动模式中编码这一基本问题。
接下来的章节将引导您踏上探索这门语言的旅程。我们将从“原理与机制”开始,审视神经编码的字母表和语法,探索神经元如何通过其放电速率、时间和集体活动来编码信息。我们将揭示似乎主导其设计的效率和预测等深层原理。随后,“应用与跨学科联系”部分将揭示,解码这门语言如何让我们能够理解知觉,设计能与神经系统直接交流的技术,并构建新型智能机器,从而架起神经科学、工程学和认知科学之间的桥梁。
要理解大脑,就要学习它的语言。像任何语言一样,它有字母表、语法和丰富的思想表达文献。大脑的语言,即神经编码,不是用墨水书写,而是用短暂的电脉冲书写。它是一套规则,使神经系统能够将光、声、触的世界转化为思想、知觉和行动的内在世界。乍一看,其组成部分似乎简单得可笑。但正是从这种简单性中,涌现出一种令我们所建造的任何机器都相形见绌的计算能力。我们对这门语言的探索始于其最基本的字母:脉冲。
神经元的核心是一个微小的生物电池和开关。当一个刺激——无论来自外部世界还是另一个神经元——足够强,将神经元的膜电位推过一个临界阈值时,一个爆发性的、刻板的事件便会发生:动作电位,或称脉冲。这个电脉冲沿着神经元的轴突传播,就像一个发送到神经网络中的“1”。如果刺激太弱,则什么都不会发生——一个“0”。这就是著名的全或无原理:脉冲一旦触发,其振幅和持续时间就是固定的。它不会因为刺激更强而变得更大。
这立刻带来了一个绝妙的难题。如果每个脉冲都完全相同,大脑如何编码感觉的强度?我们如何区分一杯茶的温和暖意和一团火的灼热?神经元无法通过产生更大的脉冲来“喊”得更响。相反,它会更频繁地“说话”。一个更强、持续的刺激会使神经元以更快的频率发射这些相同的脉冲。这种方案被称为速率编码。信息不在于脉冲的大小,而在于它们的频率——单位时间内发射的脉冲数量。这是一个极其简单而稳健的解决方案,就像盖革计数器在接近辐射源时会更频繁地发出咔哒声一样。世界的强度被转化为大脑内部“喋喋不休”的节奏。
节拍是唯一重要的吗?还是说大脑的音乐也有其节奏?虽然速率编码是一种强大而普遍的策略,但这并非全部。想象一下摩尔斯电码。信息不仅在于你每分钟接收到多少个点和划,还在于它们精确的序列和时间。同样,大脑可以采用时间编码,即脉冲的精确时间携带信息。这可以是刺激后第一个脉冲的延迟,脉冲之间间隔的特定模式,或者是不同神经元之间脉冲的同步发放。
作为科学家,我们如何判断一个神经元是在使用速率编码还是时间编码?使用信息论的工具可以使这一区分变得严谨。如果一种编码纯粹是基于速率的,那么在给定时间窗口内的脉冲总数就是一个充分统计量——它包含了脉冲序列中关于刺激的所有信息。如果你在保持总数不变的情况下随机打乱脉冲的时间(这一操作被称为“抖动”),你不会损失任何信息。然而,如果编码是时间的,脉冲计数就不是充分的。精确的时间才是信息,抖动脉冲就像打乱一个单词里的字母——即使所有字母都还在,信息也丢失了。对于时间编码,即使在脉冲时间上加入微小的随机抖动,信息也会迅速衰减。大脑似乎既能像鼓手一样保持节拍,又能像打击乐手一样敲击出复杂的节奏。策略的选择取决于需要发送的信息。
没有一个神经元是孤立工作的。大脑令人难以置信的可靠性和丰富性源于大量神经元集合的集体行动。在群体编码中,信息不是由单个神经元表征,而是分布在一个大的群体中。你可以把它想象成一个合唱团,最终的声音取决于许多声音一同歌唱。
人们可能会认为,最好的合唱团是每个歌手都相互独立的。但大脑揭示了一种更微妙、更精妙的设计。一个神经元放电中的噪声,或随机波动,通常与其邻近神经元的噪声相关。人们可能会认为这种噪声相关性总是不好的,会使群体的信息变得冗余。然而,事实却出人意料地与直觉相反。
考虑两个具有相似“品味”的神经元——例如,它们都对向上的运动感到兴奋。在这种情况下,如果它们的噪声是相关的(它们倾向于一起随机放电),就很难判断它们的联合活动是由于刺激还是仅仅是一次共享的噪声脉冲。在这种情况下,相关性确实是有害的。但是现在,考虑两个具有相反品味的神经元——一个对向上运动兴奋,另一个对向下运动兴奋。如果一个表示“向上”的信号到达,第一个神经元的放电率会增加,而第二个神经元的放电率会减少。如果这两个神经元的噪声呈正相关(它们倾向于一起随机增加或减少放电),下游神经元可以施展一个巧妙的技巧:通过将一个神经元的活动减去另一个神经元的活动,它可以抵消共同的噪声,同时放大差异信号。在这种情况下,噪声相关性实际上改进了编码。这表明大脑不仅仅是独立处理器的集合,而是一个精细调谐的网络,其中甚至噪声的结构也为信息传输而优化。
我们已经看到了神经编码可能是什么,但这引出了一个更深层的问题:为什么是这些编码?大脑尽管神奇,但它是一个物理实体。它在严格的约束下运行,其中最严苛的约束就是能量。思考是昂贵的。大脑约占我们体重的2%,却消耗了我们高达20%的代谢能量。每一个动作电位都有成本。
让我们追溯这个成本的物理根源。一个脉冲涉及打开通道让钠离子()涌入神经元。为了为下一次脉冲重置,神经元必须主动将这些离子泵出。这是由一种称为钠钾泵的分子机器完成的,它水解一个ATP分子——细胞的能量货币——以排出三个钠离子。在一次脉冲期间涌入的电荷量与神经元的膜电容()和脉冲的电压摆幅()有关。将所有因素综合起来,并考虑一些生物物理效率低下的因素(),单个脉冲的成本可以从第一性原理推导出来:,其中 是电子的基本电荷。
这个严苛的代谢预算为大脑每秒能承受的脉冲总数设定了硬性上限。这就是高效编码假说背后的核心思想:大脑进化出了能够最大化其传递的关于世界的信息量,同时最小化所需脉冲数量和能量消耗的神经编码。
实现这种效率最强大的策略之一是稀疏编码。在稀疏编码中,对于任何给定的刺激,群体中只有极小一部分神经元是活跃的。这与密集编码形成对比,在密集编码中,大多数神经元都会响应。稀疏编码本质上是节能的。它特别适合自然世界的统计特性。例如,自然场景充满了冗余——大片的平滑颜色或纹理。有趣、信息丰富的部分是稀有特征,如边缘或角落。稀疏编码方案将其有限的资源专门用于只对这些重要特征发信号,其余时间保持沉默,从而节省宝贵的能量。
现代神经科学中最深刻的思想或许是这些原理的综合。它表明,大脑不是感觉信息的被动编码器,而是一个主动、动态的预测机器。这是贝叶斯大脑假说的核心。它假设大脑建立并维护一个世界的内部生成模型——一套关于环境中隐藏原因如何产生感觉数据的概率信念。知觉不是从原始像素构建画面的过程;它是一个推断的过程,是寻找最可能的原因来解释传入的感觉流的过程。大脑在不断地问:“根据我对世界的先验信念,以及这个新的感觉证据,外面最可能存在的是什么?”
大脑如何可能实现如此复杂的方案?领先的候选算法是预测编码。在这个框架中,大脑的层级结构像一个预测和误差修正的级联瀑布一样工作。
整个系统的目标是不断更新其内部信念(生成模型),以随时间推移最小化预测误差。当预测误差为零时,大脑的模型就完美地解释了感觉世界。
这个框架因多种原因而显得优雅。它自然地解释了冗余,从而满足了高效编码假说的要求。为什么要浪费能量发送关于已知和已预测事物的信号?只有新闻——即意外——才值得传输。此外,这种误差加权过程并非临时性的。预测误差的影响力会根据其精确度(其方差的倒数,或其可靠性)进行缩放。来自清晰、可靠信号(如高对比度视觉)的误差被赋予比来自嘈杂、不可靠信号(如微弱的耳语)的误差更大的权重。这种精确度加权不是生物学上的怪癖;它是执行最优贝叶斯推断的直接且必然的结果。
在这个宏大的视角下,神经编码不仅仅是对世界的描述,它本身就是推断的语言。大脑的脉冲——它们的速率、时间和群体动力学——是预测和误差的载体,是信念更新的真正货币。通过这种持续的、递归的预测与修正之舞,大脑使用其简单的字母表谱写出一个连贯、稳定且极其智能的现实模型。
几个世纪以来,大脑的内部运作一直是一个“黑箱”。我们可以观察到通过感官输入了什么,以及通过行为输出了什么,但介于两者之间的过程——数十亿神经元产生思想、知觉和行动的复杂舞蹈——却是一个深奥的谜。神经编码的原理为我们提供了打开这个黑箱的钥匙。通过开始理解大脑的母语,我们不再仅仅是外部观察者;我们正在学习与之对话。
这种新发现的对话不仅仅是一项学术活动。它让我们能够探究关于我们如何感知世界的深层问题,设计能够恢复丧失的感觉和能力的技术,构建全新类型的智能机器,甚至直面我们自身意识的哲学和伦理维度。让我们来浏览一些这些引人入胜的应用,看看神经编码的简单规则如何绽放出对心智的丰富而统一的理解。
源源不断的光子、压力波和化学分子流是如何转变为我们所体验到的生动、连贯的世界的?事实证明,大脑是一位解读大师,而神经编码就是它的词典。不同的感觉系统进化出了极为不同但又互补的编码策略。
以听觉为例。我们内耳中的耳蜗不是一个简单的麦克风;它是一位杰出的物理学家。它进行实时傅里叶分析(Fourier analysis),将复杂的声音分解为其组成频率。大脑随后采用一种巧妙的双重策略来表征音高。对于高频声音,它使用位置编码:就像钢琴上不同的琴键产生不同的音符一样,声波引起的振动会在耳蜗基底膜上不同物理位置达到峰值。因此,连接到每个位置的神经元被调谐到特定的高频。但对于低频声音,大脑利用了另一个维度:时间。单个神经元,或以“齐射”方式协同放电的神经元群,将其放电锁定在声波的特定相位上。这种时间编码在人类语音和音乐结构最丰富的范围内提供了极其精确的音高信息。大脑并非被迫在两种编码中择其一;它两者兼用,将位置编码的“何处”与时间编码的“何时”无缝融合,赋予我们完整、丰富的声学世界感知。
我们的触觉也讲述了一个类似的神经协作故事。你的指尖如何区分丝绸的细腻纹理和砂纸的粗糙质地?这并非因为有一个“丝绸感受器”和一个“砂纸感受器”。相反,大脑倾听着整个机械感受器“交响乐团”的声音,每个感受器都有不同的响应特性。一些对变化的刺激快速适应(RA),比如扫描精细纹理时产生的振动,而另一些则缓慢适应(SA),传递持续的压力信号。纹理的感知源于整个群体活动的相对模式。
我们可以在一个奇特的触觉错觉中看到这一原理的作用。如果你用力搓手一分钟,你会暂时耗尽或使快速适应(RA)感受器适应。然后如果你触摸一张光滑的纸,它会感觉异常粗糙,像羊皮纸一样。为什么?因为大脑对“光滑”的解读依赖于来自RA和SA群体的特定信号平衡。通过选择性地抑制RA输入,你向大脑发送了一个它通常与更粗糙表面相关联的神经模式。这个错觉是一个绝佳的证明,表明知觉并非对现实的直接读取,而是对神经编码的解读。同样是群体编码的理念,即汇集许多神经元的集体“投票”,使我们能够辨别出压在皮肤上的边缘方向等精确特征。
当我们考虑疼痛和温度等感觉时,情况变得更加复杂。是否存在一条简单的“疼痛专线”,一旦激活就总是被解释为疼痛——即所谓的标记线编码?还是说疼痛也源于一种更复杂的跨纤维模式编码?后者的证据来自另一个引人注目的现象:热栅格错觉。如果你触摸一个由交替的、本身不致痛的温棒和凉棒组成的栅格,你会感觉到一种矛盾的、有时甚至是痛苦的灼烧感。这两种刺激本身都不痛苦,但它们特定的空间模式却产生了一种新奇而不愉快的知觉。这表明中枢神经系统正在对来自多个感觉通道的输入进行复杂的计算,最终的感觉源于它们的相互作用,而非来自单一的标记线。
如果我们能读取神经编码,我们能否用它来为那些丧失功能的人恢复功能?这就是脑机接口(BCI)带来的变革性希望。对于瘫痪的个体,脑机接口提供了将意图与行动重新连接的希望。
大脑运动皮层中控制自主运动的神经元表现出所谓的“调谐曲线”。某个神经元可能在计划向右移动手臂时放电最强烈,在向上偏右移动时稍弱,而在向左移动时则很少放电。虽然单个神经元的信号是模糊的,但通过监听数百个此类神经元的整个群体的活动,计算机可以很好地猜测出用户的意图。
简单而强大的解码算法,如群体向量法,将每个神经元视为对其偏好方向投出的一“票”,票的权重由其放电率决定。解码出的运动就是所有这些投票的向量和。更复杂的方法,如最大似然解码,则使用神经元响应的精确统计模型来计算哪个意图运动最可能是观察到的神经活动模式的原因。这些算法实时运行,可以将神经脉冲的原始语言翻译成控制机械臂或计算机光标的信号。
这样的系统能工作得多好?我们如何量化神经编码本身的质量?在这里,我们通过一个名为费雪信息(Fisher Information)的概念,发现了与信息论领域的美妙联系。对于一个给定的神经元,费雪信息以一种数学上精确的方式告诉我们,它的放电率提供了多少关于刺激——在这里是运动方向——的信息。它使我们能够计算出一个理论极限,即克拉默-拉奥下界(Cramér-Rao Lower Bound),来限定我们解码信号可能达到的最佳程度。分析揭示了一个极其简单而深刻的标度律:潜在的解码精度随着我们监听的神经元数量的平方根()而提高。这一定律不仅解释了为什么大脑本身依赖大量神经元群体进行精确控制,也为脑机接口工程师提供了一个明确的原则:更多的神经元意味着更好的性能。
大自然是一位效率惊人的工程师。人脑执行的计算让现代超级计算机相形见绌,而其运行功率仅约20瓦特——相当于一个昏暗灯泡所需的电量。它是如何实现这一点的?答案的一个关键部分在于神经编码的稀疏、事件驱动特性。
大多数神经元在大部分时间里是沉默的。它们只在有新的、重要信息要报告时才发放一个脉冲——一个“事件”。这与传统计算机芯片形成鲜明对比,后者的中央时钟要求所有晶体管每秒切换状态数十亿次,无论它们是否在做有用的工作。这种持续的、同步的活动消耗了巨大的能量。
受大脑效率的启发,一个名为神经形态工程的新领域正在构建模仿这一原理的计算机硬件。在一个称为地址-事件表示(AER)的方案中,芯片上的硅“神经元”进行异步通信。当一个神经元放电时,它会发送一个包含其唯一“地址”的数字数据包。没有全局时钟。通信只在需要时、在需要的地方发生。这种数据驱动的方法极大地降低了功耗,同样重要的是,它内在地保留了脉冲的精确时间——我们已经看到,这个特性对于在大脑的时间编码中携带信息至关重要。通过采用大脑自身的编码策略,我们正在学习构建一类新型的、低功耗的智能设备。
神经编码的原理能否带我们超越知觉和行动,进入抽象思维、信念甚至意识本身的领域?越来越多的神经科学家相信答案是肯定的。
现代认知神经科学中最具影响力的思想之一是预测编码理论,该理论将大脑描绘成一个主动的、生成预测的机器,而非感觉信息的被动接收者。根据这一观点,大脑不断利用其对世界的内部模型来预测它应该接收到的下一个感觉输入。沿感觉通路上传的不是原始数据本身,而是*预测误差*——大脑的预测与实际输入之间的差异。大脑的目标仅仅是随时间推移最小化这个预测误差,它通过更新其内部模型或通过作用于世界使世界与预测相匹配来实现这一目标。
这个框架做出了具体的、可检验的预测。例如,想象你正试图估计一个呈现在嘈杂屏幕上的线条的方向。该理论假设你的大脑会结合其先验信念(也许是线条通常是垂直的)和嘈杂的感觉证据。如果我们增加噪声,使得感觉证据的可靠性降低(即降低其“精确度”),你的大脑应该会更严重地依赖其先验信念。与直觉相反的是,预测编码模型还预测,代表预测误差的神经信号实际上应该会减小。这是因为误差信号本身是根据它们所基于的信息的精确度来加权的。一个低精确度的误差,在某种意义上,被“喊”得不那么响亮。旨在精确检验这类情景的实验正在为“大脑是一个贝叶斯推断引擎”这一观点提供令人信服的证据。
也许最终的问题是,神经编码能否阐明意识的本质。关于意识体验背后的神经活动,有什么特别之处吗?像全局神经工作空间(GNW)这样的理论提出,要让一条信息变得有意识,它必须从感觉区域“广播”到额叶和顶叶中广泛的高级联想区域网络。该理论认为,这种全局性的点燃创造了一个稳定、持续的活动模式,将信息保存在一个心理工作空间中,使其可用于口头报告、推理和记忆。相比之下,无意识的信息可能只在感觉皮层中触发一个短暂、快速衰减的活动波,而从未实现这种全局广播。
这不仅仅是一个哲学思想;它是一个可检验的科学假说。利用先进的大脑成像和解码技术,我们可以探测神经编码的时间动态。我们可以问:一个刺激的“表征几何”——即对不同输入的神经响应之间的关系模式——是否随时间保持稳定?GNW模型预测,对于一个被有意识感知的刺激,我们应该会发现这样一个稳定、持续的编码在处理流的后期出现,而一个无意识的刺激应该只产生一个短暂、演变且迅速消失的编码。寻找这种意识的标志是科学中最令人兴奋的前沿之一。
随着我们对大脑密码的探索之旅继续,我们发现自己处于另一个前沿——一个神经伦理学的前沿。随着我们解码神经信号能力的提高,我们必须努力应对关于隐私和自主权的深刻问题。如果一个脑机接口能将内心独白翻译成文字,我们在思考时就必须格外小心。区分三个概念很有用。数据安全指的是用于保护数据不被窃取的技术措施,如加密。信息隐私是控制个人信息如何被收集、使用和分享的权利。但精神隐私可以说是一项更基本的权利:保持个人思想、感情和精神状态本身免于被观察的权利。即使在完全同意和完美的数据安全保障下,解码大脑信号的行为本身也跨越了精神隐私的界限。随着我们对大脑语言越来越流利,制定一个明智和人道的伦理框架的挑战将与科学挑战本身一样巨大。
从单个神经元的放电到有意识思维的宏伟交响乐,神经编码的原理提供了一条统一的线索。大脑的语言并非任意的;它经过亿万年的进化塑造,变得代谢高效、对噪声鲁棒且极具表现力。这是一种关于模式与群体、空间与时间、预测与误差的语言。在学习说这门语言的过程中,我们不仅在构建非凡的新技术——我们也在逐渐理解我们自己。