
大脑如何将经验铭刻在其物理结构中,将短暂的瞬间转化为持久的记忆?几十年来,神经结构被视为一个固定的支架,但一个革命性的思想重塑了我们对学习和适应的理解。这一范式转变由心理学家 Donald Hebb 推动,他为神经可塑性提出了一个简单而深刻的原则,解决了神经元之间的连接如何动态变化以存储信息的问题。本文将踏上一段理解这一原则的旅程。在“原理与机制”一节中,我们将解析“共同激活的细胞连接在一起”的核心概念,将其转化为数学语言,并探讨如脉冲时间依赖可塑性 (STDP) 等关键改进。该部分还将直面该规则固有的不稳定性以及大脑为维持平衡而采用的精妙解决方案。随后,“应用与跨学科联系”一节将揭示这一单一原则如何支撑从大脑发育和记忆巩固到神经康复及现代人工智能架构的方方面面。
要真正领会思想与记忆之舞,我们必须审视其表演的舞台:神经元之间错综复杂的连接网络。很长一段时间里,这个舞台被认为是静态的,是一个固定的支架,心智的电戏剧在其上展开。革命源于一个看似简单的想法,一个如此优雅而强大的原则,至今仍是我们理解大脑如何学习、适应和记忆的基石。
想象一下你身处一个巨大而拥挤的图书馆,每个人都代表一个神经元。大多数人都在低声私语,但偶尔会有一个人,我们称他为 Alex,清晰地说出一个句子。片刻之后,房间另一头的另一个人 Beatrice 惊呼:“我明白了!”如果这个序列——Alex 说话,然后 Beatrice 惊呼——一遍又一遍地发生,你自然会推断出一种联系。你会在听到 Alex 声音的瞬间开始预料 Beatrice 的惊呼。在你自己的脑海中,Alex 和 Beatrice 之间的联系已经加强了。
这就是加拿大心理学家 Donald Hebb 在其 1949 年的著作《行为的组织》(The Organization of Behavior)中提出的原则的精髓。Hebb 假定,大脑中的物理连接并非固定不变,而是具有可塑性或可变性的。他的想法,现在被著名地概括为“共同激活的细胞连接在一起”,与旧有的大脑是静态交换台的观点大相径庭。Hebb 为这种可塑性提出了一个机制:“当细胞A的轴突离细胞B足够近,并反复或持续地参与其放电时,一个或两个细胞中会发生某种生长过程或代谢变化,从而使得A作为激发B的细胞之一的效率得以提高。”
简单来说,如果一个突触前神经元 (Alex) 持续帮助一个突触后神经元 (Beatrice) 产生动作电位,那么它们之间的突触——即功能性连接——将会变得更强。这种强化的连接使得 Alex 未来的信号更有可能再次促使 Beatrice 放电。这是一种强化规则,是大脑将经验模式铭刻在其结构中的一种方式。
Hebb 的想法在其简单性中显得优美,但要探索其后果,我们必须将其转化为数学语言。让我们用 表示突触前神经元 的放电率,用 表示突触后神经元的放电率。它们连接的强度是一个我们称之为突触权重()的数字。权重越大意味着连接越强。
“共同激活,共同连接”的原则可以用一个简单的乘积来表示。突触权重的变化率,我们可以写成 ,与突触前神经元的放电率乘以突触后神经元的放电率成正比:
这里,(希腊字母 eta)是一个小的正数,称为学习率,它控制权重变化的快慢。这个方程是相关性的数学表述。如果两个神经元同时高度活跃( 和 都是大的正数),它们的乘积就大且为正,权重 就会增长。如果任一神经元不活跃,乘积为零,学习就不会发生。这个基本规则为神经元提供了一个强大的机制,使其能够学习哪些输入与其自身的输出最相关。
简单的赫布法则虽然优雅,但忽略了一个微妙而关键的因素:因果关系。是谁先放电有关系吗?再想想我们的图书馆。如果 Beatrice 在 Alex 说出他的句子之前惊呼“我明白了!”,你不会断定是 Alex 导致了她的理解。你会认为没有直接的因果联系。
事实证明,大脑同样具有辨别力。在 Hebb 之后的几十年里,实验揭示了大脑对神经脉冲时间的精妙敏感性,这一现象被称为脉冲时间依赖可塑性 (STDP)。STDP 是对赫布法则的精炼,它明确地包含了放电的顺序。
规则如下:
如果突触前神经元在突触后神经元之前几毫秒放电,从而对突触后脉冲有因果贡献,突触就会被加强。这种加强被称为长时程增强 (LTP)。对于非常短的延迟,这种效应最强,例如,在突触后脉冲前约15毫秒出现的突触前脉冲可能会诱导最大程度的增强。
相反,如果突触后神经元在突触前神经元之前放电,突触就会被削弱。这种削弱被称为长时程抑制 (LTD)。这种“反因果”或非因果的配对表明该突触是无效或无关的,因此它被修剪掉了。
STDP 告诉我们,大脑不仅仅是一个简单的相关性检测器。它是一个因果关系检测器,不断调整其连接以反映哪些神经元是其他神经元的有效驱动者。它加强那些“有意义”的路径,削弱那些没有意义的路径。
尽管纯粹的赫布学习系统非常优雅,但它也有其阴暗面。它是一个建立在正反馈基础上的系统。一个强的突触使突触后神经元更容易放电,而其放电反过来又使突触变得更强。这是一种“富者愈富”的模式。
当一个正反馈循环没有制动时会发生什么?想象一个麦克风离它自己的扬声器太近。一个微小的低语被拾取、放大,并由扬声器播出。这个更响亮的声音随后又被麦克风拾取,再次放大,如此循环。在不到一秒钟的时间里,你就会听到一阵震耳欲聋的高频尖啸声——一个使系统饱和的音频反馈回路。
一个仅由赫布学习支配的神经网络面临着类似的命运,这是一个被称为赫布灾难的理论问题。突触权重会爆炸性增长,导致神经元一直以其最大速率放电。网络将变成一片饱和活动的嘈杂声,失去所有表示细微信息的能力。这种允许学习的机制,如果放任不管,就会导致计算上的混乱。为了让大脑既具有可塑性又保持稳定,必须有一种制衡的力量。
大自然以其智慧,发展出了几种施加制动和稳定学习的方法。这些机制确保当一些突触增长时,另一些突触会收缩,从而引入一种竞争形式,并控制整体活动。
一个在数学上非常优美的解决方案是Oja法则。它通过添加一个与权重自身强度成正比的“遗忘”项,巧妙地修改了赫布方程。该法则如下:
第一项 是我们熟悉的驱动学习和增长的赫布部分。第二项 是稳定力量。它告诉突触要按其自身权重 () 的比例衰减,并且这种衰减由突触后活动 () 所门控。当一个神经元变得非常活跃时,这个稳定项会强烈地启动,迫使其最强的突触进行自我缩减。这可以防止任何单个突触占主导地位,并有效地迫使进入该神经元的总突触强度保持恒定。这是一个局部的、优雅的数学技巧,用以对突触资源实施预算。
虽然Oja法则提供了一个强大的理论模型,但大脑似乎使用了一种更分布式、更具生物学基础的策略:稳态。稳态的目标是确保每个神经元维持一个稳定的长期平均放电率,就像一个神经活动的恒温器。如果一个神经元在很长一段时间内开始放电过多或过少,稳态机制会温和地将其推回到其首选的“设定点”。这至少通过两种非凡的过程实现。
稳态突触缩放: 想象一个神经元发现自己变得过度活跃,因为其经过赫布增强的输入让它不堪重负。在数小时到数天的时间里,它可以触发一个内部过程,将其所有传入突触权重按一个共同因子进行乘法缩减。相反,如果一个神经元变得过于安静,它会将它们全部放大。这是一个绝妙的策略,因为它调整了神经元的整体“音量”,而没有抹去其突触权重的相对模式——这正是赫布可塑性努力存储的信息。
内在可塑性: 除了调整其突触,神经元还可以改变自身。它可以改变其膜上的离子通道数量,从而有效地改变自身的兴奋性。例如,它可以使自己变得更“漏电”或提高其放电阈值,需要更强的输入信号才能产生动作电位。
这个故事最深刻的部分是时间尺度的相互作用。赫布和类STDP的变化是快速的,作用于毫秒到分钟的时间尺度,捕捉持续经验中稍纵即逝的相关性。相比之下,稳态可塑性非常缓慢,作用于数小时甚至数天。这种时间尺度分离是实现可塑性与稳定性的关键。快速的赫布规则可以自由地快速编码新信息,而缓慢的稳态机制则像一个温和的监督力量,确保整个系统不会失控。这是在快速、不稳定的学习与缓慢、稳定的调节之间一场惊人优雅的舞蹈——这种设计使我们的大脑能够在我们的一生中保持无尽的适应性,同时又可靠地稳定。
我们已经探讨了“共同激活的神经元连接在一起”的原则。乍一看,这个由 Donald Hebb 作出的伟大贡献的陈述,似乎简单得有些欺骗性。它是一个局部规则,是两个相邻细胞之间的私下协议。然而,就像一把简单的钥匙能打开众多不同的锁一样,这一个想法开启了横跨科学广阔领域的大门,从医学到工程学。它揭示了一个深刻的真理:自然界通常不是通过详细的全局蓝图,而是通过耐心、重复地应用简单的局部规则来构建其最宏伟、最复杂的结构。让我们进行一次游览,看看这些门后隐藏的奇迹。
拥有数以百兆计连接的大脑,其复杂得令人难以置信的布线是如何形成的?人们可能会想象一位建筑师拿着一张巨大的蓝图,指定每一根电线的走向。然而,正如赫布原则所揭示的,真相远比这更为优雅。大脑在很大程度上是自我布线的。
思考一下发育中的视觉系统。在婴儿睁开眼睛看世界之前很久,大脑就已经在练习了。自发的活动爆发,称为“视网膜波”,像池塘上的涟漪一样扫过视网膜。这些波不是随机噪声;它们是有模式的。物理上彼此靠近的神经元往往会被同一波共同激活。现在,想象两个这样的相邻视网膜神经元将其连接发送到大脑中一个称为丘脑的目标细胞。因为它们共同放电,赫布法则规定它们与共享目标细胞的连接将被加强。相比之下,来自一个遥远视网膜细胞或另一只眼睛的连接将在不同时间放电。它的活动是不相关的。完整的规则表明,不相关的连接会被削弱并最终被消除。
结果是一个美丽的塑造过程。大脑从过量的弥散连接开始,并在这种自发活动的相互关联模式的引导下,修剪掉那些不“合拍”的连接,留下一个精炼的、视网膜的拓扑图。这位“雕塑家”不是添加黏土,而是凿掉不需要的部分。这种基于相关性的竞争性学习原则是如此基本,以至于它甚至解释了来自两只眼睛的输入(它们是独立活跃的)如何在大脑中分化成不同的区域,这个过程被称为眼特异性分离。
这种自布线能力不仅用于初始发育;它也是我们康复和愈合中最大的财富。当神经系统受损时,例如由于中风或脊髓损伤,蓝图就被打破了。大脑不会就此放弃。相反,它会尝试长出新的连接,以绕过损伤。在这里,赫布原则是康复的指路明灯。
想象一下在中风导致手部功能受损后的两种物理疗法。一种疗法涉及非特异性强化,如反复挤压一个球。这肯定会使肌肉更强壮。另一种涉及任务特异性训练:反复练习伸手、抓握和操纵一个物体的复杂、目标导向的序列。神经科学家发现,只有第二种训练才能带来真正的技能恢复和大脑自身图谱的重组。为什么?因为任务特异性训练迫使正确的感觉和运动神经元组以精确的时间、相关的方式“共同激活”。根据赫布法则,这种特定的活动模式加强了有用的神经通路,使它们在竞争中胜出并稳定下来,而非特异性活动对重新训练大脑回路的作用微乎其微。类似的逻辑也适用于从脊髓损伤中恢复,其中任务特异性康复通过反复将发芽的神经纤维与其目标运动池共同激活,来鼓励它们形成功能性连接,从而引导重新布线过程以恢复功能。
这为未来的治疗性神经工程学打开了一扇门。如果我们理解“连接在一起”的规则,也许我们就能主动地施加这些规则。科学家们正在探索使用模式化电刺激来引导再生轴突到达其正确目标的方案。通过人为地创造我们已知的驱动突触加强的“突触前先于突触后放电”序列,我们或许能够促使一根被切断的神经找到其旧伙伴,并重建一个断裂的回路 [@problem-id:4453124]。
赫布法则不仅适用于布线图;它也是记忆本身的基础。我们的头脑中包含不同种类的记忆,它们存在于不同的神经“房屋”中。像“巴黎是法国的首都”这样的事实记忆,被称为“陈述性”记忆。像如何骑自行车这样的技能记忆,是一种“程序性”记忆。这些系统非常独立。这就是为什么一个失忆症患者可能不记得自己的名字,却仍然能流畅地弹奏钢琴。
现代神经科学,尤其是在重度抑郁症等精神疾病的研究中发现,这些不同的记忆系统可能会受到选择性损伤。患者可能在陈述性记忆任务(严重依赖一个称为海马体的大脑结构)上遇到困难,而他们的程序性记忆(依赖于基底节和小脑)却完好无损。如果我们认识到记忆不是一个单一的实体,而是突触可塑性——即赫布学习——在为不同工作专门化的不同回路中运作的结果,那么这种分离就完全说得通了。
记忆故事中一个特别美丽的篇章是“巩固”,即脆弱的短期记忆转化为稳定的长期记忆的过程。海马体作为一个快速学习者,是一种记录当天事件的临时便笺。大脑的广阔外层——新皮层——则是一个更慢、更稳定的长期存储介质。那么信息是如何从便笺转移到硬盘的呢?答案似乎是:在睡眠期间。
在深度睡眠期间,海马体会“重放”最近经历的神经活动模式。这些重放是“共同激活”信号的爆发,从海马体发送到皮层。每一次重放事件都是一堂微小的课,是赫布学习的一次迭代,它会非常轻微地加强皮层内部的连接。经过一整晚,通过成千上万次这样的重放事件,记忆被逐渐转移,铭刻在皮层结构中,从而使海马体得以在第二天学习新事物。海马体是老师,皮层是学生,而睡眠是必不可少的学习时间。
到目前为止,我们一直将赫布法则视为两个神经元之间的私事。但没有哪个神经元是一座孤岛。加强或削弱一个突触的决定受到更广泛的网络和大脑整体状态的调节。这不仅仅是二重唱;它是一个管弦乐队,并且有一位指挥。
一类指挥是胶质细胞,特别是星形胶质细胞,它们曾被认为是单纯的支持细胞。事实证明,它们是对话的积极参与者。神经调质,如在兴奋或注意状态下释放的去甲肾上腺素等化学物质,可以激活星形胶质细胞。星形胶质细胞反过来会释放它们自己的化学信号,这些信号可以覆盖一个局部的突触群体。这些信号的作用不是传递信息,而是改变突触的“学习率”。它们在可塑性规则中充当“第三个因素”。权重变化 不再仅仅与突触前和突触后活动 成正比,而是与它们的乘积乘以一个调制信号 成正比:。这使得大脑能够门控可塑性,在发生重要或令人惊讶的事情时调高学习的音量。
这引出了一个更深层次的全局秩序问题。赫布学习是一个正反馈循环:强的突触变得更强,这使它们更多地放电,从而使它们变得更强。如果不加控制,这将是一个失控的过程,导致网络中所有突触都饱和,活动呈癫痫样。大脑如何维持稳定?它似乎有另一条更慢的规则与之对抗:稳态可塑性。这条规则像每个神经元的恒温器一样工作。如果一个神经元的平均活动过高,它会按比例缩小其所有传入连接;如果过低,则会按比例放大它们。
快速、不稳定的赫布学习与缓慢、稳定的稳态可塑性之间的相互作用是一场美丽的舞蹈。它允许网络“自组织”成一种称为“临界状态”的特殊状态。一个临界系统是平衡在秩序与混沌之间的刀刃上的系统,这种状态被认为是计算和信息传输的最佳状态。网络不是通过一个主控制器,而是通过这两种简单的局部规则的相互作用,将自身调整到这个完美的状态。
赫布法则的优雅和力量并未被计算先驱们所忽视。一种存储在网络连接中、并能从部分线索中检索出来的记忆,是“联想记忆”的基础。在20世纪80年代,John Hopfield 开发了一个神经网络的数学模型,这是赫布思想的直接体现。在 Hopfield 网络中,模式通过根据两个神经元在这些模式中活动的相互关系来设置它们之间的连接权重来存储:,其中 是第 个模式。
这个规则创造了一个“能量景观”,其中存储的记忆是稳定的山谷,或称“吸引子”。如果你将网络从一个存储记忆的嘈杂或不完整版本的状态开始,网络动力学将导致状态“滚下山”到最近的山谷底部,从而检索出完整、清晰的记忆。这个源于简单生物学假设的强大概念,几十年来一直是人工神经网络和机器学习的基石。
事实上,赫布学习的精神推动了现代人工智能中的一项宏大挑战。当今最成功的人工智能系统——深度神经网络,通常使用一种称为反向传播的算法进行训练,该算法需要一个全局误差信号向后通过网络发送,以精确地告诉每个突触如何改变。然而,大脑似乎没有这样的机制。它进行局部学习。这激发了对能够像大脑一样学习的“神经形态”计算架构的探索。其思想是堆叠多层“神经元”,每一层都使用局部的、类赫布规则来发现其输入中的统计规律。第一层,观察原始数据,可能会学习检测像边缘这样的简单特征。下一层,观察第一层的输出,学习将边缘组合成角和纹理。再下一层将纹理组合成物体部分,依此类推。通过这种方式,可以在没有任何全局教师的情况下,自下而上地建立一个复杂、层级化的世界表示。
从发育中大脑的自组织之舞到对真正人工智能的追求,Donald Hebb 的简单假设是持续存在的、生成性的主题。它证明了自然界中一个深刻的原则:从简单的局部相互作用中,可以产生难以想象的复杂而美丽的秩序。