
记忆的核心是变化的体现——一种持久的物理改变,它存储着来自过去的信息以指引未来。几个世纪以来,这个概念仅限于生物学和哲学领域,但今天,它代表了一个神经科学、物理学和工程学交汇的活跃前沿。传统计算机存储器以其僵化的二进制逻辑,与大脑高效、自适应且错综复杂的学习机制形成了鲜明对比。本文旨在弥合这一差距,探索我们大脑中支配记忆的原理如何激发一场计算领域的革命。
在接下来的章节中,您将踏上一段从神经元到晶体管的旅程。首先,“原理与机制”将揭示记忆的生物学基础,从突触可塑性的舞蹈、NMDA受体的关键作用,到大脑管理多种记忆系统的复杂策略。然后,“应用与跨学科联系”将展示这些生物学蓝图如何被用于工程化新兴存储器(如忆阻器和RRAM),创造出以全新方式学习和计算的神经形态系统,并揭示在自然与技术中发现的挑战与解决方案之间深刻的统一性。
谈论记忆,就是谈论变化。不是池塘上涟漪的短暂变化,而是在记忆系统本身的结构中发生的持久的物理改变。几个世纪以来,这只是一个哲学概念。如今,它已成为科学的前沿,是生物学、物理学和工程学交汇的地方。我们深入记忆核心的旅程,并非始于计算机,而是始于我们头脑中那令人惊叹的、优雅而复杂的机制。
想象一下,大脑不是一块静态的、预先布线的电路板,而是一片广阔而迷人的森林。树木是神经细胞,即神经元,它们缠结的枝干是彼此之间的连接。记忆并非某个储存在细胞文件柜中的独立物体。相反,记忆就是这片森林。它是特定的路径模式,是连接的强度,是电信号之风吹拂林冠的方式。学习新事物,就是开辟一条新路,加固一条小径,改变森林本身的地貌。大脑连接的这种改变和适应的非凡能力,神经科学家称之为可塑性。
如果我们放大这些神经树的枝干,会发现它们并非光滑。它们布满了无数微小的、蘑菇状的突起,称为树突棘。这些是监听站,是一个神经元通过一个称为突触的微小间隙从另一个神经元接收信号的精确位置。神奇之处在于:这些棘并非固定不变。它们是有生命的。它们可以变大变强,也可以缩小变弱,甚至可以完全出现和消失。记忆通过这些微小棘刺的结构重塑被物理地刻印在大脑中,这一过程由细胞内部的支架——肌动蛋白细胞骨架所支持。如果这个细胞骨架被固定住,阻止棘的形状或数量发生任何变化,大脑形成新的持久记忆的能力将受到严重削弱。从某种真实意义上说,学习将会停止。
但是,是什么在编排这场生长与衰退的精妙舞蹈?突触是如何“知道”何时应该变得更强?大自然设计出一种令人叹为观止的优雅机制,其核心是一种特殊的分子守门员,称为NMDA受体。在大多数突触中,主要信号由神经递质谷氨酸传递,它会打开一种名为AMPA受体的通道,让正离子迅速涌入。紧邻其旁的NMDA受体也是一个正离子通道,但它有一个独特的怪癖:在神经元正常的静息电压下,它的通道被一个镁离子()堵塞,就像瓶子里的软木塞。
要让NMDA受体打开,必须同时发生两件事:首先,谷氨酸必须与之结合(突触前神经元已放电);其次,突触后神经元必须已经被强烈激活,即去极化,这会通过电作用排斥镁离子软木塞,从而打开通道。它是一个符合检测器。它只在发送信号的神经元和接收信号的神经元同时活跃时才会打开。这正是Donald Hebb提出的著名原则的分子体现:“共同放电的细胞连接在一起。”
当NMDA通道最终打开时,它允许一个关键的信使流入细胞:钙离子()。钙离子的涌入引发了一连串的生化反应,最终导致突触的增强,这一过程称为长时程增强(LTP)。其物理结果是一个更大、更强健的树突棘,上面有更多的AMPA受体,使其对未来的信号更加敏感。这种分子机制与学习之间的联系并非假设。在实验中,当海马体(一个对记忆至关重要的脑区)中的NMDA受体被基因禁用后,动物变得无法学习新的空间任务,例如在水池中找到隐藏平台的位置。从单个分子的行为到整个生物体的学习,这条链条是完整的。
尽管这种突触机制非常优美,但它只是故事的一部分。大脑以其智慧意识到,并非所有信息都是相同的,因此它进化出了不同的、专门化的系统来处理不同种类的记忆。最著名的线索来自像著名的H.M.这样的病人,他在为治疗癫痫而接受海马体切除手术后,留下了一种奇怪而富有启示性的缺陷。他可以进行交谈,记得童年,甚至能学习新技能,但他完全无法形成关于事实或事件的新记忆。他被困在了一个永恒的当下。
这揭示了记忆结构中的一个根本划分。海马体是我们所说的陈述性记忆——关于“是什么”的记忆——的总设计师。这包括情景记忆(你生活中的事件,比如早餐吃了什么)和语义记忆(一般事实,比如法国的首都是哪里)。但还有另一整个类别,即程序性记忆,也就是关于“如何做”的记忆。这是关于技能、习惯和运动行为的知识,比如骑自行车或系鞋带。
想象一个海马体受损的病人在学习像汉诺塔这样的复杂谜题。日复一日,他们解决谜题的速度越来越快,效率越来越高。他们的表现显著提高。然而,每次向他们展示这个谜题时,他们都真诚地声称自己从未见过它。他们的双手记得他们有意识的大脑所不记得的东西。这是因为程序性学习不依赖于海马体。相反,它由一组不同的大脑结构来协调,主要是基底节和小脑。大脑包含多个并行的记忆系统,每个系统都为自己的特定工作量身定制。
此外,即使是陈述性记忆系统也不仅仅局限于海马体。它是一个由相互连接的结构组成的宏大环路的一部分。一个经典的例子来自韦尼克-科尔萨科夫综合征,这是一种由硫胺素缺乏引起的疾病,常见于慢性酒精中毒者。患者会出现与H.M.相似的严重顺行性遗忘症,但他们的海马体可能相对完好。相反,损伤发生在下丘脑的乳头体和丘脑的某些部分。这些结构是被称为帕佩兹回路网络中的关键中继站,该网络将信息从海马体,经由乳头体和丘脑,传递到扣带皮层,然后再返回。这个网络中任何关键节点的损伤都可能切断连接,有效地隔离海马体,并阻止新记忆的巩固。记忆不是一个地方,而是地方之间的对话。
这把我们引向一个深刻而美丽的悖论。如果记忆是通过增强突触来编码的,并且这种增强过程具有正反馈循环(更强的突触导致更多的活动,从而导致更强的突触),为什么系统不会失控?为什么学习一件新事物不会引发一场失控的增强级联反应,从而抹去所有旧的、精细平衡的模式?这被称为稳定性-可塑性困境。
大脑采用了至少两种非常聪明的策略来解决这个问题。第一种是元可塑性,即可塑性的可塑性。学习的规则不是固定的。神经元会对其自身的活动水平保持一个运行平均值。如果它变得长期过度活跃,它会调整其内部机制,使LTP更难被诱导,而长时程抑制(LTD)——即突触的减弱——则更容易。变化的阈值会上下滑动,以防止饱和。这是一种稳态的、自我调节的机制,仿佛在说:“这里有点太兴奋了,让我们冷静下来,暂时让连接更难增强”。
第二种策略是突触缩放。在一个更慢的时间尺度上,神经元对其活动进行一次全局普查。如果平均放电率偏高,它会合成一个信号,将所有兴奋性突触的强度按一个共同的乘法因子进行缩减,例如,将每个强度乘以。如果活动太低,它会将它们全部放大,乘以。这种乘法缩放的绝妙之处在于它保留了突触权重之间的比率。信息——已学习模式的旋律——得以保留,而整体音量则被调低(或调高)到一个舒适、稳定的水平。
最后,大脑的档案馆不是一个一次写入、多次读取的系统。它是一份活的文件。每次检索记忆时,它不只是像录音一样回放。回忆的行为可以使记忆痕迹暂时变得不稳定和可塑,神经科学家称之为不稳定状态。在这个不稳定窗口期,记忆可以被更新为新信息、被加强,甚至被削弱。这个过程被称为再巩固。例如,通过在创伤性恐惧记忆被重新激活后立即施用一种阻断肾上腺素类神经递质(如β-受体阻断剂)作用的药物,可以削弱该记忆。这表明记忆从根本上是一个动态的、重建的过程,更类似于讲故事,而不是读书。
几十年来,计算机内存一直与这种生物复杂性相去甚远。它是数字的、确定性的和无智能的。一个比特要么是1要么是0。但受大脑优雅原理的启发,工程师们现在正在创造一类新的新兴存储器,它们基于根本不同、类似大脑的原理运行。
这个新世界中的明星是忆阻器。作为继电阻、电容和电感之后的第四种基本无源电路元件,忆阻器本质上是一种带记忆的电阻。它在任何给定时刻的电阻取决于流过它的电流或电压的历史。一种常见的类型,阻变存储器(RRAM),通过在绝缘材料内形成和断开一根微小的导电细丝——只有几个原子宽——来工作。施加正电压脉冲可以创建或加厚这根细丝,从而降低器件的电阻(SET操作)。而负电压脉冲可以使其断裂,增加电阻(RESET操作)。
这听起来应该很熟悉。器件的电阻是一个模拟状态,很像突触的强度。细丝的形成与树突棘的生长惊人地相似。而且至关重要的是,这些器件表现出阈值。在施加的电压或电流超过特定值之前,什么都不会发生,一旦超过,开关就会突然发生。像TEAM(电流阈值)和VTEAM(电压阈值)这样的复杂模型,只是对这种行为的数学描述,与大脑NMDA受体的电压依赖性阈值直接类似。
这种新范式使我们能够以生物学的视角来提出工程问题。形成一个记忆的“代谢成本”是多少?我们可以直接计算一次写操作所需的能量。对于一个典型的RRAM单元,可能需要几个皮焦耳()。一个使用磁自旋来存储信息的MRAM单元可能更高效(),而一个熔化并重新凝固一小块相变材料的PCM单元可能需要更多能量()。这些能量值,以及它们如何随器件尺寸(通常与面积成比例)变化,是存储器设计的硬通货,决定着低功耗计算的未来。
但与生物学的类比甚至在其不完美之处也成立。正如我们的记忆会褪色或被扭曲一样,这些模拟器件也并非完美。读取忆阻器状态的行为本身就需要施加一个小电压,这会使微小的电流通过它。虽然一次读取几乎没有影响,但这种微小的扰动并非为零。经过数百万或数十亿次读取后,这些微小的推动会累积起来,导致器件的电阻状态发生漂移,直到它跨越到错误的状态,从而产生一个位错误。这种现象被称为读干扰。它在工程上等同于大脑的稳定性-可塑性困境:如何制造一种在你想改变时容易改变,而在你不想时又能保持不变的记忆。
在树突棘的舞蹈和导电细丝的漂移中,我们看到了深刻的统一性。记忆的原理——活动依赖性变化、阈值、稳定性与可塑性、专业化,甚至是不完美——并非生物学所独有。它们是复杂的自适应系统的基本属性。通过学习大脑的语言,我们终于开始建造不仅能计算,而且能学习的机器。
宇宙记忆信息的方式存在着深刻的统一性。从河流雕刻峡谷的缓慢地质记忆,到DNA链中编码的遗传记忆,再到片刻前交谈的短暂记忆,从过去汲取信息以启迪未来的原则,是编织在现实结构中的一根基本线索。在上一节中,我们探讨了从生物突触到新兴存储技术的记忆原理与机制。现在,我们将踏上一段更广阔的旅程,看看这些原理如何在广阔的知识领域中回响,从人脑错综复杂的结构到下一代计算机的设计。我们将发现,我们在构建人工记忆时面临的挑战和解决方案,往往是对大自然在亿万年间演化出的相同挑战和解决方案的优美反映。
在构建一台会思考的机器之前,明智的做法是看看我们已有的一个工作范例:人脑。神经科学为我们提供了最深刻的灵感来源,揭示了一个极其复杂的记忆系统。大脑并非拥有单一、庞大的记忆体;相反,它是一个由协同工作的专门化系统组成的共同体。
思考一下那些在接受癫痫治疗手术后,丧失了形成关于事实或事件的新长期记忆能力的病人的悲剧性但富有启发性的案例。他们可以进行交谈,但片刻之后便毫无印象。他们能记得童年,却记不得早餐吃了什么。我们了解到,损伤发生在大脑深处一个形似海马的结构,称为海马体。然而,值得注意的是,这些病人却能学习新的运动技能,比如画出在镜子中看到的图形,日复一日地练习并不断进步,而他们自己却始终有意识地认为这是第一次尝试这项任务。
这告诉了我们一件宏伟的事情:大自然对记忆进行了划分。海马体对于我们所说的“知其然”(knowing what)——即事实和事件的陈述性记忆——至关重要。但另一个系统则负责“知其所以然”(knowing how)——即技能的程序性记忆。这个系统涉及不同的大脑区域,例如大脑后部的小脑。一个小脑受损的病人可能能够生动地讲述历史战役的细节,但却发现自己完全无法学会一个新的舞步或掌握钢琴,无论他们练习多少次。这种优雅的模块化设计——将不同种类的记忆分离开来——是一个强大的设计原则,计算机架构师现在正热切地试图模仿。
但记忆的物理实质是什么?如果我们从这些大的结构放大到神经元之间的微观连接,即突触,我们就能找到答案。这些连接的强度不是固定的,而是可塑的。长时程增强(LTP)过程,即突触因使用而变得更强,被认为是学习的细胞基础。这个过程由分子机器精确调控,尤其是一种称为NMDA受体的突触受体。该受体充当“符合检测器”,仅当突触两侧的神经元同时活跃时才加强连接。
这些分子守门员的功能如此关键,以至于任何干扰它们的因素都会损害我们的学习能力。例如,慢性压力会使大脑充满像糖皮质激素这样的荷尔蒙,这会抑制NMDA受体的产生。这在心理状态——压力——和认知缺陷——形成强大新记忆的能力下降——之间建立了一个直接的物理联系。我们记忆的效率不仅是结构问题,也与化学和我们的生理状态有关。
此外,建立一个好的记忆系统不仅在于加强连接,还在于修剪它们。在发育过程中,大脑会产生过量的突触,然后有选择地消除这些突触,以精炼神经回路。这种突触修剪也依赖于NMDA受体的活动,确保只有最有效和最连贯的通路被保留下来。如果这个精细的雕塑过程受到干扰,例如由于产前暴露于能轻微阻断NMDA受体的化合物,成年后可能导致一个效率较低、“噪声”较大的海马回路,从而在形成详细的情景记忆和在陌生地方导航方面出现特定困难。精确的记忆需要一个精确雕琢的工具。
对这种生物机制的深刻理解不仅仅是一项学术活动;它对人类健康具有深远影响。在精神病学中,针对像强迫症(OCD)这样的焦虑障碍的治疗方法,如暴露与反应阻止疗法(ERP),依赖于一种称为“消退”的学习形式。病人学习一种新的、安全的记忆来抑制旧的、恐惧的记忆。这也是一个物理过程,依赖于杏仁核和前额叶皮层之间回路中NM-DA受体的可塑性。正是因为这个原因,在治疗期间使用某些药物,如苯二氮䓬类药物,可能会适得其反。通过增强整个大脑的抑制作用,这些药物会抑制巩固新安全记忆所需的那种突触可塑性,从而有效地阻止治疗“生效”。在分子水平上理解记忆,使我们能够做出更明智的临床决策。
受大脑蓝图的启发,工程师们现在正利用新兴存储技术构建新的计算系统。这项努力带我们踏上两场平行的冒险:首先,重新思考如何为这些新设备设计软件;其次,学习如何用大自然赋予我们的那些美妙但不完美的组件来构建智能系统。
传统计算机建立在一个基本的分离之上:一个快速计算的处理器和一个较慢存储的内存。这种分离在数据来回穿梭时造成了“交通堵塞”。像相变存储器(PCM)这样的新兴技术提供了融合这两者的机会,但它们有自己独特的规则。例如,向PCM写入数据是缓慢且耗能的。为了有效地使用它,我们不能只是运行旧软件;我们必须重新设计我们的算法,使其“说”新硬件的“语言”。
考虑两个矩阵相乘这个基本任务。一种天真的方法可能会执行许多小的、频繁的内存写入。对于PCM来说,这将是灾难性的低效。解决方案是彻底重新思考数据流。通过使用少量快速的片上内存(如SRAM)作为暂存区,我们可以加载矩阵的小“瓦片”,在本地对它们进行大量计算,然后只将该瓦片的最终结果写回主PCM。通过仔细选择瓦片大小,我们可以最小化昂贵的写入次数,从而显著提高性能和能效。存储设备的物理特性向上影响并决定了软件的结构。
这场革命延伸到我们管理数据本身的方式。一些新兴存储器是非易失性的,意味着它们即使在断电时也能保留信息。这模糊了内存和存储之间的界限,创造了“持久化内存”的激动人心的可能性。想象一个哈希表——一种用于快速查找的基本数据结构——可以在系统崩溃或断电后幸存下来。要构建这样的东西,我们必须保证任何更新都是原子的,即“要么全有,要么全无”。这需要谨慎的协议,例如在就地进行实际更改之前,先将意图写入“日志”。然而,每次写入都有成本,并且硬件本身有最小写入大小(例如,64字节的缓存行)。这两个因素共同造成了写放大,即一个小的逻辑更新需要对介质进行大得多的物理写入。设计高效的持久化数据结构需要仔细核算这种开销,以确保系统不仅可靠,而且快速。
新兴存储器最激动人心的前沿在于构建神经形态或类脑计算机。在这里,我们使用存储设备的物理属性——比如它们的电导——来表示神经网络的突触权重。这使得大规模并行和高效的“存内计算”成为可能,即计算发生在数据所在之处。然而,这意味着要拥抱模拟的、非理想的世界。与非0即1的纯净数字比特不同,这些器件的电导是有噪声的、可变的,并且会随时间变化。神经形态工程的艺术在于找到巧妙的方法来驾驭这种不羁。
一个主要的挑战是漂移。一个被精确编程到特定值的器件电导会随着时间的推移而缓慢漂移,就像回声逐渐消逝一样。用这样的组件构建的神经网络会看到其学到的知识逐渐退化。解决方案是实施刷新策略——周期性地测量电导并施加小的校正脉冲,将其推回目标值。这在技术上类似于生物学中被认为可以稳定我们大脑中记忆的记忆巩固过程。
另一个挑战是变异性。没有两个器件是完全相同的。我们如何用不精确的组件来表示一个精确的权重值?在这里,工程师们从自然和数学中借鉴了两个绝妙的技巧。
第一个是使用差分对。我们不用单个器件来表示一个权重,而是用两个。权重被编码在它们电导的差值中,。许多噪声和漂移源倾向于以类似的方式(“共模”)影响两个器件。通过取差值,这些共同的误差相互抵消,留下一个更清晰的信号。这种优雅的技术使我们能够用有噪声的部件构建稳健的系统。
第二个技巧是平均的力量。如果单个器件有噪声,我们可以通过使用几个更小的、独立的器件的总和来表示一个概念上的权重单位。虽然每个独立的子单元都有随机误差,但这些误差在求和时倾向于相互抵消。通过使用个单元的冗余来实现一个逻辑单元,我们可以将误差的标准差减少倍。这直接转化为我们模拟突触的有效精度或“有效比特数”的增加。这是一个简单而深刻的示范,说明数量如何能够产生质量。
当我们退后一步审视这片景象时,一幅非凡的画面浮现出来。我们看到神经科学家发现了生物记忆的模块化和可塑性本质。我们看到计算机科学家和工程师们在应对他们新存储设备的物理现实,重塑算法和数据结构。我们看到神经形态架构师利用冗余和差分信号的原理,从有噪声的模拟物质中 coax intelligence(诱导出智能)。
令人惊叹的是,他们都在用自己的语言,讨论着同样的事情。大脑对陈述性记忆和程序性记忆的分离,为异构计算架构的设计提供了信息。PCM器件中的突触漂移挑战,反映了大脑中记忆巩固的挑战。使用差分对来消除噪声的工程技巧,是自然界在感觉系统中使用数百万年的一个原理。
对新兴存储器的研究不仅仅是一项新技术的开发。它是物理学、工程学和神经科学的一个交汇点。通过努力建造能够记忆的机器,我们正在为大脑举起一面新型的镜子,这样做,我们正在加深对人造与自然,以及支配思想存储的普适原理的理解。