首页突触权重存储：从大脑到硅基

突触权重存储：从大脑到硅基

玻尔百科

定义

突触权重存储：从大脑到硅基是神经形态工程领域的一个重要概念，研究突触连接物理强度如何作为大脑存储记忆的基础单位。该过程通过从短期可塑性到长期巩固的多种机制管理有限精度的模拟值，旨在模拟生物脑的高效性。通过在硬件中实现存储与处理的协同定位，该技术利用本地学习规则实现了无需巨大计算开销的实时自适应。

核心要点

突触权重，即神经连接的物理强度，是大脑记忆的基本单位，其功能类似于一个精度有限的模拟值。
大脑通过不同的机制在多个时间尺度上管理记忆，从短暂的短期可塑性到需要努力的长期突触巩固。
神经拟态工程旨在通过将存储（突触）和处理（神经元）共同定位来模拟大脑的效率，从而催生了多样化的硬件架构。
在硬件上实现类脑学习需要不同于传统人工智能算法的局部规则，从而能够在没有巨大计算开销的情况下进行实时自适应。

引言

什么是记忆？在计算机中，它是一串精确的数字比特。而在大脑中，它是一种远更动态、更具体的东西：神经元之间物理连接的强度，即权重。突触权重这个单一概念，在神经科学的生命世界与计算机工程的人造世界之间架起了一座强大的桥梁。它代表了知识的物理体现，但其在生物学和硅基中的实现充满了噪声、精度和物理约束带来的挑战。本文深入探讨了突触权重存储这一引人入胜的故事，旨在弥合抽象理论与纷繁现实之间的差距。

我们旅程的第一部分“原理与机制”，将揭示记忆的物理基础。我们将研究突触如何在不同时间尺度上存储信息，从转瞬即逝的思绪到伴随一生的信念，并探索实现这种存储的生物学和人工机制——从树突棘到浮栅晶体管。我们还将直面任何学习系统都必须解决的基本的稳定性-可塑性困境。

接下来，在“应用与跨学科联系”部分，我们将看到这一原理如何被应用。我们将探索基于突触权重的模型如何帮助我们理解记忆提取和大脑发育，然后转向神经拟态工程领域。在这里，我们将面对构建人工大脑所涉及的巨大挑战和巧妙的解决方案，通过将突触的蓝图转化为新一代智能机器，在硅基中锻造新的心智。

原理与机制

记忆是什么？如果你问计算机科学家，他们可能会告诉你，它是在硅芯片上特定地址存储的一串0和1。地址 0x7BEEF 的值是 10110010。它是精确的、静态的、脱离实体的。如果你问神经科学家，答案则会带你进入一个充满活力、生机勃勃的复杂世界。大脑记忆的基本单位是突触权重，即两个神经元之间连接的强度。但这个“权重”完全不像电子表格中的数字。它是一个动态的物理实体，受生物学、化学和物理学原理的支配，这些原理既优美典雅又令人抓狂地复杂。理解突触权重存储，就是理解数字计算机与人脑之间的深刻差异。这是一个跨越空间和时间尺度的故事，从单个突触内的分子之舞，到大脑本身的宏伟架构。

记忆的物理性：从树突棘到硅基

让我们从近距离观察一个突触开始。它不是图表中的一个抽象链接，而是一个繁忙的微观结构。通常，突触的强度物理上反映在接收神经元上一个称为树突棘的微小突起的尺寸上。更大的棘头体积通常意味着更强的连接。但这种生物基质并非像计算机芯片那样完美、无噪声的介质。细胞世界充满了热波动和化学波动。

想象一下，试图精确测量其中一个微小树突棘的体积。你的测量会充满噪声，而体积本身也会不断抖动。这意味着，如果大脑想通过将树突棘设置为一个精确的体积来编码信息，那将是一项不可能完成的任务。相反，大脑必须使用有限数量的可区分的不同尺寸。一个突触的强度不可能是0.51或0.52，它只能是“弱”、“中”或“强”。通过对噪声和棘头体积的动态范围——从最小可能值（ $V_{\min}$ ）到最大值（ $V_{\max}$ ）——进行建模，我们可以估计一个突触能够保持的可靠状态数量，从而计算出其以比特为单位的信息存储容量。这揭示了一个基本事实：生物突触是一个精度有限的模拟设备。

我们如何在自己的技术中构建类似的东西？多年来，工程师们一直努力创造一种人工突触，一种能够存储权重并保持它的设备。其中最巧妙的解决方案之一是浮栅晶体管。想象一个微小的导电岛——浮栅——完全被完美的绝缘体海洋所包围。这个岛是电绝缘的，所以我们放置在上面的任何电荷（电子）都会被困住，可能长达数年之久。这些被困的电荷会产生一个电场，调节下方晶体管沟道中的电流。电荷越多，电流越小；电荷越少，电流越大。瞧！我们就得到了一个可编程、非易失性的模拟权重。通过使用像福勒-诺德海姆隧穿或热电子注入这样巧妙的量子力学技巧，我们可以精确地向这个岛上添加或移除电子，从而有效地“写入”突触权重。

当然，就像它们的生物对应物一样，这些硅突触也并非完美。制造差异意味着两个相同的晶体管行为会略有不同（器件失配），而且我们只能以有限的精度（量化）来编程存储的电荷。工程师们已经开发出巧妙的方案，例如使用差分对器件，其中权重被编码为它们电导的差值（ $w \propto G^{+} - G^{-}$ ），以消除部分噪声。然而，总有一些误差会残留，这证明了在纷繁的物理世界中构建类脑硬件所面临的挑战。

记忆的时间尺度：从转瞬即逝的思绪到伴随一生的信念

记忆并非铁板一块；它存在于一个时间尺度的谱系上。你此刻的想法——你的“工作记忆”——是短暂的。然而，你第一次骑自行车的记忆可能会在你大脑中铭刻一生。这种持久性的多样性反映了存储机制的深刻多样性。

考虑一下工作记忆。大脑是如何将信息“在线”保持几秒钟以指导任务的？两种相互竞争的理论描绘了截然不同的图景。一种观点认为，记忆是一个活跃的、回响的过程。一组特定的神经元，以循环回路连接，维持着高发放率，不断地互相提醒它们所持有的信息。这种持续性尖峰表征就像山谷中持续的回声；如果你哪怕暂时中断了活动，回声就会消失，记忆也随之消失。另一种理论则提出了一种更微妙的机制：一种活动-静默突触状态。在这里，信息通过突触效能的快速变化——一个称为短期可塑性的过程——被暂时“印刻”在突触本身上。然后神经元可以归于沉寂，但记忆的潜在痕迹仍保留在连接中，准备被随后的活动爆发“读出”。记忆不是回声本身，而是峡谷壁的暂时改变，它塑造了下一次的回声。

那么，如果一些记忆是活跃的回声，而另一些是短暂的印记，大脑是如何创造出真正永久的记录的呢？答案在于一个称为突触巩固的过程。这是记忆从一个脆弱的短期状态到一个稳固的长期状态的旅程。我们可以将其想象为一个两阶段系统。任何新的学习首先会在一个快速、易变的权重（ $w_f$ ）上引起变化。可以把这想象成用白板笔在白板上书写。它又快又容易，但也容易被擦除并随时间褪色。在神经拟态芯片中，这可能是简单漏电电容器上的电荷。

为了让这个记忆持久，它必须被转移到一个缓慢、巩固的权重（ $w_s$ ）上，这就像把文字刻在石头上。然而，这个过程不是自动的。它需要努力。在大脑中，它由一个复杂的信号级联反应所门控，这个过程通常被比作蛋白质合成。只有当一个神经元经历持续的、高频率的活动时，一个分子的“门”才会打开，启动信息从易变的白板（ $w_f$ ）到永久的石碑（ $w_s$ ）的转移。这种长时程存储可以在硅基中使用像忆阻器或浮栅晶体管这样的真正非易失性设备来实现。这个门控机制解释了为什么考前突击往往效果不佳；真正持久的学习需要反复、专注地接触材料，以说服突触这个信息足够重要，值得刻入石头。

记忆的经济学：稳定性、可塑性与架构

形成长期记忆的能力引入了一个根本性的困境：稳定性-可塑性困境。一个过于可塑的系统会很容易学习新事物，但也会同样快地忘记旧事物，就像一个患有顺行性遗忘症的人。一个过于稳定的系统会完美地保留旧记忆，但无法学习任何新东西。大脑必须在这根钢丝上行走。

实现这种平衡的关键机制之一是稳态可塑性。虽然赫布可塑性（如LTP）根据相关活动（“一起发放的神经元，连接在一起”）来加强特定的突触，但稳态可塑性则像整个神经元的恒温器。它缓慢地监测神经元的平均发放率，如果发放率过高或过低，它会按比例放大或缩小其所有突触权重，以返回到一个首选的设定点。关键在于其时间尺度：它在数小时或数天内运作，远慢于赫布学习的分钟级变化。想象一下，如果这个恒温器太快会怎样。一旦LTP为了编码新记忆而加强了一个突触，快速的稳态机制会立即削弱它以恢复基线发放率，从而在记忆有机会巩固之前就有效地抹去了它。时间尺度的分离是自然界巧妙的解决方案：它允许快速、特定的学习，同时确保长期稳定性。这一原理在在线学习的计算模型中找到了直接的对应，在这些模型中，实现高存储容量需要一个非常慢的“遗忘率”，这完美地说明了在吸收新信息和保留旧信息之间的权衡。

存储和稳定性的这种错综复杂的舞蹈，正是神经拟态工程如此引人入胜的原因。传统计算机受到冯·诺依曼瓶颈的困扰：处理器和存储器物理上是分离的，数据在两者之间的不断穿梭浪费了大量的时间和能量。大脑，就其本质而言，是不同的。存储器——突触权重——与处理器——神经元——物理上是共置的。这就是神经拟态计算的精髓：一个由简单处理器（神经元）组成的、通过局部存储元件（突触）互连的大规模并行系统，它在连续时间内运行，由事件（尖峰）驱动。性能上的影响是惊人的。像Intel的Loihi这样的神经拟态系统，将权重存储在紧邻神经元核心的快速SRAM中，其处理突触事件的速度比像SpiNNaker这样需要从较慢的片外DRAM中获取权重的架构快了几个数量级。这凸显了一个核心原则：在类脑计算中，你在哪里存储权重与你存储什么同样重要。

最后，让我们问最后一个问题。即使是“永久的”、巩固的记忆，它真的是静态的吗？也许不是。突触维持的模型表明，即使是最稳固的权重也会受到缓慢的分子衰变的影响。为了对抗这一点，记忆可能需要通过零星的再激活来主动维持。每当你回忆起一个记忆时，相应的神经元集群就会发放，加强其突触标记并刷新巩固的权重，以抵抗无情的衰变潮流。一个从未被重温的记忆，经过很长一段时间后，可能就此消失了。这为突触权重存储描绘了最后一幅凄美而生动的画面：它不是一个没有生命的档案馆，而是一个生机勃勃的花园。它必须通过经验播种，通过巩固照料，通过稳态控制来平衡，并且必须经常重温，以防止它被荒野所吞噬。

应用与跨学科联系：从心智中的记忆到机器中的心智

已知宇宙中最复杂的物体——人脑——竟基于一个看似简单的原理运行，这本身就是一件非凡的事。你的每一个想法，你珍视的每一段记忆，你掌握的每一项技能，都编码在神经元之间连接的强度之中。这些连接，即突触，不仅仅是开或关的开关；它们拥有可调节的强度，一种“权重”。突触权重这个简单的概念，是连接神经科学、计算机科学和工程学等广阔领域的关键。它是知识的物理体现。

但这究竟是如何运作的呢？大自然在潮湿、纷繁且效率惊人的大脑硬件中存储记忆的解决方案，又是如何启发我们构建智能机器的方式的呢？让我们踏上一段旅程，看看突触权重存储这一个概念是如何被应用的，从理解我们自身机器中的幽灵，到在硅基中锻造新的心智。

记忆的蓝图

首先，让我们问一个最基本的问题：一个由简单单元组成的网络如何能存储记忆？想象一下一个庞大的神经元集合。一段记忆——比如说，一朵玫瑰的图像——并非存储在单个神经元中，而是作为一种活动模式分布在许多神经元上。根据Donald Hebb提出的一个绝妙而简单的规则，“一起发放的神经元，连接在一起”。当“玫瑰模式”被激活时，这些活跃神经元之间的连接就会被加强。它们的突触权重会增加。

这会带来什么后果呢？网络现在学到了一些东西。这组突触权重中现在包含了一个玫瑰的模糊印记。这可以用一个称为Hopfield网络的模型完美地加以说明。在这样的网络中，存储的记忆模式成为一个稳定的“吸引子”。把它想象成在所有可能的网络状态景观中的一个山谷。如果你让网络从一个不完整或有噪声的玫瑰版本状态开始——一个放在山坡上的球——网络的动力学将自然地将状态向下拉，拉入山谷。球在谷底稳定下来，网络完美无瑕地检索出了完整、完美的玫瑰图像。记忆不仅被存储了，而且是可被稳健地检索的。这就是分布式、联想记忆的魔力，全部编码在突触权重的矩阵中。

当然，大脑不是一个单一、均匀的网络。它是一个由相互作用的部分组成的、被精雕细琢的交响乐团。其记忆的稳定性取决于兴奋和抑制之间的微妙平衡，并且它在不断地被优化。在发育过程中，大脑会经历一个大规模的“突触修剪”过程，移除其大部分连接。这听起来像是一种损失，但它是一个至关重要的优化过程。通过使用理论模型，我们可以看到这种修剪直接影响我们刚刚讨论的记忆吸引子的稳定性。过多或过少的修剪都可能破坏网络的稳定，可能导致某些神经发育障碍中观察到的认知困难。这个教训是深刻的：存储权重的数量和平衡与其个体值同样关键。

更进一步，现代理论认为大脑不仅仅是做出反应；它在不断地预测。在像分层预测编码（Hierarchical Predictive Coding）这样的框架中，大脑被看作是世界的一个生成模型。更高层的皮层区域不等待感觉输入；它们将预测发送到较低的感觉区域。向上反馈的不是原始的感觉数据，而是预测误差——预期与接收到的信息之间的差异。这是一种极其高效的信息处理方式。而存储这个世界内部模型的又是什么呢？是突触权重。它们不再仅仅存储静态模式，而是存储世界运作的规则本身，使大脑能够做梦、想象和感到惊讶。

在硅基中锻造新心智

如果这些原理如此强大，我们自然会问：我们能制造出以这种方式工作的计算机吗？这是神经拟态工程的宏伟抱负——以大脑为蓝本制造机器。在这里，突触权重这个抽象概念与物理实现的硬现实发生了碰撞。

第一个、也是最残酷的挑战是纯粹的规模问题。大脑有数万亿个突触。即使一个中等规模的人工网络也可能拥有数十亿个连接。如果你想制造一个容纳这样网络的芯片，你立刻就会面临“内存占用”问题。你需要多少比特的内存？这不仅仅是权重本身。在大脑中，突触的位置是隐含的。在计算机中，你必须存储它的“地址”。如果神经元A连接到神经元B，你需要明确地存储该信息。当网络是稀疏的（大多数神经元并未连接到大多数其他神经元）时，工程师会使用像压缩稀疏行（Compressed Sparse Row, CSR）这样的巧妙数据结构，只存储实际存在的连接。内存的计算变成了一项对权重比特数加上连接图比特数的仔细核算。突然之间，来自神经科学的优雅模型变成了计算机工程中一个棘手的资源管理问题。

当我们试图在神经拟态硬件上实现像卷积神经网络（CNNs）这样的现代AI算法时，这个问题变得更加明显。CNN的一个关键特征是“权重共享”——一个小的滤波器（核）在图像上滑动，在每个位置重复使用相同的少数几个突触权重。这在计算上非常高明。但大多数神经拟态硬件，从大脑的点对点布线中获得灵感，并没有原生的权重共享机制。为了实现卷积，工程师必须将其“展开”，为每个连接物理上创建一个单独的突触，即使它们都共享相同的值。内存成本因此爆炸式增长。软件中少数共享的权重，在硬件中变成了数百万个复制的权重。

这导致了一个由不同神经拟态架构组成的引人入胜的“动物园”，每种架构在如何存储突触权重方面都做出了不同的选择。

在像SpiNNaker这样的数字、大规模并行系统上，权重是存储在传统ARM处理器内存中的一个数字，所有东西都在离散的时间步长中进行模拟。
在Intel的Loihi上，权重是一个量化的整数（例如9比特），神经元动力学由专用的数字电路处理。
在IBM的TrueNorth上，约束更加严格。一个突触只有开或关（1比特），其有效权重对于每个神经元只能是四种可能值之一。
在像BrainScaleS这样的混合信号系统上，权重是一个模拟物理量，比如存储的电荷，它直接影响一个行为类似神经元的模拟电路。因为是模拟的，它的运行速度极快，但必须仔细校准以考虑微小的制造缺陷。

存储一个突触权重不是一件事；它是整个工程权衡的景观。你到底需要多少精度？工程师可能会发现，每个权重使用8比特能得到很好的准确性，但成本太高。如果用4比特，甚至2比特也能行呢？这就是“足够好”的艺术。在详细的设计探索中，人们可能会发现，2比特权重和巧妙的尖峰时间编码的组合，可以在满足精度目标的同时，极大地节省芯片面积和能耗。这反映了进化的无情优化，它同样找到了能工作的、资源效率最高的解决方案。

未来：学习的物质

到目前为止，我们讨论的是存储已知的权重。但大脑的真正力量在于其学习能力——通过经验塑造自身权重的能力。几十年来，人工智能中占主导地位的学习算法一直是反向传播。但它有一个特点使其非常“不类脑”：它需要对整个网络的全局视图，并且信息需要及时回溯。

这激发了人们寻找新的、更适合神经拟态硬件的局部学习规则。一个绝佳的例子是“资格传播”（eligibility propagation），或称e-prop。在这个方案中，每个突触都维持一个局部的“资格迹”，这是它最近在使其神经元发放中所起因果作用的记忆。当一个全局的错误或奖励信号到达时（比如一个“干得好！”或“糟糕！”的信号），权重的更新与这个局部存储的资格迹成正比。这是一个三因子规则：突触前活动、突触后活动和一个全局神经调质信号。这种方法允许由SNN控制的机器人在没有反向传播带来的巨大内存和计算开销的情况下，进行实时在线学习。硬件本身的约束激发了一种更优雅、更高效的算法。

这将我们带到了最终的前沿。我们已经讨论了在数字比特和模拟电路中存储权重。如果我们能将权重存储在物质本身的基本状态中呢？这就是使用像忆阻器这样的奇异器件进行“内存计算”的前景。忆阻器是一种电阻器，其电阻可以通过流过它的电流来改变，并且在断电时它会记住这个电阻。在这些系统中，忆阻器的电导就是突触权重。存储器和处理器不再是独立的实体；它们融为一体。要编程这样的设备，人们使用一个优雅的迭代过程：读取当前的电导，将其与目标进行比较，并施加一个微小的电压脉冲使其更接近目标。重复这个过程直到误差足够小。这是硬件和算法的最终融合，是生物突触的直接物理模拟。

从心智中一个简单的联想模型，穿过构建硅基大脑的迷宫般的工程挑战，到学习算法和新型计算基质的未来，突触权重的旅程是一个关于深刻联系的故事。它是一个统一了我们对心智和物质理解的概念。通过研究大脑如何存储它所知道的东西，我们不仅在揭开我们自身意识的秘密，而且在发明一种全新的机器——一种在非常真实的意义上能够记忆、预测和学习的机器。