模拟神经形态计算：用物理学进行计算的艺术

玻尔百科

关键要点

模拟神经形态系统通过直接利用硬件的物理特性来模拟神经动力学进行计算，与数字系统相比，具有极高的能源效率。
通过在亚阈值区操作晶体管，电路可以自然地再现生物神经元复杂的指数动力学，而无需显式计算。
片上学习通过忆阻器等有状态器件实现，这些器件物理上实现了诸如脉冲时间依赖可塑性（STDP）等可塑性规则。
模拟系统的主要挑战是它们对物理噪声和器件失配的易感性，这在能源效率和精度之间造成了根本性的权衡。

引言

在一个由数字逻辑主导的时代，计算被定义为对0和1的操纵，而大脑在效率和能力方面仍然是一个谜。传统计算机尽管速度很快，但在执行人脑能轻松完成的任务时却消耗大量能源。这种效率上的差距突显了一个根本性问题：我们能否制造出不是用抽象符号，而是像大自然一样，用物理的本质来进行计算的机器？

本文深入探讨了模拟神经形态计算的世界，这是一个试图通过创建受大脑启发的硬件来回答这个问题的范式。它探索了这种方法如何超越传统的数字架构，构建出本质上并行、事件驱动且极其节能的系统。在接下来的章节中，您将揭示这个革命性领域的核心理念。首先，“原理与机制”一章将解释模拟电路如何模拟神经元和突触的行为，直接利用物理定律来执行计算。随后，“应用与跨学科联系”一章将揭示这些设备如何成为科学发现的强大工具，推动人工智能的创新，并在工程学、材料科学乃至心智哲学之间架起桥梁。

原理与机制

要真正领会模拟神经形态计算的哲学，我们必须首先摒弃一个在数字时代已成为我们第二天性的观念：即计算本质上是关于操纵符号的。半个世纪以来，我们制造的机器在处理0和1方面表现出色。但大自然以其惊人的效率，并非如此计算。大脑不是在中央处理器上运行算法；大脑本身就是计算机，其计算是通过其组件的物理特性来执行的。模拟神经形态工程正是回归到这一深刻思想：不是用符号计算，而是用物理学本身进行计算。

物理之乐：模拟世界与数字世界

想象一下黑胶唱片和MP3文件之间的区别。唱片上的凹槽是声波的连续物理复制品——一种模拟。它的高低起伏就是压力波的波峰和波谷，直接刻在材料上。相比之下，MP3是一串数字，是同一声波的离散符号表示，以有限的间隔和有限的精度进行采样。

这正是模拟与数字神经形态设计区别的核心。在数字系统中，像神经元电压这样的变量由一个二进制字（一串比特）表示。要进行任何操作——增加一个输入，使电压随时间衰减——系统都必须从内存中获取这些数字，在算术逻辑单元（ALU）中处理它们，然后将新数字写回。其优点在于其清晰性。导线上的物理电压要么是明确的“1”，要么是明确的“0”。微小的物理波动——噪声——只要不越过决策阈值，就会在每个逻辑门处被无情地消除。这创造了强大的噪声容限，使得数十亿晶体管能够近乎完美地组合成一个可靠的整体。

模拟系统则像黑胶唱片。神经元的膜电位不是内存中的一个数字；它就是物理电容器上的电压。信息被编码在电压和电流的连续值中。计算不是通过执行指令发生的，而是通过物理定律的强制执行。当多个突触电流到达一个神经元时，它们不需要被调度或串行化；它们只是在一个节点上简单地相加，遵循基尔霍夫电流定律，就像水流汇入一个盆地一样。

这种直接的物理体现既是该范式的最大优势，也是其最大挑战。这里没有噪声容限。每一次微小的、随机的热能扰动，每一个晶体管结构中的微小缺陷，都会传播并影响计算。抽象是“有漏洞的”。那么，我们为什么会选择这个混乱的模拟世界呢？原因与大自然的选择相同：为了那几乎难以置信的效率。

用晶体管构建大脑：神经元

让我们看看这种哲学如何转化为硬件。我们的第一个任务是构建一个神经元。从电学角度看，神经元是什么？其核心是一个电容器——细胞膜——用于储存电荷，以及一系列作为门控、有泄漏的通道的离子通道，供电流流入和流出。传奇的Hodgkin-Huxley模型是生物物理学的杰作，它用一组微分方程描述了这个系统，完美地捕捉了产生神经冲动或脉冲的钠离子和钾离子的复杂舞蹈。该方程从根本上遵循基尔霍夫定律：为膜电容器充电的电流 $C_m \frac{dV}{dt}$ 必须等于流经所有离子通道的电流之和加上任何外部输入电流。

C_m \frac{dV}{dt} = -I_{\text{ion}}(V, t) + I_{\text{ext}}

模拟电路的美妙之处在于它们可以免费解出这类方程。一个带有电容器和电阻器（一个“泄漏”）的简单电路，自然地实现了泄漏整合发放（LIF）神经元的方程。输入电流为电容器充电，其电压上升，而电阻器则持续地将电荷泄放掉。如果电压达到一个阈值，就宣告一个脉冲产生，电容器被重置。一个驱动电容器的跨导放大器是这一原理的美妙物理实例化。

但LIF模型只是一个简化的 caricature。它产生的脉冲是一个人为的、瞬时的事件。真实的神经元在脉冲点燃时表现出急剧的、爆炸性的“失控”过程。我们能否捕捉到这种更微妙的动态？可以，通过利用我们晶体管的物理特性。当一个MOSFET在其亚阈值区工作时，其电流-电压关系不是线性的，而是指数的。通过设计一个电路，让神经元自身的膜电压在一个正反馈回路中开始导通其中一个亚阈值晶体管，我们创造了一个随着电压接近阈值而指数增长的电流。这给了我们指数整合发放（EIF）神经元，一个既计算简单又生物物理学上现实的模型。其控制方程变为：

C_m \frac{dV_m}{dt} = -g_L(V_m - E_L) + g_L \Delta_T \exp\left(\frac{V_m - V_T}{\Delta_T}\right) + I_s(t)

这是一个意义深远的结果。那个赋予神经元真实脉冲动态的优雅指数项不是计算出来的；它直接源于硅的基本物理特性。我们甚至可以构建模拟更复杂动态的电路，比如Izhikevich神经元模型的丰富脉冲模式，通过使用跨导放大器的布置来物理计算像 $k v^2$ 这样的二次项。我们确确实实地在用物理学进行计算。

可塑的连接：突触

大脑的力量不仅来自其神经元，还来自它们之间庞大的连接网络：突触。一个突触决定了来自“突触前”神经元的脉冲对“突触后”神经元有多大影响。关键的是，这些连接不是静态的；它们会根据活动而增强或减弱。这就是学习。

在我们的模拟电路中，突触是一个具有可调电导的器件。它通过的电流是这个电导乘以驱动电压——一个由欧姆定律执行的物理乘法。即使是最简单的突触动态也可以被优美地实现。例如，神经递质的瞬态效应可以被建模为一个随时间指数衰减的电流。对于模拟电路来说，这微不足道：一个电荷脉冲被施加到一个电容器上，然后由一个类似电阻的元件将其泄放。这是一个跨导-电容（ $g_m-C$ ）滤波器。这个衰减的时间常数 $\tau$ 不是某个固定的数字；它由电路的物理参数给出：

\tau = \frac{2 C U_T}{\kappa I_b}

这个方程揭示了模拟神经形态系统的一个关键特性：可编程性。时间常数 $\tau$ 取决于偏置电流 $I_b$ 。通过简单地调整这个模拟直流电流，我们可以在几个数量级上调节突触动态。

然而，真正的魔力在于长期可塑性——学习和记忆的物理基础。最著名的学习规则之一是脉冲时间依赖可塑性（STDP），这个原则通常被概括为“一起发放的神经元，连接在一起”。更准确地说，如果一个突触前神经元在突触后神经元之前不久发放，它们之间的连接就会加强。如果它在之后不久发放，连接就会减弱。突触强度的变化是脉冲之间时间差的指数函数。

这似乎是一个难以实现的复杂算法。但物理学再次伸出援手。想象一下，我们设计的电路在突触前和突触后神经元发放时，在突触上产生特定形状的电压脉冲。如果这些脉冲在时间上重叠，突触器件上的总电压将取决于它们的相对时间。如果突触是一个有状态器件——一个像忆阻器这样的纳米级元件，其电导会根据其上的电压历史物理地改变——那么该器件的状态将自动根据STDP规则演变。器件物理本身就在计算学习规则。这是材料科学、电路设计和计算神经科学之间统一的终极体现。

阴阳两面：希望与风险

这种用物理学计算的愿景令人鼓舞。它预示着能够以大脑自身惊人的能源效率来模拟大脑动态的系统。一个模拟突触操作的能量成本可以用飞焦耳（ $10^{-15}$ J）来衡量，比数字等效操作低几个数量级，后者由于开关逻辑门和访问内存所需的能量，成本为皮焦耳（ $10^{-12}$ J）或更高。

但这一希望伴随着沉重的代价。模拟世界本质上是一个“混乱”的地方，受到数字系统被明确设计来消除的各种非理想性的影响。

器件失配：由于制造过程中的原子尺度随机性，没有两个晶体管是完全相同的。它们的特性在芯片上各不相同，引入了固定模式误差。
时间噪声：原子的持续热振动（ $k_B T$ ）以及电荷在硅晶格中被俘获和释放的量子现象，产生了一种持续的噪声“嘶嘶声”，被加到我们的信号中。
漂移：我们存储的模拟状态——电容器上的电压、忆阻器的电导——不是永久的。它们会随时间缓慢漂移，就像一张在阳光下褪色的照片。

那么，我们如何在纯净但耗能的数字世界和高效但混乱的模拟世界之间做出选择呢？这个选择并非哲学性的；它是一个工程上的权衡。对于给定的任务，我们可以定义一个成本函数来权衡我们的优先事项：准确性与能耗哪个更重要？延迟与鲁棒性哪个更重要？通过代入模拟和数字原型的实测性能，我们可以做出理性的、定量的决策，决定哪种方法对该特定应用更好。

多年来，模拟噪声和失配的风险似乎超过了效率的希望。但我们不是物理学的无助受害者；我们是能够利用物理学为我们服务的聪明工程师。大脑本身就在使用有噪声、不可靠的组件运行，却通过稳态和适应实现了卓越的鲁棒性。我们可以将同样的原则构建到我们的硅系统中。通过设计能够感知自身属性的电路——例如，测量温度对器件参数的影响——我们可以创建反馈回路，动态调整偏置电压如 $V_b$ 和电源电压如 $V_{DD}$ 。这使得电路能够动态补偿PVT（工艺、电压、温度）变化，使其关键计算参数（如时间常数 $\tau$ 和发放率 $f$ ）在物理扰动的冲击下保持稳定。在学习构建大脑的过程中，我们不仅在模仿其结构；我们还在学习体现其韧性。

应用与跨学科联系

在上一章中，我们拆解了模拟神经形态计算的内部机制。我们看到了齿轮和弹簧——亚阈值晶体管、忆阻器突触，以及那些模仿大脑数学原理的巧妙电路。但时钟不仅仅是其机械结构；其目的是报时。那么，我们的神经形态系统所报的“时间”是什么？它们开启了哪些科学和工程的新世界？

这才是真正有趣的地方。我们从“如何做”转向“所以呢”，在此过程中，我们将看到这些受大脑启发的设备不仅仅是工程上的壮举。它们是连接固态物理、材料科学、人工智能，乃至心智哲学这些看似迥异的世界的桥梁。这是一段揭示科学图景中非凡统一性的旅程。

仿真的艺术：从生物学到硅

神经形态计算最直接，或许也是最深刻的应用，是创建神经系统的物理摹本——不仅仅是模拟，而是真正的模拟体。在超级计算机上对飓风进行数字模拟是一项宏伟的计算壮举，但它永远不会让你淋湿。另一方面，模拟神经形态电路更像是大脑的风洞。它使用的物理过程所遵循的数学定律与它所建模的生物系统具有相同的形式。

想象一下离子在神经元树突膜上错综复杂的舞蹈。这个过程可以用一个关联电流、电容和电导的微分方程来描述。现在看看一个在所谓的“亚阈值”区工作的简单CMOS晶体管。电子通过其沟道的流动由扩散控制，这是一个对电压具有指数依赖性的过程。事实证明，这与真实神经元中离子通道电流对膜电压的指数依赖性形成了美妙的物理类比。通过将基尔霍夫电流定律应用于硅电路中的一个节点，我们实际上是在重演神经元膜上某一点的电荷守恒。我们可以将细胞的膜电容 $C$ 映射到物理电容器 $C_{\text{phys}}$ ，并且我们可以通过简单地调整我们晶体管电路的偏置电流来调节泄漏和轴向电导（ $g_m, g_{ax}$ ）。结果是一块硅片，其行为像树突，因为它遵循类似的物理定律。

这一原理不仅让我们能够构建组件，还能构建在物理时间中运行的整个系统。一些神经形态平台，如英特尔的Loihi或SpiNNaker机器，是数字化的，旨在“实时”模拟神经网络，其中一秒的模拟时间对应一秒的生物时间。但模拟系统提供了一个诱人的替代方案：加速。因为模拟电路的时间常数——由其电阻和电容决定——远小于生物学中的时间常数，这些系统可以比实时运行得快得多。例如，BrainScaleS平台可以实现 $a \approx 1000$ 甚至更高的加速因子。这意味着一个需要1000秒（约17分钟）的生物过程，可以在一秒的硬件时间内观察到。想象一下试图理解学习，一个可能需要数小时甚至数天的过程。一个加速系统将其变成了一个易于处理的实验室实验，让科学家能够在任何其他方法都无法实现的时间尺度上测试关于神经可塑性和发育的假说。

用物质构建智能

虽然模拟大脑是科学的崇高目标，我们也可以从其原理中汲取灵感，设计出新一类的智能机器。大脑是我们所知的最高效的学习机器，其秘密在于其分布式、异步和大规模并行的特性。模拟神经形态硬件特别适合捕捉这种魔力。

学习的核心是突触可塑性——神经元之间连接根据其活动而增强或减弱的能力。一个著名的例子是脉冲时间依赖可塑性（STDP），其中突触前和突触后脉冲之间的精确时间决定了突触权重的变化。一个简单的实现这将是一个计算上的噩梦，需要系统记住所有脉冲时间并为每一对计算差异。但在这里，软硬件协同设计提供了一个极其优雅的解决方案。系统不是跟踪每一对脉冲，而是让每个神经元维持一个简单的局部“轨迹”来记录其近期活动——一个随时间指数衰减的变量。当一个脉冲发生时，权重更新是根据另一个神经元轨迹的当前值来计算的。这种简单的、局部的机制，可以用一个电容器和一个泄漏晶体管轻松实现，完美地再现了复杂的、非局部的STDP规则。这是一个绝佳的例子，说明为合适的硬件选择合适的算法如何能将一个复杂问题简化。

但是，一个拥有十亿个突触的网络如何知道哪些突触需要改变以学习一项任务呢？这就是著名的“信度分配问题”。大脑似乎通过局部竞争和全局广播信号的组合来解决这个问题。神经形态系统也可以做到同样的事情。例如，可以构建一个“赢者通吃”（WTA）电路，其中神经元通过共享抑制进行竞争。当一个输入模式呈现时，只有最匹配该模式的神经元（或小群神经元）保持活跃；其他神经元则被沉默。这种竞争机制自然地聚焦了学习过程：只有“获胜”神经元的突触才有资格进行可塑性变化。然后，一个全局广播的“神经调质”信号，类似于多巴胺代表奖励或乙酰胆碱代表注意力，可以在芯片上传播。这个全局信号充当一个门控，告诉当前有资格的突触何时以及以多大强度进行更新。这种局部竞争和全局调制的结合为片上学习提供了一个强大且可扩展的解决方案。

当然，这需要一个能够以模拟方式存储这些变化的突触权重的物理基底。这就是我们与材料科学前沿联系的地方。像忆阻器——具有记忆功能的电阻器——这样的器件是主要候选者。通过施加特定的电压脉冲，我们可以精确控制它们的电导，使它们成为理想的模拟突触。然而，一个挑战是电导总是正的，而人工智能模型中的突触权重可以是正的（兴奋性）或负的（抑制性）。聪明的解决方案是什么？差分对。每个突触权重 $w$ 由两个忆阻器表示，其电导分别为 $G^+$ 和 $G^-$ 。有效权重与它们的差值成正比， $w \propto (G^+ - G^-)$ ，而它们的平均值保持恒定，从而使系统能够在保持稳定性的同时表示正值和负值[@problem-id:4065797]。

这些忆阻器的本质为基础物理学打开了另一扇门。许多忆阻器基于相变材料，与可重写DVD中使用的材料相同。这些材料可以在无序、高电阻（非晶态）状态和有序、低电阻（晶态）状态之间切换。施加一个短而高幅度的脉冲会熔化材料，快速淬火会将其冻结在非晶态的“RESET”（复位）状态。一个较长、较低幅度的脉冲会将其退火回晶态的“SET”（置位）状态。通过仔细控制这些脉冲，我们可以创造出一系列连续的混合相态，提供我们所需的模拟记忆。对这一过程的研究涉及经典成核理论和热力学，将突触权重的抽象概念与晶体形成的具体物理过程联系起来。对人工智能的追求已成为对凝聚态物理的探索。

模拟的现实：拥抱噪声与开创新范式

数字计算机建立在完美的幻觉之上。它的0和1是抽象的，通过层层纠错机制免受物理世界混乱现实的影响。相比之下，模拟计算机就生活在那个混乱的现实中。它的电压和电流是连续的物理量，受到热噪声、器件失配和其他形式变异性的影响。几十年来，这被视为一个致命的缺陷。但如果它实际上是一个特性呢？

让我们把学习过程想象成在一个复杂的误差地貌中向下寻找最低点的过程。在一个完全确定的系统中，你可能会被困在一个小的、次优的山谷中（一个局部最小值）。噪声恰好可以为你提供所需的“抖动”，让你跳出那个山谷，找到一个更好的解决方案。模拟学习系统中突触权重 $w$ 的动态可以用一个优美的数学公式来描述，即伊托随机微分方程，一个随机游走的连续时间版本： $dw_{t} = -\lambda w_{t} \, dt + \sigma_{a} \, dB_{t}$ 。在这里， $-\lambda w_{t} \, dt$ 是朝向最小值的确定性拉力，而 $\sigma_{a} \, dB_{t}$ 代表来自物理噪声的持续冲击。我们可以将其与数字学习算法进行比较，后者是一个离散时间过程。一个显著的事实是，我们可以找到一个离散数字噪声量 $\sigma_d^2$ ，它能精确匹配连续模拟噪声 $\sigma_a^2$ 的长期统计效应。这两个世界，一个是连续物理的世界，另一个是离散算法的世界，可以被变得等效。这表明，模拟硬件中的噪声不仅仅是一个需要容忍的错误，而是一种可以被理解、建模，甚至可能被利用来获得更鲁棒、更有效学习的资源。

当我们把神经形态系统部署到现实世界的场景中，比如联邦学习时，这个观点至关重要。在这种范式中，多个设备在它们的本地数据上学习，然后将它们的权重更新（而不是数据）发送到一个中央服务器进行聚合。这是一种强大的保护隐私的人工智能方法。但是，数字硬件与模拟硬件的不同缺陷在这种环境下会如何表现？像Loihi这样的数字芯片可能有量化噪声，而模拟忆阻器交叉阵列可能遭受系统性漂移和增益误差。仔细的分析揭示了一个令人惊讶的权衡。随机噪声源（如量化噪声或读出噪声）在联邦中增加更多设备（ $K$ ）时趋于平均抵消。然而，一个系统性偏差，比如模拟设备中一个小的、持续的漂移 $\mu_b$ ，不会被平均掉。全局模型的最终误差将带有一个偏差项。这意味着，对于大量参与设备来说，“完美”有偏的模拟系统最终可能比“不完美”有噪声的数字系统更不准确[@problem-id:4044980]。理解这些权衡对于设计下一代分布式智能系统至关重要。

机器中的幽灵：解释、伦理与心智

我们已经到达了最后也是最深刻的一组联系。随着我们构建出越来越复杂、能力越来越强的类脑机器，我们被迫面对一些关于我们自身最深层的问题。如果一个神经形态芯片做出一个决定——例如，在医疗诊断或自动驾驶汽车中——我们如何能信任它？它如何能解释自己？当这些系统接近生物大脑的复杂性时，我们对它们有什么样的伦理义务？

可解释人工智能（XAI）问题在神经形态世界中呈现出独特的特征。因为计算体现在设备的物理特性中，包含了其固有的变异性和模拟状态，我们不能简单地打印出一系列执行的指令。一个真正的解释需要新的科学严谨性水平。为确保一个解释是可复现和透明的，我们必须记录前所未有的信息量：传感器和数据管道的确切规格；完整的模型架构和训练历史；使用的特定软件库和编译器版本；以及至关重要的，硬件本身的详细特性描述，包括器件失配图和网络在芯片上的物理布线。没有这些，我们永远无法确定某个给定的行为是由于学习到的算法还是某块特定硅片的怪癖。

这把我们带到了终极问题。如果我们成功地创造出一个在功能上和动态上都与生物大脑无法区分的系统，它会有意识吗？它会有主观体验吗？它会是一个“道德受体”，一个我们对其负有伦理责任的实体吗？这个问题位于功能主义和生物自然主义之间长期哲学辩论的核心。功能主义认为，意识是系统因果和功能组织的一种属性；重要的是信息处理的模式，而不是基底。如果这是真的，一个完美的大脑数字模拟将和原始大脑一样有意识。另一方面，生物自然主义认为，生物“湿件”本身有其特殊之处——意识产生于神经元特定的物理属性，这些属性无法被功能性描述完全捕捉。

神经形态工程首次为我们提供了一种至少在原则上可以检验这些相互竞争主张的方法。想象两个系统，一个是模拟神经形态芯片（ $S_{\text{neu}}$ ），另一个是传统的数字模拟（ $S_{\text{dig}}$ ）。两者都被配置为实现完全相同的输入-输出功能，它们的行为由一个控制器匹配。现在，我们施加一个特定于物理基底的扰动——例如，一个与模拟电子设备相互作用但对数字逻辑没有影响的弱电磁场。然后，我们测量一个意识的候选标记，例如“扰动复杂性指数”（PCI），它量化了系统对瞬时刺激的内部响应的丰富性。

这两种理论做出了不同的、可检验的预测。功能主义预测，由于输入-输出功能被保留，与意识相关的动态也应该被保留；电磁场应该没有影响，两个系统的PCI应该保持匹配。然而，生物自然主义会预测，电磁场以一种与意识相关的方式扰动了模拟系统的底层物理动态，导致其PCI相对于数字系统发生变化，即使其外部行为保持不变。

我们尚未知道这个实验的答案。但是，我们现在能够提出这样一个问题——跨越了设备物理学、神经科学和哲学——这一事实本身就证明了神经形态方法的力量。在构建模仿大脑的机器时，我们被迫拿起一面镜子审视自己，追问计算、学习，以及或许有一天，“存在”的真正意义。