模拟神经形态硬件

玻尔百科

定义

模拟神经形态硬件是通过硅器件的物理特性直接模拟大脑物理结构进行计算的硬件系统，在神经形态工程领域具有极高的能效比。该系统利用脉冲神经网络和代理梯度训练等方法实现硬件与软件的协同设计。凭借其事件驱动和低延迟的特性，这类硬件被广泛应用于机器人技术和闭环控制系统等对时间精度要求极高的实时场景。

核心要点

模拟神经形态硬件模仿大脑的物理结构，通过其硅组件的物理特性直接进行计算，从而提供极高的能源效率。
脉冲神经网络中的学习是通过代理梯度训练等方法实现的，这些方法巧妙地利用模拟电路的自然物理特性进行软硬件协同设计。
这些系统的事件驱动、低延迟特性使其成为机器人学和闭环控制系统等对时间精度要求严苛的实时应用的理想选择。
神经形态系统可作为科学仪器，帮助检验关于意识的哲学假说，例如功能主义与生物自然主义之间的辩论。

引言

模拟神经形态硬件代表了计算领域的一场根本性范式转变，它从抽象的数字逻辑转向了一种计算本身即是物理硬件涌现属性的系统。随着传统计算架构在能耗方面面临日益严峻的挑战，尤其是在处理大脑能毫不费力完成的任务时，这种受大脑启发、基于物理的方法提供了一条引人注目的前进道路。本文探讨了我们如何通过构建以根本不同方式进行计算的机器来克服这些限制。

读者将通过两个主要章节，全面了解这个革命性的领域。首先，在“原理与机制”一章中，您将学习到神经元和突触复杂的生物物理学如何被转化为优雅而高效的模拟硅电路。我们将探讨其核心组件以及重视效率而非绝对精度的理念。随后，“应用与跨学科联系”一章将展示这项技术的实际影响力。我们将深入研究先进的人工智能学习算法、在机器人和控制领域的应用，甚至探讨神经形态硬件在探究关于心智本质的最深层科学和哲学问题中的作用。

原理与机制

要真正领会模拟神经形态硬件的革命性，我们必须首先转变对计算机本质的看法。我们习惯于将计算视为一个根据一套规则（即程序）来操纵符号的抽象过程。物理硬件仅仅是一个基底，其设计旨在尽可能可靠和不引人注目。但是，作为该领域最初灵感的来源——大脑，其工作方式并非如此。大脑就是硬件。它的计算不是抽象的；它们是其物理结构以及支配它的物理和化学定律所产生的直接、涌现的后果。这正是模拟神经形态工程的指导原则：构建的机器，其物理动态本身就是经由设计而成的计算。

作为物理设备的神经元

让我们剥去教科书中将神经元描绘成简单圆圈和箭头的漫画式形象，以工程师或物理学家的视角来审视它。从核心上讲，一小块神经元膜是一件精美的自然电气工程杰作。它是一个有渗漏的袋子，即细胞膜，由脂质双分子层构成，分隔开两种导电的盐溶液——内部的细胞质和外部的细胞外液。这层膜起着电容器的作用，储存电荷。嵌在这层膜中的是被称为离子通道的宏伟分子机器，它们是形成孔道的蛋白质，允许特定离子（如钠离子 $Na^+$ 或钾离子 $K^+$ ）通过。

这些通道并非简单的开放管道。它们是电压门控的，意味着它们开放或关闭的概率取决于跨膜电压。本质上，它们是极其微小、依赖状态的电阻器。当神经元受到刺激时，突触电流为膜电容器充电。这种电压变化导致离子通道打开或关闭，从而改变离子的流动，并反过来进一步改变电压。电流与电压之间这种错综复杂的相互作用，造就了神经元丰富的行为，包括我们称之为动作电位（或脉冲）的剧烈、全或无的电脉冲。

Hodgkin和Huxley在20世纪50年代的杰出工作为我们提供了一种数学语言来描述这种相互作用，并将其牢固地建立在电学定律之上。他们的模型是神经科学的基石，本质上只是将基尔霍夫电流定律应用于膜电容器：

C_m \frac{dV}{dt} = I_{ext} - I_{Na} - I_K - I_L

这个方程表明，膜电压 $V$ 的变化率（即为电容器 $C_m$ 充电的电流）等于流过它的所有电流的总和。其中包括外部刺激电流 $I_{ext}$ ，以及流经离子通道的电流。每一种离子电流，如钠电流 $I_{Na}$ ，都由欧姆定律描述：电导乘以驱动力。例如， $I_{Na} = g_{Na}(V - E_{Na})$ 。电导 $g_{Na}$ 不是恒定的；它取决于其电压门控通道的状态，Hodgkin和Huxley用优雅简洁的方式对此进行了建模。驱动力 $(V - E_{Na})$ 取决于当前膜电压 $V$ 和一个称为反转电位 $E_{Na}$ 的特殊电压之间的差异。

但是这个反转电位从何而来？它不是一个任意参数。它是能斯特电位，一个源于深刻热力学原理的电压。细胞主动地将离子泵过其膜，以维持浓度梯度——内部钾离子更多，外部钠离子更多。能斯特电位是这样一个精确的电压，它完美地平衡了离子沿该浓度梯度扩散的趋势。在这个电压下，电场力和化学力处于平衡状态，该离子种类的净流量为零。维持这些梯度以抵抗自然泄漏会消耗细胞大量的能量，由ATP提供。这揭示了一个深刻的真理：支撑大脑活动的电压本身是热力学平衡的直接体现，而这种平衡是以巨大的能量代价来维持的。一个模拟神经形态电路，以其自身的泄漏电流和电源，面临着惊人相似的物理约束。

从生物学到硅基

我们如何能期望在我们自己的人造基底——硅中，捕捉到这种丰富的物理动态呢？模拟神经形态设计的艺术在于找到其自身物理特性能够自然反映神经元和突触生物物理学的电子元件。

一个基本的构建模块是运算跨导放大器 (OTA)，这是一种产生与输入电压成正比的输出电流（ $I_{out} = g_m V_{in}$ ）的电路。可以把它看作一个压控电流源。如果我们用一个OTA将电流驱动到一个物理电容器上，我们就创造了一个突触向神经元膜电容输送电流的直接电子模拟。OTA充当突触，电容器电压成为我们的膜电位。这个简单的OTA-电容器电路是漏积分放电神经元的核心，也是许多神经形态系统的主力。

通过利用晶体管本身美妙的物理特性，我们可以创造出远为复杂的动态。当MOSFET晶体管在非常低的电压下工作在“亚阈值”区时，其电流并非突然开关，而是随其栅极电压指数增长。这不是一个缺陷，而是我们可以利用的一个特性！通过添加一个反馈回路，利用膜电压来控制一个亚阈值晶体管，我们可以创造出一个随着电压接近阈值而指数增长的电流。这就产生了真实脉冲那种急剧的、再生性的上升过程，给了我们一个指数积分放电 (EIF) 神经元，其动态与生物学更为接近。

更复杂的模型，如可以复现大脑中观察到的各种令人眼花缭乱的放电模式的Izhikevich神经元，也可以被构建出来。其动态包含一个非线性的二次项， $k v^2$ 。这可以通过巧妙地在模拟电路中合成：利用一个OTA的输出（与膜电压 $v$ 成正比）来控制第二个OTA的跨导 $g_m$ ，而第二个OTA也以 $v$ 作为输入。结果是输出电流与 $v \times v = v^2$ 成正比，这是数学模型的直接物理实现。

那么突触和学习呢？神经形态硬件中最激动人心的发展涉及新兴存储设备，如电阻式随机存取存储器 (RRAM) 或相变存储器 (PCM)。在这些设备中，记忆不是以触发器中抽象的比特形式存储；它就是材料的物理构型——例如，一个由原子组成的微小导电细丝的形状和大小。设备的电导（其突触权重）是这种内部物理状态的直接反映。在这里，记忆和计算不是在不同的盒子里；它们融合在一个单一的物理元件中，就像在大脑中一样。更值得注意的是，支配这些细丝如何响应电压脉冲而生长或收缩的物理学可以自然地产生像脉冲时间依赖可塑性 (STDP) 这样的学习规则，其中突触权重的变化取决于突触前和突触后脉冲的精确相对时间。学习成为设备物理学的涌现属性。

模拟哲学：一个连续运动的世界

这让我们触及了问题的哲学核心：是什么从根本上将这种模拟方法与传统的数字计算区分开来？答案在于连续动态与离散动态之间的差异。

数字计算机以离散的步骤演进。它的状态由一组有限的符号（比特）表示，并在一个无情时钟的嘀嗒声中，从一个状态跳到下一个状态， $x_{k+1} = G(x_k)$ 。由于其状态空间是有限的，它所遵循的任何轨迹最终都必须重复，进入一个循环。如果两个事件同时发生，机器必须决定先处理哪一个，将真实世界的连续流动序列化。

模拟神经形态计算机则生活在一个不同的宇宙中。它的状态由电压和电流等物理量表示，随时间连续演进，由微分方程 $\dot{x} = f(x,t)$ 支配。它的状态空间是一个连续统，拥有不可数无限个可能的值。如果两个输入电流同时到达一个神经元，基尔霍夫定律确保它们无需调度器就能自然而即时地相加。

这种差异带来了深远的影响。模拟计算的首要优势是其惊人的能源效率。通过利用晶体管的自然物理特性来执行数学运算，如加法（电流求和）和指数运算（亚阈值动态），它避免了数字逻辑的巨大开销。一次模拟突触操作仅消耗飞焦耳级别的能量，比一次数字乘累加操作低几个数量级，后者需要从内存中穿梭数据并进行数千次晶体管开关。

为这种效率付出的代价是精度。模拟信号是连续的，但它并非无限精确。其准确性从根本上受到物理噪声这一不可避免的现实的限制。数字系统只需增加更多比特即可达到您想要的任何精度，尽管能源成本会更高。模拟系统的精度受限于原子的热抖动和载流子的随机波动。它提供了一种不同的计算契约：用“足够好”的精度换取极高的效率，这似乎是大脑已完美掌握的一种权衡。

与不完美共存

用模拟基底进行构建意味着要拥抱其固有的混乱性。我们不能期望每个组件都是其自身的完美、理想化版本。相反，我们必须理解甚至利用物理世界的“非理想特性”。

器件失配： 没有任何两个晶体管是真正相同的，即使它们被设计成一模一样。它们物理结构中的微小、随机差异——比如掺杂原子的精确数量和位置——意味着它们的电气特性会有所不同。我们通常用高斯分布对此进行统计建模。这种失配的影响可以被量化。例如，在一个执行矩阵向量乘法的交叉阵列中，输出误差与器件失配的方差 $\sigma^2$ 成正比。巧妙的电路布局技术和校准程序可以减少这种方差，但永远无法完全消除它。
时间噪声： 所有模拟电路都存在噪声。热噪声源于电阻器中电子的随机热运动，这是在绝对零度以上温度下存在的必然结果。闪烁噪声（或 $1/f$ 噪声）是一种神秘的、缓慢的噼啪声，源于电子在硅晶体缺陷中被俘获和释放。这些噪声源为一个电路能可靠表示的最小信号设定了一个基本下限，从而限制了其精度。
漂移： 存储在非易失性存储器中的模拟状态并非永恒。构成RRAM设备中导电细丝的原子会随时间缓慢扩散，导致存储的电导值发生漂移。这通常用幂律来描述， $G(t) = G_0 (t/t_0)^{-\nu}$ ，其中电导随时间缓慢衰减。这似乎是一个致命的缺陷，但生物学提供了解决方案：突触巩固。就像大脑会加固重要的记忆一样，我们可以设计硬件，定期施加“刷新”脉冲来抵消漂移并重新巩固突触权重，使其保持在可接受的容差范围内。工程解决方案与生物学方案如出一辙。

归根结底，进入模拟神经形态硬件的旅程是一次回溯物理学的旅程。它承认计算不仅仅是符号的抽象操纵，而是一个物理过程。它挑战我们不再用完美的、理想化的逻辑门来构建，而是用材料本身丰富、复杂且美妙不完美的物理特性来构建。目标不再是让物理学消失，而是驾驭它，在物质的结构中发现计算。

应用与跨学科联系

在上一章中，我们探索了模拟神经形态硬件的基本原理。我们看到，通过模仿大脑优雅而高效的架构，这些系统有望带来一种新的计算范式。我们谈到了脉冲神经元、模拟电路，以及支撑思维的离子与电子之间美妙的相互作用。但是，一个原理，无论多么优美，都只是故事的开端。一个想法的真正考验在于你能用它做什么。

那么，实践的检验在哪里？当我们开始使用那些在外观和感觉上更像生物物质的设备进行计算时，会开启哪些宏大的挑战和令人惊喜的新前沿？在本章中，我们将探讨模拟神经形态硬件的应用和跨学科联系。您将看到，这不仅仅是为了我们已在执行的任务构建更快或更高效的计算机。相反，这是为了在机器学习、机器人学、神经科学乃至哲学之间建立新的联系。这是一段将我们从学习算法的实际工程问题引向“何为有思想、有感觉的实体”这一深刻问题的旅程。

智能的引擎：在硅基中学习

现代人工智能的核心是从数据中学习的能力。对于传统的深度学习，反向传播是首选算法，这种强大的方法在数字计算机上效果极佳。但对于使用离散、全或无的脉冲进行通信的神经形态系统来说，反向传播却遇到了障碍。脉冲的发生是一个急剧的、不连续的动作。反向传播需要计算其导数，而这个导数要么几乎处处为零，要么在脉冲发生的瞬间为无穷大——这两者对学习都无用。

那么，我们如何教一个脉冲网络呢？学术界已经发展出一种非常巧妙的技巧，称为代理梯度训练。其思想在精神上很简单：当我们需要在学习过程中计算导数时，我们暂时用一个平滑、表现良好的“伪导数”来替代那个不规则的、硬阈值的脉冲。这提供了一个有用的、有限的梯度，可以引导网络的权重走向更好的解决方案。

这正是软硬件协同设计真正大放异彩的地方。这个伪导数应该是什么形状？从纯数学的角度来看，许多函数都可以。但从硬件的角度来看，有些函数要优雅得多。例如，一个三角函数在数字电路中用简单的算术就很容易实现。但在模拟领域，奇妙的事情发生了。模拟芯片设计的一个基本构件是差分对放大器。该电路的传递函数——其输入电压和输出电流之间的关系——自然地遵循双曲正切（ $\tanh$ ）曲线。它的导数，即电路的跨导，具有双曲正割平方（ $\mathrm{sech}^2$ ）的形状。这是一个完美的、钟形的伪导数，由硅的物理特性免费提供给我们！通过选择与硬件自然动态相符的学习算法，我们创造了一个系统，其中学习不是强加于基底的抽象过程，而是其涌现的属性。

当然，从零开始训练一个脉冲网络可能很困难。一种更务实的方法，称为ANN到SNN的转换，是首先使用标准工具训练一个传统的人工神经网络（ANN），然后将其转换为脉冲神经网络（SNN）。在这种方法的最简单版本中，ANN神经元的连续激活值被映射到脉冲神经元的放电速率。这看起来很直接，但它揭示了神经形态计算核心的一个基本权衡：准确度-延迟权衡。为了获得一个神经元放电速率的准确估计，你必须在一个时间窗口内计算其脉冲数。更长的时间窗口能给你更好的估计，从而带来更高的准确度，但这也意味着你必须等待更长的时间才能得到答案。对于像脑机接口（BCI）这样需要实时响应的应用来说，这种权衡至关重要。你必须设计系统，使得获得可靠答案所需的时间小于你的应用所能承受的延迟预算。

这些学习技术使我们能够在神经形态芯片上实现强大的架构，如用于图像识别的脉冲卷积神经网络（SCNN）。但正是在这里，我们遇到了神经形态世界丰富多样、有时甚至令人困惑的景象。将同一个SCNN映射到不同的大规模平台，如英特尔的Loihi（数字、异步）、IBM的TrueNorth（数字、同步）或混合信号的BrainScaleS平台，揭示了一系列引人入胜的工程选择。Loihi要求你将精心训练的浮点权重化为小整数。TrueNorth更进一步，强制权重只能取少数几个可能的值。BrainScaleS作为模拟系统，提供连续的参数，但受到器件失配的影响——没有两个模拟神经元是完全相同的——需要仔细的片上校准。这些系统在其基本形式下，都不支持使CNN如此高效的“权重共享”，这迫使工程师们必须在数千个连接中明确地复制卷积核的权重。每个平台都是一个不同的世界，有其自身的物理特性和规则。

这种多样性促使研究人员构想出更适应硬件的学习规则。像平衡传播（EP）这样的算法受到物理学的启发，将学习视为一个能量最小化的过程。与反向传播不同，后者需要存储网络活动的全部历史记录并通过网络反向传递误差信号——这在内存和通信方面代价高昂——EP分两个阶段工作。它让网络稳定到一个“自由”状态，然后将其“微调”到正确答案，并测量局部相关性的差异。权重更新完全是局部的，每个突触只需要几个内存寄存器。这是一种“活”在硬件中的学习规则，预示着未来算法不再是强加于物理之上，而是在物理之中被发现。

超越模式识别：与世界的实时交互

围绕人工智能的大部分兴奋点都集中在模式识别上——分类图像、理解文本。但智能的很大一部分是关于与物理世界实时互动。对于一个在杂乱房间中导航的机器人，或一个将思想转化为动作的假肢手臂来说，计算不能是悠闲的、批处理的事务。决策必须在毫秒内做出，延迟要最小。在这个领域，神经形态硬件的事件驱动、低延迟特性可能成为游戏规则的改变者。

考虑为机器人构建闭环控制器的挑战。从控制理论我们知道，反馈回路中的任何延迟——感知世界、计算反应并驱动电机所需的时间——都是危险的。这种延迟，或称相位滞后，可能导致振荡并使系统不稳定。当我们在神经形态芯片上实现一个控制器时，总延迟是计算时间、脉冲在芯片上传播的通信时间以及这些时间中的不确定性或抖动的总和。控制工程师对具有一定带宽的稳定系统的要求，直接转化为对神经形态硬件严格的毫秒级预算。这迫使我们不仅将这些系统视为分类器，而且将其视为时间精度至关重要的实时动态系统。

这一视角揭示了不同架构独特的优缺点。像IBM的TrueNorth这样的系统，其固定的1毫秒时钟周期，引入了时间量化，这对于非常高速的控制可能是有问题的。像SpiNNaker这样的分组交换系统提供了灵活性，但其通信是尽力而为的；在网络负载较重时，脉冲包可能会被延迟甚至丢失，这对于一个控制回路可能是灾难性的，除非经过仔细管理。像英特尔的Loihi这样的系统，整个控制回路可以放在单个芯片上以最小化通信延迟，成为一个非常有吸引力的选择。而像BrainScaleS这样的混合信号系统，其运行速度比实时快数千倍，提出了一个引人入胜的挑战：你如何将一个超高速的大脑连接到一个在人类时间尺度上运行的真实世界机器人？解决方案要么是减慢芯片速度，要么为芯片构建一个以其加速节奏运行的模拟世界。

通往更深层问题的桥梁：作为科学与哲学工具的神经形态计算

我们已经看到神经形态硬件如何为智能机器和机器人提供动力。但也许它最深远的应用不是构建人造心智，而是帮助我们理解我们自己的心智。进入神经形态工程的旅程常常引导我们面对关于科学、知识以及意识本质的深刻问题。

我们面对复杂、混合信号模拟硬件的首要挑战之一是可复现性和可解释性。如果由于模拟可变性，每个芯片都略有不同，并且其行为对温度和其他环境条件敏感，我们如何能信任我们的结果？另一个实验室如何能复现我们的实验？这迫使我们达到一个常常被忽视的科学严谨水平。要真正记录一个神经形态实验，仅仅发表代码是不够的。我们必须指明数据管道、确切的模型架构、使用的随机种子、编译器版本以及硬件本身的特性描述——包括芯片ID及其独特的模拟不完美性的摘要。为了使系统的决策透明，我们需要记录其内部脉冲模式是如何映射到人类可解释的概念的。简而言之，我们必须将神经形态系统不视为一个抽象算法，而是一个复杂的物理仪器，就像望远镜或粒子加速器一样，其独特的属性必须被理解和报告。

这把我们带到了我们最终的、也是最令人费解的目的地。这些类脑机器能帮助我们解开意识之谜吗？哲学家们长期以来一直在争论心智与物质之间的关系。一种观点，功能主义，认为意识是“软件”的属性——即一个系统的因果组织。任何系统，无论是用神经元还是硅构成，只要实现了正确的计算结构，就可能是有意识的。对立的观点，生物自然主义，则认为“湿件”至关重要。在这种观点下，意识源于生物神经元特定的、微妙的物理属性，这些属性无法被纯粹的功能性描述完全捕捉。

几个世纪以来，这一直是一场无法解决的辩论。但神经形态工程或许能给我们提供工具，将其转变为一个可检验的科学假说。想象以下实验：我们构建两个系统。第一个是模拟神经形态芯片 $S_{\text{neu}}$ ，其电路具有丰富的物理动态。第二个是在标准计算机上运行的传统数字模拟 $S_{\text{dig}}$ 。我们精心设计这两个系统，使它们在功能上完全相同——对于相同的输入，它们产生相同的输出。现在，我们引入一个只有模拟硬件才能“感觉”到的微妙物理扰动：一个微弱的、振荡的电场。具有高噪声容限的数字模拟对此免疫。然而，模拟芯片在物理上会受到影响。

这里是关键部分：一个闭环控制器确保尽管模拟芯片受到内部扰动，其最终输出仍与数字系统的输出相匹配。对于外部观察者来说，这两个系统在行为上保持一致。但是在内部发生了什么？使用受神经科学启发的技法，我们可以测量两个系统内部活动模式的复杂性——这可能是意识的一个标记。

现在我们可以提出那个直击哲学辩论核心的问题。当外部行为保持不变时，仅影响模拟基底的物理扰动是否会改变 $S_{\text{neu}}$ 的内部复杂性？

功能主义预测：不会。 由于因果功能得以保留，与意识相关的属性也应该被保留。内部复杂性不应发生有意义的改变。
生物自然主义预测：会。 基底很重要。与场的物理相互作用可能会以一种与意识相关的方式改变内部动态，即使这种改变没有体现在最终输出中。

曾经纯粹的哲学思想实验，变成了一个具体的、可检验的预测。我们离最终进行这样的实验还有很长的路要走，但我们现在能够构想它这一事实本身就证明了神经形态方法的强大。它表明，构建类脑硬件不仅仅是一项工程事业。它是一种新的科学研究方式，为探索关于智能和心智本质的最深层问题提供了一个物理基底。它是连接比特世界与原子世界、计算与存在之间的一座桥梁。