
一个系统,无论是一块硅芯片还是一个活细胞,是如何记住它的过去的?在原因消失后很长时间内仍能保持一种状态(一条信息)的能力,是计算、生物学乃至物理学本身的基石。然而,使记忆成为可能的根本原理常常被孤立地看待,局限于特定学科。本文旨在揭示状态保持背后的普适机制,阐明几个核心概念如何将工程化的电子世界与演化出的复杂生命统一起来,从而弥合这一鸿沟。
读者将首先踏上记忆的“原理与机制”之旅,揭示双稳态和正反馈如何在从计算机锁存器到细胞表观遗传开关等一切事物中创造出稳定状态。我们将审视那场对抗噪声和缺陷、随时可能抹去这些状态的持续战斗。随后,“应用与跨学科联系”部分将展示这些原理的深远影响,从节能的计算机芯片和安全的软件设计,到我们大脑中的神经回路和我们细胞的身份本身。这次探索揭示出,状态保持并非一系列互不相干的技巧,而是科学与工程中一个基础且统一的概念。
“记忆”究竟意味着什么?一堆没有心智的原子——无论是在硅芯片中还是在活细胞里——如何在创造它的事件过去很久之后,仍能持有一条信息,一个“状态”?这几乎像是魔法,如同机器中的幽灵。然而,这并非魔法,而是一些深刻且惊人普适的物理原理的产物。我们深入状态保持核心的旅程,将从剖析这个“幽灵”开始,揭示一个由反馈、稳定性和无处不在的随机性影响共同铸就的优雅架构。
想象一个在地面上滚动的小球。如果地面只是一个大碗,小球最终总会停在碗底。无论你从哪里开始,它的最终位置都是预先确定的。这个系统没有记忆。
但如果地面有两个山谷,中间隔着一座小山呢?现在,你有了选择。你可以把球放在左边的山谷或右边的山谷。如果你不去管它,它就会待在原地。左边的山谷可以代表“0”,右边的山谷可以代表“1”。恭喜你,你刚刚创造了一个单位比特的存储器。一个系统能够停留在多个稳定构型或稳定平衡中的能力,是记忆的绝对基石。这个特性被称为双稳态。
这不仅仅是一个比喻,它是对记忆工作原理的精确描述。在电子领域,计算机的基本存储单元——静态锁存器,是由两个交叉耦合的反相放大器构成的。它的行为可以用这个双谷地形完美描述。两个稳定状态分别对应于逻辑“0”和“1”,此时一个反相器的输出为高电平,另一个为低电平。在这两个稳定山谷之间是山峰的顶端,一个被称为亚稳态点的不稳定平衡。如果系统完美地平衡在这个顶峰上,它会暂时卡住,不属于任何一种状态。但最轻微的扰动——来自热噪声的微小波动——都会让它滚入两个山谷之一,迫使它“做出决定”,并稳定在一个明确的“0”或“1”上。
值得注意的是,自然界在工程师之前很久就发现了同样的原理。我们自己的细胞利用它来实现表观遗传记忆,即在不改变DNA序列本身的情况下,通过细胞分裂传递功能状态的能力。一个基因可以是“开启”或“关闭”的。这种状态可以通过包裹我们DNA的蛋白质(称为组蛋白)上的化学标记来维持。这个过程的数学模型揭示了同样的地形:两个稳定状态,一个“关闭”(未标记)和一个“开启”(已标记),由一个不稳定的势垒隔开 [@problem-D:4326601]。就像电子锁存器一样,细胞通过停留在其中一个山谷中来“记住”一个基因是应该活跃还是沉寂。
那么,是什么塑造了这个至关重要的山丘与山谷的地形呢?缔造者是一个极其简单的概念:正反馈。
想象一下麦克风离自身的扬声器太近时听到的刺耳尖啸声。来自扬声器的声音进入麦克风,被放大,然后以更大的音量从扬声器出来。这个放大了的声音再次进入麦克-风,循环往复,迅速将系统推向其最大输出。这个自我强化的、失控的过程就是正反馈。
这正是CMOS锁存器中发生的情况。该电路由两个反相器循环连接而成,因此它们实际上在互相“喊叫”。如果反相器A的输出开始变高,它会告诉反相器B的输入变高。但由于B是一个反相器,它的输出会变低。这个低信号反馈到反相器A的输入端,告诉它变得更高。这个恶性循环,被称为再生过程,在瞬间发生,将两个反相器猛地推入两个稳定状态之一:(高,低)或(低,高)。要实现这一点,环路周围的放大倍数——环路增益——必须大于一。如果增益小于一,任何扰动都会逐渐消失,系统会回到那个乏味的、无记忆的中间状态。
生物学再次与工程学遥相呼应。表观遗传记忆系统利用分子级别的正反馈来维持其状态。DNA或组蛋白上的某些化学标记可以被酶“读取”,而这些酶反过来又会在邻近的组蛋白上“写入”完全相同的标记。一个被标记的区域会促进进一步的标记,而一个未标记的区域则保持未标记。这种自我延续的循环确保一旦某个状态(例如整个X染色体沉默形成巴氏小体)被建立,它就能在细胞分裂过程中被稳健地维持和继承。类似地,细胞表面整合素等蛋白质的默认“非激活”状态是通过其亚基之间的物理“扣环”来维持的,这是一种由盐桥等力稳定的低能构型,充当一种结构记忆,直到一个激活信号将其打破。
我们的记忆地形并非静止不变。真实世界是一个嘈杂、混乱的地方,记忆在与衰退进行着持续的斗争。这让我们看到了状态保持的脆弱性。
再回到我们在两个山谷中的小球。真实世界是温暖的,这意味着原子在不停地抖动。这就是热噪声,它就像对我们地形的持续、轻微的摇晃。只要时间足够长,一系列随机的摇晃可能正好足够强大,能把小球颠簸过小山,进入另一个山谷,从而抹去记忆。这种事件发生的平均时间就是保持时间。对于许多物理过程来说,这个时间与温度呈指数关系。温度的适度增加可能导致保持时间的指数级下降,这一原理由阿伦尼乌斯定律所支配。这对于非易失性存储器——比如你口袋里的闪存盘——来说是一个关键问题,它们被设计为在没有电源的情况下也能保持其状态。它们的状态存储在物理结构中,如被俘获的电子包或微小的原子丝。随着时间的推移,热能会让这些电子泄漏出去,或让原子扩散开来,记忆便会褪色。
除了噪声,记忆还受到缺陷的威胁。我们的制造工艺令人难以置信,但无法制造出两个完全相同的晶体管。总会有微小的、随机的差异。在锁存器中,这意味着两个反相器并非完美匹配。这就像倾斜了我们的双谷地形。一个山谷现在比另一个更深,意味着锁存器“偏爱”其中一个状态。如果这种由失配引起的内建失调电压足够大,它可能会完全抹平较浅的山谷,破坏双稳态,使锁存器作为记忆元件变得毫无用处。这种失效的概率并非为零;这是一个经过精心计算的风险,取决于晶体管的尺寸和制造工艺的质量。记忆,在其最根本的层面上,是一场概率游戏。
到目前为止,我们关注的都是静态记忆。但许多系统,从大脑到细胞群体,都存在于动态状态中,随时间从一个状态转换到另一个状态。一个系统在给定状态下“持续”多长时间?
在隐马尔可夫模型(HMMs)等常用工具中,最简单的假设是系统在另一种意义上是无记忆的。在下一瞬间离开一个状态的概率是恒定的,无论系统已经处于该状态多久。这就是马尔可夫属性。它意味着一个状态的持续时间,即其驻留时间,遵循几何分布或指数分布。离开的风险总是不变的。
然而,当科学家们仔细观察真实的生物系统时,这个简单的模型常常失效。神经状态或细胞表型的驻留时间常常表现出重尾特性。这意味着极长的持续事件发生的频率远高于无记忆模型所预测的。系统似乎会“安顿”在一个状态中;它停留的时间越长,离开的可能性就越小。这打破了简单的马尔可夫假设,并暗示着一种更深层次的记忆在起作用,即处于某个状态的历史会影响其未来的稳定性。在某些极端情况下,当平均驻留时间为无穷大时,系统可能会“卡住”很长时间,以至于破坏了遍历性,这意味着单个细胞的生命周期平均行为可能与整个群体的平均行为完全不同。
理解了这些原理,我们就能设计出具有状态的系统。一个没有反馈回路的计算网络,即前馈网络,就像我们那个单碗地形。它在任何时刻的输出纯粹是其在同一时刻输入的函数。它根本上是无记忆的。要构建一个能够记住过去的系统,我们必须引入回路,创建一个循环网络。网络的内部状态于是成为其历史的压缩摘要,使其能够处理序列和时变数据。
但是,当我们关掉电源时会发生什么?大多数电子存储器,比如你电脑里的RAM,是易失性的。其能量景观中精心维持的山谷会消失,所有存储的信息都会丢失。在一个注重功耗的世界里,这是一个巨大的问题。我们希望我们的设备能够“睡眠”以节省能源,但代价不能是失忆。
解决方案是一项巧妙的工程设计:状态保持触发器。它是一个标准的存储单元,但带有一个秘密武器:一个微小的、低功耗的“影子锁存器”,连接到一个独立的、始终开启的电源。在主电源域被关闭之前,一个精心编排的序列开始了。首先,时钟被停止以冻结状态。然后,一个SLEEP信号被置为有效,将当前状态复制到影子锁存器中。只有在这之后,主电源才被安全切断。主逻辑电路进入黑暗,但那个微小、节俭的影子锁存器保留着宝贵的状态比特。唤醒时,序列被反转:主电源恢复,SLEEP信号被撤销,将状态从影子锁存器复制回主触发器中。时钟再次启动,机器从它离开的地方精确地恢复工作,完全不知道它曾经睡着过。
从细胞身份认同的宏大挑战,到让你的手机电池更耐用的实际问题,状态保持原理是一条统一的线索。它是一种动态平衡,是秩序在对抗噪声和衰减的无情洪流中取得的暂时胜利,由正反馈的普适力量所塑造。归根结底,它是过去在现在中持续存在的物理体现。
自然界与我们自己的创造物在应对同一个根本问题时所展现的方式,有着一种美妙的统一性:即正在发生的事情与已经发生的事情之间的相互作用。这就是记忆问题,或者更正式地说,状态保持问题。我们已经探讨了让系统能够持有一条信息,即“记住”一个状态的机制。现在,让我们踏上一段旅程,看看这个简单而美丽的想法如何绽放成一幅丰富的应用图景,贯穿我们计算机的电路、我们软件的逻辑、我们身体的细胞,乃至物理学本身的抽象核心。
想象一下你的笔记本电脑,安静地看似处于睡眠状态。你可能会认为它没有消耗任何电力,但你错了。即使在“空闲”状态下,数十亿个微小的晶体管也会泄漏一股虽小但稳定的电流,消耗着你的电池。为了解决这个问题,工程师们设计了一种巧妙但粗暴的解决方案:电源门控。这个想法很简单:完全切断芯片空闲部分的电源。这能彻底阻止泄漏,但代价是——失忆。电源被切断的瞬间,逻辑门和寄存器会忘记它们所持有的所有信息。
唤醒芯片就意味着面对一张白纸。恢复之前的状态需要时间,而且关键是需要能量。这就带来了一个经典的工程权衡。在“小睡”期间节省的能量是否值得保存和恢复状态的能量成本?事实证明,答案取决于小睡的时间有多长。对于短暂的空闲时刻,让电路泄漏更为高效。但对于更长的休眠,完全关闭所节省的能量可能是巨大的。存在一个盈亏平衡时间,一个关键的持续时间,超过这个时间,电源门控就成为更优的策略。
为了实现这一点,工程师创造了称为状态保持触发器的特殊电路。可以把它们看作是带有微型、专用“生命支持”系统的标准存储单元。当芯片某个区域的主电源被切断时,一个“始终开启”的电源会提供刚好足够的电压——仅仅一丝电力——来维持这些触发器的活性。它们就像一盏引航灯,以最小的能量成本保存着必要的状态,随时准备让整个系统瞬间恢复生机。
但保存状态不仅关乎能源效率,更关乎计算的逻辑完整性。任何数字处理器的核心都是一种自动机,一个根据输入从一个状态转移到下一个状态的有限状态机(FSM)。如果你对一个FSM进行电源门控,你必须确保它在唤醒时恢复到与休眠前完全相同的逻辑条件。对于某些类型的FSM,即所谓的Mealy机,其输出不仅取决于内部状态,还取决于当前的输入。对于这些机器来说,仅仅保持内部状态是不够的。如果来自外部世界的输入在FSM休眠时发生了变化,它可能会在唤醒时产生错误的输出,从而破坏计算。因此,一个鲁棒的系统必须确保输入也被保持恒定或以其他方式加以考虑,以保证机器的行为在外部看来与简单暂停无异。
状态保持的概念从硅硬件无缝地转移到软件的抽象世界。在许多编程语言中,存在一种美妙的构造,称为闭包:一个函数与其“环境”——即函数创建时存在的变量的记忆——捆绑在一起。闭包是一段会记忆的代码。无论它走到哪里,它都携带着自己的状态。
这种软件级的状态保持功能强大,但也带来了挑战。考虑“热插拔”或在不重启的情况下更新正在运行的软件的想法。这对于那些不能停机的系统,如电信网络或金融服务器,至关重要。要热插拔一个使用闭包的模块,你必须替换其代码,同时保留其环境,即其保持的状态。新代码必须能够理解并操作由旧代码创建的状态。这要求对系统的应用程序二进制接口(ABI)进行仔细而严格的设计,确保所保持状态的结构在不同版本间保持兼容,通常通过间接表或版本化头等巧妙技术实现。
当我们进入密码学和安全领域时,状态管理的风险变得更高。随着我们准备进入一个可能破解我们当前大部分公钥密码学的量子计算机世界,研究人员正在开发新的、抗量子的方法。其中最有前途的是基于哈希的签名。
这些签名有两种类型:无状态(如 SPHINCS+)和有状态(如 XMSS)。一个有状态签名方案效率极高,但它有一个关键要求:签名者每次签名都必须使用不同的私钥。为了管理这一点,签名者必须维护一个状态——通常只是一个简单的计数器,指示下一个要使用的密钥。这个计数器必须被一丝不苟地保持和更新。如果系统 कभी丢失了这个状态的踪迹——例如,如果恢复了备份,导致计数器回滚并且密钥被重用——后果将是灾难性的。一个观察到用同一个密钥进行的两次签名的攻击者可以随意伪造新的签名,从而完全破坏系统的安全性。在这里,一个数字的正确保持是整个信任大厦所依赖的那根线。
如果我们把目光投向自然界,我们会发现大自然是状态保持的无可争议的大师。思考一下大脑。我们处理语言、感知世界和形成思想的能力依赖于在一段时间内将信息保存在脑海中。这是如何实现的?计算神经科学家已经在这类生物记忆与一种名为长短期记忆(LSTM)网络的人工神经网络架构之间找到了一个有趣的相似之处。LSTM旨在通过维持一个内部“细胞状态”来处理序列,这个记忆由三个“门”精心管理:一个决定让什么新信息进入的输入门,一个决定丢弃什么旧信息的遗忘门,以及一个决定将记忆的哪一部分分享给网络其余部分的输出门。
值得注意的是,这些抽象的计算门可能具有真实的生理对应物。大脑的丘脑皮层回路在丘脑和皮层之间循环,充满了看起来与这些门惊人相似的机制。受丘脑网状核(TRN)等抑制结构控制的丘脑核团可以充当输入门,选择性地将感觉信息路由到皮层。在皮层内,兴奋性神经元和抑制性神经元的复杂微电路可以建立一种平衡的活动状态,允许记忆被维持或“遗忘”。完全有理由相信,大脑利用这些生物门实现了自己形式的状态保持,这是由进化塑造而成,用以管理信息随时间的流动。
状态保持的原理延伸得更深,直至我们细胞的身份本身。是什么让一个皮肤细胞成为皮肤细胞,一个神经元成为神经元?一种假设是,细胞身份是在发育过程中锁定的终极决定命运。另一种观点是,细胞的身份是一个必须被主动维持的动态状态。为了区分这些想法,我们可以求助于一种不起眼的海绵,一种来自非常古老谱系的动物。利用一种名为命运图谱的遗传技术,科学家可以在任何曾经表达过特定基因的细胞中创建一个永久性标记——一种不可磨灭的细胞记忆。例如,他们可以标记任何曾经表达过领细胞(海绵的推动水流细胞)特有基因的细胞。
通过观察海绵的再生过程,研究人员可以看到这些被标记细胞的结局。如果细胞命运是永久的,那么标记将永远只在领细胞中找到。但如果实验显示标记细胞后来出现在其他细胞类型中,如移动的古细胞,这就为第二种假设提供了强有力的证据。这表明一个细胞“记住”了它作为领细胞的过去,但可以转换到一个新的角色。它的身份不是一个静态属性,而是一个能够响应新信号而更新的保持状态。这种细胞可塑性原理是现代生物学的基石,对从伤口愈合到癌症等一切事物都有深远的影响。
最后,让我们看看状态保持这个概念如何以其最抽象和最基本的形式出现在计算和物理学的基石中。
考虑对一个数字列表进行排序这个简单的行为。标准的排序算法依赖于一个比较函数:是否小于?这个函数的答案被假定只依赖于和。但如果比较函数本身有记忆呢?如果它对compare(a,b)的回答还取决于它被要求执行的上一次比较的结果呢?这个看似简单的转折引出了一个深刻的见解。如果这个“有状态”的比较器,尽管有其怪癖,但总能与某个潜在的真实顺序保持一致,那么排序的基本难度保持不变;它仍然需要至少次比较。但是,如果比较器的状态可能导致病态的矛盾——告诉我们、和——那么“排序”的概念本身就崩溃了。问题变得无法解决。所保持状态的性质不仅决定了解决方案的效率,甚至决定了其可能性本身。
当模拟像大脑连接不断变化的网络这样复杂的动态系统时,这种状态持久性的思想可以被优美地形式化。我们可以将这样的系统表示为一个时间复用网络:一系列时间上的网络快照,每一层一个。为了捕捉记忆,我们添加“层间”连接,将一层中的一个节点连接到下一层中的同一个节点。这些连接的强度,一个通常用表示的参数,成为了状态保持的一个直接、可调的旋钮。一个高的意味着网络上的一个随机游走者在从一个时间片移动到下一个时间片时,很可能会停留在同一个节点上,代表着强烈的持久性。一个低的则鼓励游走者探索新的节点,代表一个记忆短暂的系统。这个优雅的数学框架使我们能够量化任何复杂系统中记忆这一概念本身。
也许最深远的应用在于现代物理学的核心。多相互作用粒子的量子力学是出了名的困难,因为可能的状态数量随粒子数量呈指数增长。密度矩阵重整化群(DMRG)是一种绝妙的数值方法,它驯服了这种复杂性。其核心思想是一种无与伦比的复杂状态保持形式。DMRG不是试图跟踪所有可能的量子态,而是在每一步计算哪些态对于描述系统基态的纠缠结构最为关键。然后它将问题投影到一个截断的空间中,只保留这一小部分本质的基态,并丢弃其余的。这是重整化群(物理学中最深刻的思想之一)的变分实现。这里所保持的不仅仅是一个比特或一个计数器,而是系统量子关联的精髓,使我们能够找到那些否则将永远超出我们计算能力范围的问题的答案。
从晶体管 fleeting 的电荷,到活细胞的身份,再到量子现实的结构,状态保持的原理是一条统一的线索。它是选择记住什么和忘记什么的艺术,一个促成复杂性、智能乃至我们对宇宙理解的基本过程。