文件系统：一座抽象之塔

玻尔百科

定义

文件系统：一座抽象之塔是计算机科学中的一个概念框架，旨在通过提供通用命名空间和简化的字节流视图来隐藏硬件的复杂性。该抽象层利用日志记录或写时复制技术来确保结构完整性，并保证重命名等操作在系统崩溃时的原子性。文件系统的设计为可靠的软件更新、系统安全以及现代硬件上的高性能计算提供了关键的基础构建模块。

核心要点

文件系统的主要作用是充当抽象层，提供一个通用的命名空间和简化的字节流数据视图，以隐藏硬件的复杂性。
现代文件系统使用日志（journaling）或写时复制（CoW）来保证结构完整性以及像 rename 这样的操作在系统崩溃面前的原子性。
原子性的 rename 操作是一个强大的原语，被用作构建可靠系统的基石，能够实现防崩溃的软件更新和简单的消息队列。
文件系统的设计对其他学科有深远的影响，它影响着系统安全、在固态硬盘（SSD）等硬件上的性能，并为版本控制和并行计算的大规模工具提供了可能。

引言

对于大多数用户而言，文件系统只是一个简单的数字文件柜——计算机上一个熟悉的、被动的空间，用于存储文档、照片和应用程序。这种看法虽然没错，但它掩盖了这项技术深邃的优雅和至关重要的意义。文件系统不仅仅是数据的容器；它是一座强大的抽象之塔，一个旨在化混乱为秩序、保障我们数字生活存续并为现代计算奠定根基的复杂系统。它解决了硬件现实中杂乱无章的问题，从而让应用程序不必劳神。本文将层层揭示这项关键技术，展现其工作原理以及它在整个计算领域产生的深远影响。

本次探索分为两部分。首先，在“原理与机制”中，我们将解构“文件系统究竟是什么”这个根本问题，从存储本身延伸至其作为通用接口的角色。我们将审视它提供的宏伟幻象、使其成为可能的内部机制（如虚拟文件系统 VFS），以及它通过日志和写时复制等巧妙策略为保护数据免于湮没而立下的神圣誓言。随后，“应用与跨学科联系”将展示这些核心原理并非仅仅是理论构想，而是构建可信、安全和高性能系统的坚实基础——从可靠的软件更新和加密安全，到超级计算机的大规模数据操作。

原理与机制

要真正领会文件系统的精髓，我们必须越过桌面上熟悉的图标，提出一个更根本的问题：文件系统究竟是什么？我们倾向于认为它是计算机中保存我们工作成果的部分，一个存放文档和照片的数字文件柜。这虽然没错，但这就像说指挥家的工作就是挥舞指挥棒一样。它描述了行为，却忽略了其化混乱为秩序的魔力与内在原理。文件系统的核心，并不仅仅在于存储；它是一个宏大而优美的抽象。它是操作系统讲给我们应用程序的故事，一个关于简单与秩序的故事，这样它们就不必去面对底层硬件混乱、无序的现实。

文件系统：作为通用命名空间

让我们从一个有趣的思想实验开始。想象一台简单的计算机，比如一台工厂机器的嵌入式控制器，它没有任何持久性存储——没有硬盘，没有固态硬盘，除了断电即消失的易失性内存外一无所有。在这里，“文件系统”的概念还有任何意义吗？

出人意料的是，答案是响亮的“是”。即使在这个短暂易逝的世界里，操作系统仍然需要管理各种资源：传感器、执行器、计时器以及程序间通信的临时信道。应用程序应该如何与温度传感器通信？它又该如何向机械臂发送指令？如果没有一个统一的原则，程序员将需要为每一个设备学习一套独特的、定制的接口。那将是一片混乱。

这正是文件系统第一个，或许也是最深远的作用所在：它是一个通用命名空间。它提供了一个层级化的命名结构——一个由文件夹和文件组成的“树”——可以用来代表任何事物。一个像 /devices/sensors/temp0 这样的路径不必再指向磁盘上的一簇字节；它可以就是温度传感器本身。应用程序可以简单地 open() 这个路径并从中 read()，以获取当前温度，其使用的命令与读取一个文本文件完全相同。文件系统变成了一个通用交换台，将对人类和程序有意义的名称映射到底层资源，无论这些资源是什么。它提供了一套标准化的接口（open、read、write、close），用于与千差万别的世界进行交互。这种抽象如此强大，以至于即使没有其著名的持久性承诺，文件系统依然是驯服复杂性不可或缺的工具。从这个角度看，一个内容会在重启时消失的文件系统并非一个损坏的文件系统；它只是卸下了其持久性的保证，同时保留了其作为命名和接口抽象的本质性、优美的角色。

宏伟的幻象：层级结构与字节流

当我们重新引入持久性存储时，这个通用命名空间便获得了其熟悉的超能力：在电源关闭后依然能保证我们数据的安全。但抽象不止于此。我们日常使用的“传统”文件系统提供了一系列强大的幻象，使得计算变得易于处理。

设想一种替代方案。如果操作系统只提供简单的键值存储 API，比如 put(key, value) 和 get(key)，会怎么样？你当然可以存储数据。但你很快就会怀念文件系统提供的优雅结构。你能有文件夹吗？嗯，你可以通过使用像 "/photos/2024/vacation.jpg" 这样的键来模拟它们。但你无法简单地问系统：“/photos/2024 文件夹里有什么？”系统只理解单个的键，而不理解你在脑海中强加的层级结构。列出一个目录，这个看似微不足道的行为，将需要对所有可能的键进行复杂扫描——而简单的键值存储甚至不提供此功能。

此外，传统文件系统中的文件以可定位、字节可寻址的流的形式呈现。你可以打开一个千兆字节大小的视频文件，并立即跳转到中间位置更改一个字节。文件就像一条巨大、连续的数据带。相比之下，键值存储通常将其值视为不透明、不可分割的数据块（blobs）。要更改一个字节，你必须 get() 整个千兆字节大小的值，在内存中更改那个字节，然后再 put() 整个新的千兆字节回去。字节流的幻象是一项极为重要的优化，它使得从数据库到视频编辑器的一切都能高效工作。

这引出了最微妙也最关键的保证之一：原子性。当你重命名一个文件，即使是将其从同一磁盘的一个目录移动到另一个目录，文件系统也承诺此操作将不可分割地发生。不存在文件同时在两个地方或两处皆无的中间状态。这是一个简单的键值 API 无法做出的保证。“重命名”将涉及一次 get、一次使用新键的 put，以及一次对旧键的 delete。如果在 put 和 delete 之间发生崩溃，将留下文件的两个副本，这破坏了重命名的根本意义。一个真正的文件系统将这种原子性保证作为其核心特性提供。

统一的机制

操作系统是如何实现这一宏伟的幻象的？当底层存储设备的现实如此多样时，它如何呈现一个单一、清晰、一致的文件和目录世界？一个使用古老的 FAT 系统格式化的U盘，一个带有现代日志系统的服务器级硬盘——对我们的应用程序来说，它们看起来和行为上都一样。

这种魔力发生在操作系统内核中一个被称为虚拟文件系统 (Virtual File System, VFS) 的层面。VFS 是一个主要翻译器。它定义了一种通用的内部语言，一套代表文件系统应该是什么样子的抽象对象。其中最重要的是 inode（代表文件的元数据，如所有者、大小、数据块位置等）和 dentry（目录项，将人类可读的名称链接到一个 inode）。

当你挂载一个磁盘时，其特定的文件系统驱动程序会教 VFS 如何在其独特的磁盘格式和这种通用的内部语言之间进行转换。对于一个复杂的、基于 inode 的文件系统，这是一个直接的翻译。但对于像 FAT 这样没有磁盘上 inode 概念的更简单的系统，驱动程序必须更具创造性。当你访问一个文件时，它会动态地在内存中合成一个 inode，用 FAT 目录项和挂载时选项（如默认权限）中的信息来填充它。它甚至会根据文件在磁盘上的起始位置等信息，创造一个唯一的 inode 编号，以满足 VFS 的模型。与 VFS 交互的应用程序对此一无所知。它看到的是一个带有所有预期字段的、正常的 inode。

这种抽象接口与具体实现的分离，也是为什么在大多数现代系统上，你不能像读文件一样简单地 read() 一个目录。允许这样做，就如同让你看到文件系统用来列出其内容的原始、混乱的二进制格式。那种格式在不同文件系统之间差异巨大（可能是线性列表、B 树或哈希表），并且会破坏应用程序的可移植性。取而代之的是，VFS 坚持你使用抽象的 API（opendir、readdir），这允许底层驱动程序解析其内部格式，并向你呈现一个干净、标准化的名称流。VFS 及其抽象对象是文件系统时钟的齿轮，隐藏在幕后，因此我们看到的只是指针简单、可靠的转动。

神圣的誓言：在不可想象中幸存

我们现在来到了文件系统最著名也最艰难的承诺：保护我们的数据免于湮没。当电源中断时，处理器和内存会遭受一次完全失忆。它们正在思考的一切，每一次计算，每一个保存在其易失掌控中的数据，都消失了。只有非易失性存储——磁盘——留存下来。文件系统是我们数字记忆的唯一守护者，其任务是确保在电源恢复时，磁盘上的状态是一致和正确的。

这是一个巨大的挑战。任何比写入单个磁盘块更复杂的操作——比如创建一个新文件，这可能涉及更新空闲空间位图、创建一个 inode 以及添加一个目录项——都变成了一系列写操作。在这一系列操作中途发生崩溃，可能导致文件系统的结构陷入危险地不一致。

为了解决这个问题，现代文件系统采用了两种卓越的策略之一。

最常见的是日志 (journaling)，或称预写式日志 (write-ahead logging, WAL)。在接触主文件系统结构之前，系统首先在一个特殊的日志——journal——中写下一个便条，描述它将要做什么。对于一次原子性重命名，它会写入一个单一的日志条目，内容是：“我将要添加一个指向 inode 12345 的链接 new.bin，然后我将移除链接 old.bin。”一旦这个条目被安全地写入磁盘上的 journal，文件系统才会继续进行实际的修改。如果发生崩溃，恢复过程很简单：操作系统只需读取 journal。如果它找到一个完整的事务记录，它就会“重放”它，确保操作完成。如果它找到一个不完整的记录，它就丢弃它，文件系统则保持其原始、一致的状态。这单个日志事务是确保重命名原子性的机制，即使跨越不同目录也同样有效。

第二种策略是写时复制 (copy-on-write, CoW)。一个 CoW 文件系统从不原地修改数据。要更改一个块，它会将该块的新版本写入磁盘上的一个空闲位置。然后，它更新父指针以指向这个新块，这反过来又需要写入父块的新副本，依此类推，一直到文件系统树的根部。最后一步是原子地更新磁盘上的一个“根指针”，使其指向这个新的、已修改树的根。如果在最后这个原子切换之前的任何时刻发生崩溃，旧的根指针仍然有效，整个文件系统保持在其先前的、完全一致的状态。那些未完成的更改只是未被引用的垃圾。这种设计意味着文件系统状态在磁盘上始终是一致的；它只是从一个有效状态跳转到下一个。

日志和 CoW 都是确保像 fsck（文件系统检查）这样的工具在崩溃后找不到结构性错误的强大技术。它们保证了元数据完整性。但理解它们的局限性至关重要。这些关于文件系统结构的保证与关于用户数据的保证是不同的。仅仅因为你调用了 write() 并不意味着你的数据在崩溃后得以幸存；它可能仍停留在易失性内存缓存中。要强制将数据写入物理磁盘，你必须明确使用像 [fsync](/sciencepedia/feynman/keyword/fsync)() 这样的命令。这个调用是对文件系统的直接指令：“立即为这个特定文件履行你的持久性誓言。”它在操作系统的性能增强缓存和硬件的持久性承诺之间架起了一座桥梁。不同的日志模式甚至提供了不同的权衡，创造了一个“漏洞窗口”，其中元数据可能指向尚未落盘的数据，这是在性能和绝对安全之间的一场精巧舞蹈。

最后，我们必须认识到这些强大的原子性保证是有边界的。它们存在于单个、自我管理的文件系统范畴之内。如果你试图将一个文件从一个磁盘重命名到另一个磁盘，会发生什么？操作系统会以 EXDEV（跨设备链接）错误拒绝。没有单一的日志，没有单一的根指针，可以同时管理两个独立的设备。要执行一次防崩溃的移动，我们必须构建自己的协议，自己当一回文件系统设计者。我们将数据复制到目标位置的一个临时文件，对其 [fsync](/sciencepedia/feynman/keyword/fsync)，创建一个微小的“标记”文件作为我们的提交记录，再对该文件 [fsync](/sciencepedia/feynman/keyword/fsync)，只有当移动操作被持久地提交之后，我们才回去删除原始文件。这场手动的、多步骤的舞蹈揭示了在没有中央权威的情况下进行协调的根本挑战——这是构建所有大规模可靠系统所面临挑战的一个缩影。从一个简单的命名空间到一个我们数字生活的坚固保障者，文件系统是一座集优美、实用和深刻洞见于一身的抽象之塔。

应用与跨学科联系

在探寻了文件系统的内部机制之后，我们可能会倾向于认为它是一个安静、尽职的图书管理员，只是简单地将我们的数据归档。但这将是一种极大的轻描淡写。我们所揭示的原理并不仅仅关乎存储；它们是构建整个计算世界的基石——一个充满可靠性、安全性、高性能和巨大规模的世界。文件系统不仅是图书管理员；它更是我们最宏伟数字创作的合作者、守护者和促成者。现在，让我们来探索这个充满活力的生态系统，看看文件系统的理念是如何在其中焕发生机的。

可信系统的基石

在计算机能够做任何有趣的事情之前，它必须首先唤醒并理解自身。想象一下启动的瞬间：机器已经通电，但一块原始的磁盘只是一片比特的海洋。它究竟是如何开始寻找操作系统的呢？答案在于一种巧妙的、分层的探查，就像一个侦探到达现场一样。

引导加载程序，即最先运行的软件，会寻找线索。它可能首先查阅一张主“地图”，即分区表，这张表提供了关于那里应该是什么类型文件系统的提示——比如说，一个“Linux 文件系统”。但这张地图可能是错误的或过时的。因此，侦探会寻找更直接的证据：“魔法数”。这些是在精确位置的特定字节序列——它们是标志，仿佛在大喊：“我是一个 Ext4 文件系统！”或“我曾经是一个 NTFS 卷！”当线索发生冲突时，比如一块磁盘在未被擦除干净的情况下被重新格式化了，会发生什么？一个引导加载程序可能会发现一个旧 NTFS 签名的残余，旁边还有一个新 Ext4 文件系统的新鲜签名。一种天真的方法可能是相信那个最长、最“不可能”的签名。然而，一个更聪明的系统会使用一个信任层级。它优先考虑来自权威的分区图的声明，并且知道现代格式化程序应该写入磁盘的哪些区域，从而正确推断出旧签名只是过去生活的一个幽灵。这个简单的识别行为，是构建能够在模糊性中导航的健壮系统的一堂大师课。

这种对健壮性的需求超越了启动过程。思考一下软件更新这一危险的行为。一个包管理器需要替换一个关键的应用文件 /usr/bin/app。如果在覆盖文件的中途电源中断，你将得到一个损坏的、无用的程序。系统就坏了。如何避免这种情况？文件系统提供了一个极其优雅的解决方案，一个利用 rename 操作的“忽隐忽现”魔术。

包管理器并不直接覆盖旧文件，而是首先将完整的新版本写入一个临时文件，比如 app.new。一旦，且仅当新文件是完整的并且其数据被安全地提交到磁盘（一个由 [fsync](/sciencepedia/feynman/keyword/fsync) 这样的命令确保的关键步骤），管理器才会发出一个单一的、原子的 rename("app.new", "app") 命令。在一个不可分割的瞬间，“app”这个名称停止指向旧文件，转而指向新文件。不存在中间状态。崩溃可能发生在重命名之前，这种情况下旧版本保持不变。或者它可能发生在之后，这种情况下新版本已完全就位。这种原子的 rename 舞蹈，结合明确的 [fsync](/sciencepedia/feynman/keyword/fsync) 调用以确保数据持久性，是允许复杂软件可靠地自我更新、在意外故障的混乱中幸存下来的基本编排。

协作与安全的舞台

文件系统不仅仅是数据的保险箱；它还是一个公共广场，不同的程序可以在这里相遇、沟通和协作。我们通常认为这种通信是通过网络套接字或共享内存等复杂渠道进行的。但如果文件系统本身就能成为信使呢？

想象一下你需要一个简单的消息队列：一个程序生产任务，其他几个程序消费它们。你可以用一个出人意料的工具来构建它：rename 系统调用。生产者将每条消息作为单独的文件写入一个“队列”目录中。然后，消费者们竞相认领一条消息。第一个成功将消息文件从队列目录 rename 到其私有的“工作”目录中的消费者，就原子地认领了那条消息。其他所有消费者对同一文件的 rename 尝试都会失败，因为文件已经不在那里了。单个文件系统上 rename 的原子性就像一个完美的、内置的锁，确保每条消息只有一个消费者能获得。这是一个利用文件系统的保证属性作为同步原语的优美范例。

当然，在一个共享空间里，我们需要规则。文件系统扮演着一个警惕的守护者，强制执行着一套由相互作用的规则织成的复杂织锦般的权限。你可能熟悉针对所有者、组和其他人的基本读、写和执行权限。但情节会变得更加复杂。可执行文件上的一个特殊的“set-user-ID”（ $S_{\text{ISUID}}$ ）位允许一个普通用户以文件所有者的权限运行该程序——这是一个强大但危险的特性。为了控制这一点，管理员可以用 MS_NOSUID 标志挂载整个文件系统，有效地告诉内核：“在这块磁盘上，忽略所有权限提升的请求。”

当涉及符号链接时，安全模型变得更加有趣。如果一个用户在以 MS_NOSUID 挂载的 /home 文件系统上创建了一个指向根文件系统（确实允许 set-user-ID）上一个 set-user-ID 程序的链接，那么谁的规则适用呢？内核的逻辑非常一致：它首先跟随链接到其最终目的地，然后应用目标位置的规则。/home 上的标志是无关紧要的；重要的是可执行文件本身的属性以及它所在文件系统的挂载选项。这种关注点分离，将文件级权限与文件系统级策略分层，创造了一个健壮的、深度防御的安全架构。

当密码学介入时，学科间的这种相互作用变得更加关键。假设我们希望构建一个加密每个文件的文件系统。一个简单的想法是根据每个文件的 inode 编号 $i$ 为其派生一个唯一的密钥 $K_i$ 。由于重命名不改变 inode，文件保持可访问，无需昂贵的重新加密。这看起来很优雅。然而，这种设计隐藏着一个致命缺陷，其根源在于忽视了关于文件系统的一个简单事实：inode 编号是会被回收利用的。

当一个文件被删除时，它的 inode 编号 $i$ 会被返回到一个池中。迟早，文件系统会将同一个编号分配给一个全新的文件。结果是，两个在不同时间存在的不同文件，被用完全相同的密钥 $K_i$ 加密。如果加密使用的是流式模式，其中 nonce（一个每个密钥只应使用一次的数字）也是确定性派生的，我们就遇到了灾难性的“一次性密码本两用”漏洞。一个能看到旧密文和新密文的攻击者可以抵消加密，从而揭示关于两个文件内容的信息。密码学的安全性被文件系统实现的一个平淡无奇的细节完全破坏了。稳健的解决方案需要更深层次的协同作用：密钥派生必须包含一些对文件生命周期真正唯一的东西，比如一个每当 inode 被重用时都会递增的、每个 inode 的“代数”。真正的安全不是在真空中实现的；它要求对整个系统堆栈有整体的理解。

性能的引擎

文件系统的美不仅在于其逻辑上的一致性，还在于其原始性能。这需要操作系统与底层硬件之间进行深入对话，一场充满微妙协商与权衡的对话。

考虑一下向内存映射文件写入数据的行为，在这种模式下，文件的内容直接暴露在进程的地址空间中。操作系统通过其页面缓存来管理这一切，使用的是与其用于虚拟内存相同的“页”（比如大小为 $P = 4096$ 字节）。当你只改变一个字节时，操作系统会将整个 $4096$ 字节的页标记为“脏”页。但底层的文件系统可能使用更小的块大小，比如 $B = 1024$ 字节。这种不匹配创造了一种有趣的性能动态。如果你在一个大文件的每个页的开头都写入一个字节，一个 $B=P$ 的文件系统会视整个文件为脏的，并且必须将其全部写回磁盘。但一个更聪明的、具有 $B P$ 的文件系统知道，实际上每个 $4096$ 字节的页中只有第一个 $1024$ 字节的块是脏的。因此，它可以通过只写入修改过的块并跳过干净的块，来执行少得多的 I/O 操作，从而显著提高效率。

随着固态硬盘（SSD）的出现，这种与硬件的对话变得更为关键。与磁性硬盘不同，NAND 闪存有着奇特的规则：你不能直接覆盖数据。你必须先擦除一个大的“块”，然后才能向其中的小“页”写入数据。这导致了一种称为写放大（ $WA$ ）的现象，即应用程序的一个简单逻辑写入会因垃圾回收——清理旧数据的过程——而触发驱动器内部大得多的物理写入量。

这提出了一个根本的设计选择。文件系统是应该保持无知，信任驱动器内置的闪存转换层（FTL）来管理这种复杂性？还是文件系统应该具备“闪存感知”能力，自己管理原始闪存？一个闪存感知的文件系统有一个关键优势：它理解数据的语义。例如，它可以物理上将频繁更新的“热”数据（如元数据）与静态的“冷”数据（如一个大视频文件）分离开。在对一个充满热数据的块进行垃圾回收时，几乎所有的页都已过时并且可以被丢弃，只需要复制极少量的数据。一个不透明的 FTL，只能看到逻辑块地址，可能会将热数据和冷数据混合在同一个物理擦除块中，导致低效的垃圾回收，其中大量有效的冷数据必须被一遍又一遍地浪费性地复制。然而，这种智能是有代价的：文件系统变得复杂得多。原则上，一个足够复杂的、拥有足够内存和处理能力的 FTL，可以通过自己跟踪访问模式来达到相当的性能，但这将复杂性和成本推向了硬件。这种硬件和软件智能之间的张力是现代系统设计的一个核心主题。

宏大抽象的促成者

文件系统的概念是如此强大，以至于它们成为更宏大抽象的基石，使我们能够管理前所未有的规模的复杂性。

以版本控制系统 Git 为例，这是数百万开发者使用的工具。在其核心，Git 的对象存储是一个直接构建在文件系统之上的、优美而简单的数据库。每个对象——一个文件的内容、一个目录列表、一个提交——都由一个唯一的 SHA-1 哈希值标识。Git 存储这些对象的方式是，取哈希值的前两个字符作为目录名，剩下的 38 个字符作为其中的文件名。当你使用哈希值的一个短前缀向 Git 请求一个对象时，它确切地知道要查找哪个目录。然后，它对该目录的内容进行简单的线性扫描，以找到匹配的文件名。这种目录分片将一个可能在海量对象集合中的搜索，转变为对一个小子目录的更快扫描。正是文件系统，在其作为键值存储的角色中，为世界上最重要的开发者工具之一提供了基础数据结构。

这种作为促成者的角色延伸到了虚拟化世界。当我们为一个正在运行的虚拟机（VM）制作“快照”时，我们实际上在捕获什么？简单地冻结虚拟机并复制其磁盘镜像，会给你一个崩溃一致性的状态——相当于拔掉电源线。文件系统的日志可能会恢复，但内部的数据库应用程序可能会处于损坏状态。要实现一个应用一致性的快照，需要一场更为复杂的芭蕾舞。虚拟机内部的一个“客户机代理”（guest agent）必须首先请求数据库静默——将其日志和数据刷新到其虚拟磁盘上的一个一致状态。然后代理告诉客户机操作系统用 [fsync](/sciencepedia/feynman/keyword/fsync) 冲刷其所有缓存并冻结新的写入。只有到那时，它才会向虚拟机监控程序（hypervisor）发出信号，后者再命令主机存储执行快照。这种自上而下的协调，确保数据从应用程序一直到物理主机磁盘的每一层缓存都被一致地冲刷，是捕获一个真正可靠可恢复状态的唯一方法。

最后，我们将目光投向科学的前沿，在那里，超级计算机模拟着从星系碰撞到蛋白质折叠的一切。这些在成千上万个处理器核心上运行的模拟，必须周期性地保存它们的状态。成千上万个进程如何向一个单一的、共享的文件系统写入数据而不使其瘫痪？这就是并行 I/O 的挑战。一种天真的方法，即每个进程独立写入自己的小块数据，会用一场无协调的请求风暴淹没文件系统。解决方案在于集体操作，由像 MPI-IO 这样的库来编排。在这里，进程们协调它们的 I/O。在一种称为“两阶段 I/O”的策略中，少数指定的“聚合器”进程首先从它们的同伴那里收集所有小的、分散的数据块到内存中。然后，它们将这些数据合并成大的、连续的块，并对并行文件系统执行少量的大规模、顺序写入。这将一个混乱、低效的 I/O 模式转变为文件系统能够以最高效率处理的模式，从而极大地减少了写入数据的时间，增加了用于科学研究的时间。

从启动时的第一丝生命闪光，到超级计算机的庞大数据流，文件系统是无名的英雄。它是抽象力量的证明，是平衡正确性、安全性和性能的大师课。它不仅仅是一个存放文件的地方；它是现代计算的根本支柱，是我们赖以生存的系统和推动我们前进的发现的促成者。