逻辑块寻址 (LBA)

玻尔百科

定义

逻辑块寻址 (LBA) 是一种通用的存储抽象技术，它将存储设备视为一个连续的、线性的块数组。该技术属于计算机存储体系结构领域，通过提供独立于硬件的数据访问方式取代了陈旧的柱面-磁头-扇区（CHS）模型。作为现代计算的基础，逻辑块寻址 (LBA) 支持区域位记录等硬件创新，并对系统启动和分区对齐等功能起着至关重要的作用。

核心要点

逻辑块寻址 (LBA) 是一种通用的抽象，它将存储视为一个单一的线性块数组，取代了过时的、与物理结构紧密绑定的 CHS (柱面-磁头-扇区) 模型。
向 LBA 的转变是为了适应硬件创新，如区域位记录 (ZBR) 和缺陷重映射，这些创新打破了 CHS 的直接物理到逻辑映射。
LBA 是现代计算的基础，它为操作系统实现了硬件独立性，并影响着从系统引导 (MBR/GPT) 到 SSD 上的性能优化和分区对齐等方方面面。
虽然 LBA 简化了存储访问，但它是一个“泄露的抽象”，意味着底层的物理特性，如 HDD 上的区域边界或 SSD 上的擦除块，仍然会影响性能。

引言

在每个计算机系统的核心，都存在着一场基础性的对话：作为纯粹逻辑实体的软件，如何向一个由旋转盘片或硅芯片构成的物理存储设备传达其读写数据的意图？几十年来，这场对话使用一种被称为柱面-磁头-扇区 (Cylinder-Head-Sector, CHS) 的物理坐标机械语言进行。这种将数据直接映射到硬件几何结构的方法虽然直观，但最终却很脆弱。随着存储技术的发展，驱动器变得更密集、更复杂，CHS 模型成了一种虚构——一个阻碍进步且无法代表设备真实内部运作的“谎言”。

本文探讨了应对这场危机的优雅解决方案：逻辑块寻址 (LBA)。LBA 通过在操作系统和硬件之间创建一份简单、通用的契约，彻底改变了存储方式。系统不再需要微观管理物理位置，而是简单地将整个驱动器视为一个长长的、带编号的块列表。这一强大的抽象解锁了数十年的创新，并至今仍是所有现代存储的基础。在接下来的章节中，我们将追溯这一关键的演变。“原理与机制”将揭示旧的 CHS 王国为何衰落，以及 LBA 模型如何崛起，详述技术转变及其后果。随后，“应用与跨学科联系”将展示 LBA 在整个计算栈中不可或缺的角色，从计算机启动的第一刻到在最新的固态驱动器上优化性能。

原理与机制

想象你是一位来自过去时代的探险家，正在绘制一座新发现的岛屿。你很可能会使用一套经纬度系统，一个坐标网格，来精确定位岛上的任何地貌。在计算的早期，工程师们以类似的方式处理硬盘的旋转盘片。硬盘是一个物理的、机械的物体——一组盘片在同一个主轴上同步旋转，读写磁头在其表面上快速移动。用它自身的机械语言与之对话，似乎是再自然不过的事情了。这就是柱面-磁头-扇区 (Cylinder-Head-Sector, CHS) 寻址的世界。

旧王国：一个齿轮与杠杆的世界

把硬盘想象成一堆黑胶唱片，全都围绕着一个主轴旋转。所有盘片上与中心等距的所有磁道的集合，构成一个柱面 (cylinder)。一个磁头 (head) 是读写单个盘片表面的设备。而一个扇区 (sector) 是单条磁道上的一个小弧形段，是驱动器可以读写的最小数据单位。

要找到特定的一块数据，你需要提供一个三元坐标：“到柱面 $C$ ，选择磁头 $H$ ，然后读取扇区 $S$ 。”这个 $(C, H, S)$ 三元组就是硬盘数据世界的经纬度。它直接、具体，并与硬件的物理特性深度关联。

如果你想计算这样一个驱动器上所有的扇区，你可以想象一个简单的过程。对于任何一个位于 $(C, H, S)$ 的扇区，你首先要计算它之前所有柱面中的扇区总数。如果每个柱面有 $H_{\text{log}}$ 个磁头，每个磁道有 $S_{\text{log}}$ 个扇区，那么前面 $C$ 个柱面中的扇区数就是 $C \times H_{\text{log}} \times S_{\text{log}}$ 。然后，你要加上同一柱面内当前磁道上方所有磁道的扇区数，即 $H \times S_{\text{log}}$ 。最后，你要加上当前磁道上在扇区 $S$ 之前的扇区。历史上的一个有趣怪癖是，扇区编号通常从1开始，而不是0，所以磁道上有 $S-1$ 个在它之前的扇区。

综合起来，你可以使用这样一个公式，将任何 CHS 地址映射到一个单一的线性数字，我们现在称之为逻辑块地址 (LBA)： $\text{LBA} = (C \times H_{\text{log}} \times S_{\text{log}}) + (H \times S_{\text{log}}) + (S - 1)$ 这个方程式代表了将磁盘的三维几何结构抽象为一维列表的最早尝试。在一段时间里，这个系统是有效的。但随着技术的进步，这个优美、简单的机械模型开始在自身虚构的重压下崩溃。

表象的裂痕：当几何成为谎言

CHS 模型建立在一个脆弱的假设之上：磁盘的几何结构是均匀且完美的。它假设每一条磁道都有相同数量的扇区。但这真的是制造磁盘最有效的方式吗？

再次想象我们旋转的盘片。靠近外边缘的磁道在物理上比靠近中心主轴的磁道要长得多。为什么它们都应该存储相同数量的数据？这就像在一张巨大的纸和一张微小的便利贴上都只写一个单词。为了最大化存储空间，工程师们开发了区域位记录 (Zoned Bit Recording, ZBR)。他们将盘片分成几个同心区域。外圈区域的磁道更长，因此填充了比内圈区域更多的扇区。

突然之间，CHS 中的“S”不再是一个单一的数字；它根据你所在的区域而变化。计算扇区的简单公式失效了。磁盘的几何结构不再是一个整洁、统一的网格。CHS 已经变成了一个谎言。

但这种欺骗性甚至更深。没有哪个制造过程是完美的。每个硬盘在出厂时其表面都会有微观缺陷——无法可靠存储数据的坏点。随着驱动器的使用，更多的缺陷可能会“增长”。当驱动器被要求向一个有缺陷的扇区写入时会发生什么？它只是返回一个错误吗？那将是极其不可靠的。

取而代之的是，驱动器的内部控制器会施展一个巧妙的技巧。它维护着一个这些坏扇区的隐藏列表，并拥有一批备用扇区 (spare sectors)，通常位于磁盘的一个专用区域。当有写入坏块的请求时，控制器会透明地将其重定向到一个备用块。操作系统使用逻辑地址进行通信，对此一无所知。

这种缺陷重映射 (defect remapping) 是一个实现可靠性的绝佳解决方案，但它也粉碎了 CHS 物理模型的最后残余。一系列逻辑上相邻的块可能在物理上根本不相邻。其中一个可能被重映射到几英里外——或者用磁盘术语来说，几千个柱面之外的一个备用柱面。一次本应是平滑滑过单条磁道的操作，可能会变成一系列疯狂的长距离寻道，这是一个隐藏在幕后的巨大性能损失。

到此，驱动器向操作系统报告的 CHS 地址不再是一张地图；它是一种幻想，一个为旧软件保留的兼容层。如果你在一个假设的实验场景中进行实验，假设小编号柱面对应较快的外圈磁道，大编号柱面对应较慢的内圈磁道，你很可能会发现你的假设彻底失败。你可能会测量磁盘“开头”和“结尾”（按 CHS 术语）的读取速度，发现它们几乎相同，这完全与 ZBR 的物理原理相矛盾。这是因为 CHS 坐标只是一种逻辑转换，与数据实际存储的位置关系不大。物理坐标的旧王国已经覆灭。

新的希望：抽象的优雅

当一个模型变得过于复杂并充满例外时，就该提出一个新想法了。磁盘寻址的新想法简单得惊人：如果我们干脆停止尝试微观管理驱动器的物理布局会怎样？

这就是逻辑块寻址 (LBA) 背后的哲学。

有了 LBA，我们放弃了假装了解磁盘的几何结构。我们将整个存储设备视为一个长长的、连续的一维块数组，从 $0$ 顺序编号到 $N-1$ 。就是这样。操作系统只是简单地说：“给我 1,512,331 号块。”驱动器的控制器——它才是自己内部混乱现实的真正专家——接收这个 LBA 并进行转换。它了解区域、每个磁道不同的扇区数、重映射的坏块以及所有其他秘密。它计算出真实的物理位置并相应地移动磁头。

这种抽象功能极其强大。

它简化了操作系统。OS 不再需要一个能理解每种硬盘型号具体、奇特几何结构的驱动程序。它只需对所有硬盘都使用 LBA 进行通信。
它推动了技术进步。驱动器制造商可以在不破坏兼容性的情况下，用越来越复杂的内部方案（如 ZBR）进行创新。
它统一了不同的技术。一个固态驱动器 (Solid-State Drive, SSD) 根本没有柱面、磁头或扇区。它由闪存芯片构成。对于 SSD 来说，CHS 模型不仅是个谎言，更是彻头彻尾的无稽之谈。但是 SSD 可以很容易地将自己呈现为一个线性的块数组。LBA 为任何块存储设备提供了一种通用语言，无论它是旋转的、使用闪存的，还是我们尚未发明的未来技术。

LBA 是一份信任契约。OS 信任驱动器能管理自身的复杂性，作为回报，OS 获得了一个极其简单和一致的存储模型来工作。

生活在 LBA 世界：后果与机遇

向 LBA 的转变不仅仅是一个技术上的注脚；它带来了巨大的、现实世界的影响。其中最著名的之一是2 Tebibyte (TiB) 限制。最初用于磁盘分区的标准，即主引导记录 (Master Boot Record, MBR)，是在几兆字节就算很大存储空间的时代创建的。它为分区的 LBA 分配了 32 位。

用 32 位，你可以表示 $2^{32}$ 个唯一的地址。如果每个地址指向一个标准的 512 字节扇区，那么最大可寻址容量是： $\text{Capacity} = 2^{32} \text{ sectors} \times 512 \frac{\text{bytes}}{\text{sector}} = 2^{32} \times 2^9 \text{ bytes} = 2^{41} \text{ bytes}$ 这正好是 2 Tebibytes ( $2 \times 2^{40}$ 字节)。任何超过这个点的存储空间对于一个基于 MBR 的系统来说都是不可见的。这就是为什么你不能在旧电脑上使用 3 TB 硬盘的原因；寻址系统 буквально 用完了数字。解决方案是一个新的分区方案，即GUID 分区表 (GUID Partition Table, GPT)，它使用 64 位的 LBA 地址。这将理论上限提高到了惊人的 8 ZB，这个数字如此之大，以至于在很长一段时间内都不太可能成为限制。从 MBR 到 GPT 的演变与从传统的 BIOS 固件到现代的统一可扩展固件接口 (Unified Extensible Firmware Interface, UEFI) 的转变是同步进行的，后者能够理解新的 64 位世界。

但是 LBA 的抽象是完美的吗？底层的物理现实会偶尔显现出来吗？当然会。我们称之为“泄露的抽象”。考虑两个在数值上相邻的 LBA，比如 LBA $L$ 和 LBA $L+1$ 。大多数时候，它们在物理上也是相邻的。但如果 $L$ 恰好是外圈高密度区域最后一条磁道上的最后一个扇区呢？那么 $L+1$ 必然是下一个内圈区域第一条磁道上的第一个扇区。要从 $L$ 到 $L+1$ ，驱动器磁头必须执行一次磁头切换（改变活动的读/写磁头）和一次磁道间寻道（向内径向移动）。一次本应是无缝的读取，却会招致一个虽小但可测量的物理代价，可能大约为 0.73 毫秒，仅仅是为了跨越这个无形的边界。

这是否意味着 LBA 抽象是失败的？完全不是。它只是意味着仍然有优化的机会。虽然操作系统不再知道确切的 CHS 几何结构，但它知道 LBA 到物理地址的映射通常是单调的——随着 LBA 数字的增加，物理位置趋向于扫过整个磁盘表面。因此，操作系统可以通过在将 I/O 请求发送到驱动器之前按 LBA 对其进行排序来显著减少磁头移动。这就是“电梯”调度算法背后的原理。即使没有完美的信息，基于 LBA 的启发式方法在利用物理局部性方面也能非常有效。

一个足够聪明的系统甚至可以更进一步。通过分析性能特征，或许可以推断出区域边界的大致位置。然后可以有策略地放置文件——例如，将一个频繁访问的日志及其相关数据区域放在不同的区域，以防止单个顺序流因跨越区域而遭受性能损失。

这种知识的分层使得现代系统如此健壮。驱动器的固件使用 LBA 来隐藏最深层的物理真相。操作系统使用 LBA 排序作为优化性能的强大启发式方法。有时，文件系统本身提供了另一层防御。如果驱动器的内部错误处理失败，并在某个 LBA 报告永久性错误，一个健壮的日志文件系统可以做出反应，将数据移动到一个新的 LBA，更新自己的元数据指针（如 inode），并将原始 LBA 标记为不可用——这是一种直接构建在 LBA 基础之上的软件层面的重映射。

从一个混乱的、机械的坐标系到一个干净、通用的抽象，LBA 的故事是寻找正确描述层次力量的完美典范。它告诉我们，有时，最优雅的解决方案不是了解一切，而是定义一个简单的契约，并信任下层来处理细节。

应用与跨学科联系

逻辑块寻址（LBA）就像给广阔海滩上的每一粒沙子一个从 0 到 N-1 的唯一序列号。这似乎是一个粗暴的、近乎幼稚的简单想法。但它的深远力量正蕴含在这种简单之中。这个单一、不间断的地址链构成了一种通用语言，一块罗塞塔石碑，让操作系统、引导加载程序和磁盘驱动器本身能够清晰无误地通信，无论存储设备内部发生了何种奇特而美妙的物理变化。让我们踏上一段旅程，穿越计算机系统的生命周期，看看这个简单的编号方案是多么不可或令。

系统的诞生：引导与分区

计算机从哪里开始？它醒来时带有一种失忆症。它的第一个问题是：“我的指令在哪里？”答案是硬编码的：“查看引导驱动器的第一个块。”用我们的语言来说，这就是逻辑块地址 0。这第一个 512 字节的块，即主引导记录 (MBR)，是整个操作系统赖以生长的种子。它包含一个微小的程序，以及至关重要的一张地图——分区表——告诉计算机磁盘的其余部分是如何组织的。

这个最初的程序太小，做不了太多事情，所以它的主要工作是加载一个更大、功能更强的程序。但那个更大的程序在哪里？MBR 的分区表提供了坐标，同样是以 LBA 的形式。一个典型的条目可能会说：“主分区从 LBA 2048 开始。”然后，引导加载程序可以通过计算操作系统内核在磁盘上的绝对地址来加载它：分区的起始 LBA 加上内核相对于该分区起始位置的位置。这个算术必须完美无误。仅仅一个 LBA 的错误就意味着计算机试图将数据当作指令来执行，导致立即且不光彩的崩溃。这是一个美丽而无情的例子，展示了软件对这种逻辑坐标系的依赖。

随着时间的推移，磁盘布局变得更加复杂。例如，现代的 GUID 分区表 (GPT) 方案需要一种方法，使其能够存在于可能被旧系统读取的磁盘上。解决方案是一个巧妙的技巧：在 LBA 0 处放置一个“保护性 MBR”，其分区表包含一个特殊类型的单个条目，基本上是说：“整个磁盘都被你无法理解的东西占用了。”真正的地图，即 GPT，被安全地存放在从 LBA 1 开始的地方，并在磁盘的最末端有一个备份副本以保安全。LBA 提供了固定、可靠的路标——LBA 1 用于主头，磁盘上的最后一个 LBA 用于备份——使得这种复杂的结构能够被稳健地构建和导航。历史上，甚至有一个惯例，在 LBA 0 的 MBR 和通常从 LBA 63 开始的第一个分区之间留一个间隙。这个“MBR后间隙”为引导加载程序提供了一个方便的、未分配的空间，以存储启动操作系统所需的额外代码。

性能的核心：对齐与存储物理学

所以 LBA 帮助我们找到东西。但它也帮助我们快速找到它们。虽然 LBA 将磁盘呈现为一个统一的、线性的序列，但物理现实却远非如此。

在经典的旋转硬盘上，磁盘就像一张以恒定速度旋转的黑胶唱片。外圈的磁道比内圈的磁道长。因为它们更长，你可以在上面封装更多的数据扇区。当读写头经过外圈磁道时，它在一次旋转中读取的字节数比在内圈磁道上多。结果呢？更高的数据吞吐量。磁盘制造商知道这一点，所以他们通常将最低的 LBA——0, 1, 2 等等——映射到这些更快的、外圈的磁道上。这就是为什么总是建议将操作系统安装在硬盘的第一个分区上的原因；你正在将最常用的文件放在磁盘最快的区域，这可以显著加快启动时间和应用程序加载速度。

固态驱动器 (SSD) 的故事更加有趣。SSD 没有移动部件，但它们有自己独特的物理特性。它们由闪存构成，可以以小块（称为“页”，通常为 4KB）读取，但只能以非常大的块（称为“擦除块”，可能为 2MB）擦除。如果你想在一个擦除块中只更改几个字节，SSD 不能直接覆盖它们。它必须将整个 2MB 的块读入其内部内存，更新那几个字节，然后将整个 2MB 的块写回到一个新的、预先擦除的位置。这个过程称为读-修改-写循环，它很慢并且会磨损驱动器。

现在，想象一个同样以 4KB 块为单位思考的文件系统。如果磁盘分区的起始位置没有与 SSD 底层擦除块的起始位置完美对齐，那么来自文件系统的单次 4KB 写入可能会正好跨越两个物理擦除块的边界。结果是灾难性的：SSD 被迫执行两次昂贵的读-修改-写循环，而不是一次。这种现象被称为“写放大”，它会严重影响性能并缩短驱动器的寿命。解决方案非常简单：使用 LBA 算术来确保分区的起始 LBA 所对应的字节地址是擦除块大小的整数倍。这种逻辑布局（分区）与物理现实（擦除块）之间的美妙和谐，全部由 LBA 调解，是现代存储性能的基石。

向上和向外扩展：复杂系统中的 LBA

LBA 的力量可以很好地扩展以处理更复杂的系统。考虑一个 RAID 5 阵列，它通过在多个驱动器上条带化数据和奇偶校验信息来防止磁盘故障。对于操作系统来说，RAID 控制器呈现为一个具有单一 LBA 空间的单个大容量磁盘。但在内部，一个写请求可能会被分割到多个物理磁盘上。与 SSD 一样，对齐至关重要。一个恰好跨越内部“条带”边界的文件系统的小型写入，可能会引发一场活动风暴，使得本应简单的更新所需的物理 I/O 操作数量翻倍。LBA 提供了关键的抽象层，允许操作系统将阵列作为一个简单的线性设备来处理，而性能调优仍然需要关注逻辑 LBA 范围如何映射到底层物理条带。

在操作系统内部，LBA 是通用语言。当文件系统需要为一个文件分配一个新块时，它如何知道哪些块是空闲的？它通常使用一个“空闲空间位图”——一个巨大的比特串，其中每个比特对应磁盘上的一个 LBA。'1' 表示该块正在使用，'0' 表示它是空闲的。由于 LBA 的线性特性，为任何给定的 LBA 找到正确的比特位只是一个简单的整数除法和模运算问题。

这种对话一直延伸到像 NVMe 这样最现代的存储协议。当你删除一个文件时，操作系统不仅仅是更新自己的位图。它可以向 SSD 发送一个 TRIM 命令，说：“顺便说一下，LBA 范围 1000-1050 和 2300-2400 不再使用了。”SSD 随后可以利用这些信息，在空闲时间智能地清理其内部的擦除块，确保未来的写入保持快速。操作系统和驱动器正在进行关于数据生命周期管理的高层对话，而它们使用的语言就是 LBA。

整合一切：追踪一次 `read()` 调用

让我们追踪一次 read 请求，看看所有这些层是如何相互作用的。一个程序请求从一个文件的偏移量 8192 处开始读取 6000 字节。

该请求到达操作系统，操作系统首先检查其内存中的“页面缓存”。它发现请求的前 4096 字节已经存在于内存中（缓存命中！）。很好。
但接下来的 1904 字节缺失（缓存未命中）。操作系统必须从磁盘中获取它们。
操作系统不会向磁盘请求仅仅 1904 字节。它以页面为单位思考，所以它会请求包含缺失数据的整个 4096 字节页面。
文件系统的工作是将此页面的身份（例如，“此文件的第3号页面”）转换为物理位置。它查询其元数据，并确定此页面位于，比如说，LBA 10024。
这个 LBA 地址被传递给块层，然后是设备驱动程序，后者向磁盘控制器发出命令：“从 LBA 10024 开始读取 8 个扇区，并将数据放入内存的这个特定位置。”
磁盘完成其工作，数据到达页面缓存。操作系统现在可以将请求的 1904 字节从新填充的页面复制到用户的缓冲区，并完成 read 调用。

在整个旅程中，从高级的文件偏移量，到页面索引，最后到硬件命令，LBA 都是那个关键的、不变的枢轴点。它是存储栈的“窄腰”，是每一层都必须与之相互转换的单一抽象。

逻辑块寻址是计算领域中最成功、最持久的抽象之一。它的力量不在于复杂性，而在于其坚定的简单性。通过提供一个稳定、线性且通用的寻址方案，LBA 将软件世界与不断变化且通常很混乱的存储硬件物理学分离开来。它使得今天编写的操作系统能够在尚未被发明的存储设备上运行。它是一个安静的、无名的英雄，证明了当我们找到看待问题的正确方式时，可以涌现出深邃的优雅。

逻辑块寻址 (LBA)

引言

原理与机制

旧王国：一个齿轮与杠杆的世界

表象的裂痕：当几何成为谎言

新的希望：抽象的优雅

生活在 LBA 世界：后果与机遇

应用与跨学科联系

系统的诞生：引导与分区

性能的核心：对齐与存储物理学

向上和向外扩展：复杂系统中的 LBA

整合一切：追踪一次 read() 调用

逻辑块寻址 (LBA)

引言

原理与机制

旧王国：一个齿轮与杠杆的世界

表象的裂痕：当几何成为谎言

新的希望：抽象的优雅

生活在 LBA 世界：后果与机遇

应用与跨学科联系

系统的诞生：引导与分区

性能的核心：对齐与存储物理学

向上和向外扩展：复杂系统中的 LBA

整合一切：追踪一次 read() 调用

整合一切：追踪一次 `read()` 调用

整合一切：追踪一次 `read()` 调用