
测量是量化科学的基石,但将数字赋予现象的行为远比其表面看起来更为深刻。支配这种赋值的规则决定了我们能对世界得出何种有意义的结论。误解我们数据的性质可能导致科学假象和错误的发现,将一个看似的突破变成机器中的幽灵。本文旨在探讨测量量表的层级结构,揭示为何并非所有数字生而平等,从而弥补这一基础知识上的差距。
这段旅程将引导您攀登测量理论中的“意义阶梯”,为您提供区分不同数据类型并正确分析它们的概念工具。以下章节将探讨:
想象一下,您是一位自然世界的制图师。您的工作不仅是绘制大陆地图,还要绘制各种现象——疾病的严重程度、恒星的温度、化学物质的浓度。您如何做到这一点?您赋予它们数字。但正如我们将看到的,并非所有数字生而平等。我们用来赋值的规则本身,就决定了我们能对所测量的世界发表何种有意义的言论。这次对测量理论的探索并非一次枯燥的分类练习,而是一场深入科学意义核心的旅程。
让我们从一个阶梯的底部开始,在那里,事物与数字之间的联系最为基础。
在第一级,我们有名义量表。“Nominal”一词源自拉丁语的“名字”,而这些数字也正是如此:仅仅是标签。想一想血型:我们可以将其标记为 A、B、AB 和 O,或者同样可以标记为 1、2、3 和 4。说 4 型比 2 型“多”有意义吗?当然没有。我们唯一能做的有意义的陈述是两个人血型是相同还是不同。“允许的变换”在这里是任何简单的重新标记(一个双射),只要我们不将两个不同的类别合并为一个。最频繁的类别,即众数,是一个有意义的总结,但计算“平均血型”将是彻头彻尾的无稽之谈。
让我们爬到下一级:顺序量表。在这里,数字有了顺序。想一想病人自我报告的 1 到 10 级的疼痛,或者病理学家对肿瘤从 I 期到 IV 期的分级。我们知道疼痛评分 8 比 4 更糟,III 期比 II 期更严重。但是,4 和 5 之间的疼痛差异是否与 8 和 9 之间的差异相同?我们无法保证。这些数字代表等级,但它们之间的间隔不一定相等。这意味着我们可以对这些数字应用任何严格递增的变换,而顺序——这一基本信息——得以保留。您可以将量表 {1, 2, 3, 4} 替换为 {1, 10, 100, 1000},而不会违反数据的顺序性质。因为顺序得以保留,我们可以找到中位数(中间值),但计算平均数是一种危险的行为,我们稍后会看到。
再往上爬,我们到达了区间量表。现在我们有了一把间距相等的尺子。典型的例子是用摄氏度测量的温度。将一升水从 加热到 所需的热能与将其从 加热到 所需的热能是相同的。差异现在变得有意义了。但这个量表有一个奇特的特性:它的零点是任意的。 只是水的冰点,一个方便的约定。它并不意味着“没有热能”。因为零点是任意的,我们可以移动它并改变单位大小。这对应于任何仿射变换,,其中 。例如,从摄氏度转换为华氏度就使用了这样的变换:。但这个任意的零点带来了一个深远的影响:我们不能做出有意义的比率陈述。 是 的“两倍热”吗?不是。在开尔文温标中,这些温度大约是 和 。它们的比率约为 ,远非 2! 在区间量表上,差异是真实的,但比率是一种幻觉。
这把我们带到了阶梯的顶端——比率量表。我们还能添加什么最终的属性呢?答案简单而深刻:一个真实的、非任意的零点。这不是一个约定俗成的零,比如 ;它是一个现实的零,一个表示所测量量完全缺失的点。
想想身高或体重。零身高意味着没有身高。想想血液中生物标志物的浓度; 意味着该物质完全不存在。或者想想一个简单的计数,比如一个病人一年内去急诊室的次数;零次就意味着确切地——一次也没去过。这个真实零点作为一个根本的锚点。我们再也不能移动原点;它被物理现实牢牢地钉在地板上。唯一允许的变换只剩下改变单位,这对应于简单的乘法:,其中 。从米到英尺就是这样一种变换;从克到千克也是。
温度的例子使这一点变得非常清晰。虽然摄氏温标是一个区间量表,但开尔文温标是一个比率量表。它的零点,,是绝对零度,即理论上没有热能的点。在这里,也只有在这里,我们才能说 拥有的热能是 的两倍。比率量表是许多我们基本物理定律的语言。
那么,我们为何如此执着于这些量表及其“允许的变换”呢?因为它们提供了一种科学家的保证。它们告诉我们哪些陈述是关于自然的,哪些仅仅是我们所选测量系统的产物。一个陈述只有在其真实性对于其量表的任何允许变换都保持不变时,才是有意义的。
对于比率量表,这带来了一个绝妙的结果。陈述“ 是 的两倍”是关于一个比率的陈述,。如果我们改变单位(一个允许的变换,),新的比率是 。比率得以保留!它是 不变的。生物标志物浓度增加 2 倍是一个真实的生物学事件,无论你用纳克/毫升还是皮克/升来测量它。
这种不变性原则也决定了我们可以使用哪些统计摘要。对于比率量表,像平均数这样的统计量是完全有意义的。但有些统计量甚至更特别。考虑变异系数(CV),定义为标准差与平均数的比值,。如果我们应用比率量表变换 ,新的平均数变成 ,新的标准差变成 。新的 CV 是 。它完全不变!CV 是一个纯粹的、无单位的相对变异性度量,只在比率量表上有意义。如果你用区间量表变换 试试,你会发现那个讨厌的“”项破坏了这种美妙的不变性。有趣的是,其他统计量有它们自己的不变性属性;例如,Pearson 相关系数在区间量表的仿射变换下是不变的,这就是为什么我们可以有意义地将摄氏温度与心率关联起来。
搞错量表不仅是一个哲学错误;它可能导致科学上毫无意义的结论。想象一下一个测试新型止痛药的临床试验。研究人员在一个 1 到 5 的顺序量表上记录疼痛,并把这些数字当作来自区间量表的数据,运行 t 检验来比较两组的平均疼痛分数。他们发现了一个“统计上显著”的差异。一个巨大的成功!
但是等等。一位同事指出该量表是顺序量表,任何保序变换都是有效的。如果疼痛级别之间的心理“距离”不是均匀的呢?让我们应用一个完全允许的顺序变换,比如 ,这个变换拉伸了量表的高端部分。每个人的疼痛评分顺序保持不变。潜在的现实没有改变。然而,当对这些新数字重新运行 t 检验时,“显著”的结果消失了。这个发现并不在数据中,而是所选任意数字的产物。它是机器中的幽灵。
同样的危险也潜伏在物理建模中。假设一个生化反应速率 与温度 遵循幂律关系,。这是一个根本上的乘性关系。为了检验它,我们可能会尝试对对数拟合一个线性模型:。这个模型仅在 是比率量表(如开尔文温标)时才有效。如果我们天真地代入摄氏温度,关系就变成了 ,这不再是 和 之间的简单线性关系。物理定律的基本形式被破坏了,我们估计指数 的尝试将变得毫无意义。
测量的世界充满了细节。认识到许多常见的数据形式,如计数(哮喘发作次数)、率(每人年病例数)和比例(具有某特征的人口比例),都是比率量表变量,这一点很重要。它们有真实零点,它们的比率也完全有意义。不要被计数是离散的或比例被限制在 0 和 1 之间这样的事实所迷惑;它们在我们意义阶梯上的地位是稳固的。
最后,我们必须仔细倾听我们的数据。在临床实验室中,报告为“未检出”的病毒载量并不意味着病毒载量为零。它意味着浓度低于检测方法的检测限。在计算中将“未检出”视为真实零点将是一个错误,可能会在不存在的地方产生无限倍的变化。这提醒我们,即使我们有一个比率量表,我们也必须密切关注测量过程本身。理解各种量表是无误地翻译自然之书的第一步,也许也是最关键的一步。
您是否曾想过,为什么老鼠的心跳急促而狂乱,而大象的心跳却缓慢而沉稳?或者为什么一个单细胞生物不能长到足球那么大?从深层次上讲,答案与比率有关。细胞的生命是其体积(决定其新陈代谢需求)和其表面积(决定其从外界获取养分的能力)之间的一场持续斗争。随着细胞变大,其体积增长速度快于表面积。表面积与体积之比,与细胞半径的倒数 () 成比例,会急剧下降。一个大细胞根本无法足够快地输入营养物质来维持其体量,这是由几何和物理施加的基本限制。
这个简单而有力的想法——比率支配着世界的运作方式——是理解测量学中最基本概念之一:比率量表的入口。正如我们所见,如果一个测量有一个真实的、非任意的零点,那么它就属于比率量表。一个意味着“完全没有”的零点。长度、质量、时间、金钱都是如此。零美元是一种非常绝对的零!正是这一特性使得“10米是5米的两倍长”这样的说法有意义。您正在将两者与同一个绝对的零起点进行比较。这可能看起来显而易见,但掌握其含义是解开从解读医学扫描到设计数十亿美元临床试验等一系列惊人广泛的科学难题的关键。
在医学界,我们不断寻找能够告诉我们健康与疾病信息的数字。许多最强大的“生物标志物”都建立在比率量表的坚实基础上。当放射科医生查看 PET 扫描时,他们可能会测量肿瘤的“标准化摄取值”(),它反映了肿瘤消耗了多少放射性葡萄糖。 为零意味着完全没有摄取——一种绝对的缺失。这个真实零点使他们能够说, 为 的肿瘤的代谢活跃度是 为 的肿瘤的两倍。
同样的原则也适用于许多其他先进的医学测量。来自 MRI 扫描的表观弥散系数()测量水分子在组织内移动的自由度;值为零对应于零弥散状态,一个物理上的绝对值。速率常数 测量造影剂从血管泄漏到组织中的速度;零意味着没有泄漏。即使是从图像中提取的抽象统计纹理度量,如 GLCM 熵,也有一个代表完全可预测性的真实零点。在每种情况下,绝对零点的存在都允许我们用比率和百分比来思考,这是“多少”的自然语言。对于像 C-反应蛋白浓度(一种炎症标志物)或发烧消退所需的时间这样的测量也是如此;值为零是明确无误的,使它们成为真正的比率量表量。
现在,事情变得更有趣了。假设你是一名工程师,正在制造一个精美的设备,用于从指尖传感器测量血流的脉动幅度。你知道潜在的生理幅度是一个比率量表量——零意味着没有脉搏。但你的设备并不完美。传感器与皮肤的接触质量、皮肤的光学特性以及其他因素引入了一个未知的、因人而异的增益因子,。你的设备报告的数字 不是真实的幅度 ,而是 。如果你无法摆脱那个讨厌的、未知的乘数 ,你如何比较两个人之间的真实幅度?
这就是理解比率量表能带来好处的地方。因为误差是乘性的,试图用加性操作(比如减去受试者的平均读数)来纠正它是灾难性的错误。这就像试图用剪刀剪一张模糊的照片来修复它一样。正确的方法必须尊重问题的乘性本质。
一个聪明的解决方案是进行乘性归一化——例如,将一个受试者的每次测量值除以他们自己的基线读数。一个更深刻的技巧是取对数。对数,这个数学家神奇的发明,能将乘法变为加法。我们的方程变成了 。恼人的乘性因子 被转换成一个简单的加性偏移量 ,这可以很容易地通过居中等标准统计技术去除。这个优雅的数学“柔道”技巧,因正确识别测量量表而成为可能,使我们能够从失真的信号中恢复真实的生理信息。
用对数驯服乘性效应的这一原则远远超出了信号处理的范畴,它位于现代医学统计学的核心。生物系统是出了名的乘性系统。一种药物可能会使肝脏清除某种物质的速率加倍,而不是给它增加 5 个单位。一个人的基因构成可能会使他们的胰岛素水平比另一个人高 50%,而不仅仅是高 10 个点。
因为像药物浓度或生物标志物水平这样的量是在比率量表上,并且生物变异是乘性的,所以数据通常是顽固的右偏态。它们不符合许多统计检验所偏好的那种漂亮的、对称的钟形曲线。解决方案?取对数!
通过分析例如胰岛素浓度的自然对数,统计学家可以让他们的模型“满意”。但更重要的是,他们使其数学方法与潜在的生物学现实保持一致。这里有一个漂亮的回报:对数尺度上的简单差异对应于原始直观尺度上的比率。当一份临床试验报告指出,一种新药使对数转换后的胰岛素平均值减少了 时,他们真正的意思是该药物使几何平均胰岛素水平降低了 倍,即大约 。
同样的深层逻辑无处不在。当我们模拟像哮喘发作次数这样的事件计数时(这是比率量表,你不能有负数次发作),我们使用像泊松回归这样的方法,它自然地得出一个率比——一个关于事件率在不同组之间如何变化的乘性比较。当我们在生存分析中分析事件发生时间数据时,关键输出是风险比,这是一个乘性因子,无论我们用天、周还是年测量时间,它都完美地保持不变。甚至诊断检验和贝叶斯推理的核心逻辑也是建立在这个基础之上。似然比告诉我们一个检验结果应该在多大程度上改变我们对诊断的信念,它是一个比率量表量,以乘法方式作用于疾病的几率。在各个领域,情况都是一样的:对于比率量表数据,最有意义的比较本身就是比率。
到目前为止,我们的旅程一直走在坚实的地面上。但是当我们试图测量像疼痛这样的东西时会发生什么呢?我们可以要求病人用 0 到 10 的等级来评价他们的疼痛,其中 0 是“没有疼痛”,10 是“可以想象的最剧烈的疼痛”。这个量表当然似乎有一个真实的零点。那么它是一个比率量表吗?我们能说疼痛评分为 6 是 3 的两倍严重吗?
在这里,我们必须保持谦逊。虽然这些数字是有序的,但我们无法知道主观的“间隔”是否相等。从疼痛 1 到 2 的跳跃可能是一个温和的推动,而从 9 到 10 的跳跃可能是一道痛苦的鸿沟。声称这是一个比率量表是一种信念的飞跃,而且很可能是一个错误的飞跃。一种更诚实的方法是将其视为顺序量表,我们只相信其排序,或者充其量是区间量表。这种学术上的严谨性至关重要。它迫使我们使用尊重数据性质的统计工具——比如用中位数代替平均数,或者用基于秩的检验代替 t 检验——以避免得出字面上毫无意义的结论。
一个经典的对比是温度。摄氏温标有相等的间隔—— 和 之间的差异与 和 之间的差异是同样多的热能。但它的零点是任意的(水的冰点),所以它是一个区间量表,而不是比率量表。声称 是 的“两倍热”是无稽之谈。要做出这样的比率陈述,我们必须切换到开尔文温标,其中零是绝对零度——所有热运动的停止。在开尔文温标上, 真正代表了 的两倍热能。从摄氏度到开尔文的旅程,是从区间量表到比率量表的旅程,也正是这个旅程,为强大的热力学定律打开了大门,而这些定律都与比率有关。
这个教训是深刻的。世界并非简单地把数字交给我们;它交给我们的是现象。我们作为科学家的任务,是以一种能保持真实性的方式将这些现象映射到数字系统上。比率量表的概念不仅仅是一个枯燥的分类——它是该映射过程的指南。它是一种思考的工具,是我们对宇宙进行定量描述的语法。从单个细胞到临床试验,它告诉我们哪些问题值得一问,哪些注定是无稽之谈。它是一条统一的线索,编织着量化科学的织物。