try ai
科普
编辑
分享
反馈
  • 乘法平均数

乘法平均数

SciencePedia玻尔百科
核心要点
  • 对于像投资回报这样的乘法过程,算术平均数具有误导性;而几何平均数则能提供复合增长的真实平均速率。
  • 波动性会对长期增长产生“拖累”效应,这一成本在数学上通过詹森不等式被几何平均数所捕捉。
  • 在演化生物学中,自然选择常常偏好那些能够最大化长期几何平均适应度的风险对冲策略,即使这意味着牺牲巅峰时期的表现。
  • 金融学中的凯利准则利用几何平均数,通过平衡收益与风险,找到能使资本长期增长率最大化的最优投资比例。
  • 对于基因表达等内在的乘法过程,其结果通常呈对数正态分布,而几何平均数是衡量其集中趋势最自然的指标。

引言

什么是“平均数”?虽然我们通常默认使用简单的算术平均数,但当这个直观的工具被应用于随时间复合增长的过程时,它可能会带来危险的误导。从投资回报到种群动态,结果往往是相乘累积的,使用错误的平均数类型可能导致错误的结论和代价高昂的失误。本文旨在填补这一关键的知识空白,介绍乘法平均数(更正式的名称是几何平均数),将其作为理解波动系统中长期增长的正确框架。在接下来的章节中,我们将首先深入探讨“原理与机制”,探索为何我们熟悉的平均数会失效,以及由对数逻辑驱动的几何平均数如何提供对复合增长的真实度量。然后,我们将开启一段“应用与跨学科联系”的旅程,探索这个单一概念如何统一了在演化生物学、金融学和物理化学等不同领域中关乎生存与成功的策略。

原理与机制

日常平均数的欺骗性

50%的收益和40%的亏损,平均下来是多少?你那被多年计算考试分数和分摊账单磨练出来的直觉可能会大声回答:“5%的收益!” 这感觉简单、明显且令人满意,但它完全是错的。

让我们在实践中看看。假设你是一位投资分析师,初始资金为1000美元。第一年,市场繁荣,你获得了50%的收益,投资组合增至1500美元。不错!但第二年,市场回调带来了40%的亏损。你损失了 0.40 \times \1500 = $600$。你的投资组合缩水至仅剩900美元。尽管“平均”回报率为+5%,你实际上却亏了钱。

这个难题的出现,是因为投资回报与自然界和金融领域的许多过程一样,是​​乘法性​​的。你在每年年末的财富,是前一年财富乘以一个增长因子。50%的收益是乘以 1.501.501.50;40%的亏损是乘以 0.600.600.60。两年下来,你的初始资本被乘以 1.50×0.60=0.901.50 \times 0.60 = 0.901.50×0.60=0.90,即净亏损10%。

我们熟悉的​​算术平均数​​,通过将数值相加再除以数量得到,是为加法过程而构建的。它能回答诸如“如果我第一小时以50英里/小时的速度行驶,第二小时以70英里/小时的速度行驶,那么我这两小时的平均速度是多少?”这样的问题。但当处理复合增长时,即前一步的结果会乘以下一步,算术平均数就可能具有危险的误导性。一个年增长因子分别为 1.501.501.50、0.600.600.60、1.201.201.20 和 0.800.800.80 的基金,其算术平均增长因子为 1.0251.0251.025,这似乎表明每年有2.5%的稳定增长。然而,实际的四年乘数是 1.50×0.60×1.20×0.80=0.8641.50 \times 0.60 \times 1.20 \times 0.80 = 0.8641.50×0.60×1.20×0.80=0.864,造成了显著的总体亏损。简单的平均数撒了谎。我们需要一个更好的工具。

乘法的逻辑:揭示几何平均数

为了找到正确的工具,我们先要提出正确的问题。如果一个过程包含不同的乘法步骤,那么是否存在一个单一的、恒定的因子,在每一步都使用它,能产生与原过程相同的最终结果?

考虑一个生物种群所处的简单交替环境。第一年,条件优越,种群数量翻倍(增长因子为 222)。第二年,干旱来袭,种群数量减半(增长因子为 0.50.50.5)。那么,每年的有效平均增长因子是多少?。

算术平均数会给出一个 2+0.52=1.25\frac{2 + 0.5}{2} = 1.2522+0.5​=1.25 的平均因子,意味着每年增长25%。但让我们追踪一下种群数量。如果我们从 NNN 个个体开始,第一年后我们有 2N2N2N 个。第二年后,我们有 0.5×(2N)=N0.5 \times (2N) = N0.5×(2N)=N 个。我们又回到了起点!两年内的净效应是乘以 2×0.5=12 \times 0.5 = 12×0.5=1。因此,每年的有效恒定因子 ggg 必须满足 g×g=1g \times g = 1g×g=1,即 g=1g = 1g=1。平均而言,该种群是稳定的。

这个有效因子 ggg 就是​​几何平均数​​。对于一组包含 nnn 个数的集合,它的计算方法不是相加后相除,而是相乘后开 nnn 次方:

g=(x1⋅x2⋅⋯⋅xn)1ng = (x_1 \cdot x_2 \cdot \dots \cdot x_n)^{\frac{1}{n}}g=(x1​⋅x2​⋅⋯⋅xn​)n1​

对于我们的投资组合,真实的年均增长因子是 (1.50×0.60×1.20×0.80)14=(0.864)14≈0.964(1.50 \times 0.60 \times 1.20 \times 0.80)^{\frac{1}{4}} = (0.864)^{\frac{1}{4}} \approx 0.964(1.50×0.60×1.20×0.80)41​=(0.864)41​≈0.964。这个数字揭示了真实情况:平均而言,该基金每年损失约3.6%的价值。几何平均数准确地捕捉了复合增长的本质。

秘密引擎:为何对数主宰长期趋势

但这为什么行得通?其背后更深层的机制是什么?秘密在于一个你可能还记得的美妙数学技巧:​​对数将乘法转化为加法​​。

当我们面对一长串乘法时,例如 NT=N0⋅w1⋅w2⋅⋯⋅wTN_T = N_0 \cdot w_1 \cdot w_2 \cdot \dots \cdot w_TNT​=N0​⋅w1​⋅w2​⋅⋯⋅wT​(其中 wtw_twt​ 是第 ttt 年的增长因子),很难看清其长期趋势。但如果我们对等式两边取自然对数,世界就变得线性和清晰了:

ln⁡(NT)=ln⁡(N0)+ln⁡(w1)+ln⁡(w2)+⋯+ln⁡(wT)\ln(N_T) = \ln(N_0) + \ln(w_1) + \ln(w_2) + \dots + \ln(w_T)ln(NT​)=ln(N0​)+ln(w1​)+ln(w2​)+⋯+ln(wT​)

你最终财富的对数,就是你初始财富的对数,加上每一年对数增长率的总和。突然之间,我们进入了熟悉的加法世界!每一代对数财富的平均变化,就是对数增长率的算术平均数:1T∑ln⁡(wt)\frac{1}{T}\sum \ln(w_t)T1​∑ln(wt​)。

在波动的条件下,经过很长一段时间后,大数定律告诉我们这个平均值将收敛于期望值 E[ln⁡(w)]E[\ln(w)]E[ln(w)]。这个值才是长期增长的真正引擎。为了回到我们常规的增长因子尺度,我们只需用对数运算的逆运算——指数函数——来逆转这个过程。因此,长期有效增长率是:

wˉlong-run=exp⁡(E[ln⁡(w)])\bar{w}_{\text{long-run}} = \exp(E[\ln(w)])wˉlong-run​=exp(E[ln(w)])

这就是随机过程的几何平均数的正式定义。它主导着任何状态随时间乘法累积的系统,从你的银行账户到一个物种的种群数量。

颠簸之旅的代价:波动性与詹森不等式

这种对数视角揭示了另一个深刻的真理:波动性是有代价的。对数函数 ln⁡(x)\ln(x)ln(x) 是​​凹函数​​——它的曲线是向下弯曲的。想象一根下垂的钢丝,其两端锚点的平均高度总是高于钢丝中间点的高度。

同样,对于一个随机增长因子 WWW,其平均值的对数总是大于或等于其对数的平均值:

ln⁡(E[W])≥E[ln⁡(W)]\ln(E[W]) \ge E[\ln(W)]ln(E[W])≥E[ln(W)]

这是一个著名的数学结论,称为​​詹森不等式​​。不等式两边的差距 ln⁡(E[W])−E[ln⁡(W)]\ln(E[W]) - E[\ln(W)]ln(E[W])−E[ln(W)] 代表了由波动引起的增长拖累。对于固定的算术平均回报,方差越高的策略,其几何平均回报就越低。旅程越颠簸,代价就越大。这就是为什么一个+50%和-30%回报的策略(算术平均因子为1.1)的长期增长率,会低于一个稳定的+10%回报的策略(算术平均因子同样为1.1)。前者的波动性侵蚀了其长期表现。

从华尔街到荒野:演化的宏大策略

这个原理不仅仅是人类经济学的产物。大自然这位终极的长期投资者,在数十亿年前就发现了它。自然选择在漫长岁月和波动环境中起作用,它不偏爱在某个好年份具有最高期望适应度的生物体,而是偏爱具有最高长期(几何平均)增长率的生物体。

考虑一个物种在好坏年份各占一半的环境中的两种竞争性生存策略:

  • ​​策略R(赌徒型):​​ 在好年份茁壮成长(适应度为 1.81.81.8),但在坏年份崩溃(适应度为 0.40.40.4)。
  • ​​策略K(保守型):​​ 在所有条件下表现适中(好年份适应度为 1.31.31.3,坏年份适应度为 0.90.90.9)。

让我们计算它们的算术平均适应度。对于策略R,它是 1.8+0.42=1.1\frac{1.8+0.4}{2} = 1.121.8+0.4​=1.1。对于策略K,它是 1.3+0.92=1.1\frac{1.3+0.9}{2} = 1.121.3+0.9​=1.1。基于简单的平均值,它们似乎势均力敌。但大自然玩的是长线游戏。

长期增长率由几何平均数决定。

  • 对于策略R:1.8×0.4=0.72≈0.85\sqrt{1.8 \times 0.4} = \sqrt{0.72} \approx 0.851.8×0.4​=0.72​≈0.85。这个谱系注定会灭绝。
  • 对于策略K:1.3×0.9=1.17≈1.08\sqrt{1.3 \times 0.9} = \sqrt{1.17} \approx 1.081.3×0.9​=1.17​≈1.08。这个谱系将稳定增长。

保守型策略,尽管算术平均值相同,却最终将战胜赌徒型策略。一个灾难性的年份就能将许多好年份的收益一扫而空,几何平均数完美地捕捉了这一事实。这就是演化中​​风险对冲​​(bet-hedging)的精髓:降低适应度方差的策略常常受到青睐,即使这意味着在最佳时期牺牲巅峰表现。这一原理可以解释诸如沙漠植物的种子休眠等性状(这让一个谱系能够“熬过”灾难性的干旱年份),或动物的多次繁殖(这能将成功平均到多个季节)。

这个框架不仅是描述性的,也是预测性的。通过将两种策略的几何平均适应度设为相等,我们可以计算出精确的环境条件——例如,湿润年份的关键概率 pcritp_{\text{crit}}pcrit​——在此条件下,一种策略开始胜过另一种。

知所取舍:自然选择的精妙之处

那么,算术平均数总是错误的选择吗?完全不是。关键在于决策的时间尺度和可用的信息。

几何平均数是​​长期​​博弈的大师,适用于需要选择单一策略来应对充满不确定性的未来起伏。它是​​风险对冲​​的正确工具。

但如果一个生物体能获得可靠的天气预报呢?想象一株植物,它能在季节之初感知到高湿度,并相应地调整其生理机能。这就是​​表型可塑性​​。在这种情况下,生物体不是下一次终生有效的赌注,而是在每一代都做出一个新的、基于信息的决策。其目标是在收到特定信号的条件下,最大化该特定代的产出。这是一个短期优化问题,而对于这类问题,算术平均数恰好是正确的工具。最优策略是选择在收到的信号条件下,具有最高*期望*(算术平均)适应度的表型。

选择哪种平均数,就是选择一种哲学。算术平均数是短期乐观主义者的工具,旨在最大化下一步的期望收益。几何平均数是长期幸存者的工具,旨在确保在未知和严酷的未来中得以存续。理解何时使用哪种工具,是破译生命策略和增长逻辑的关键。

应用与跨学科联系

现在我们已经掌握了乘法平均数的原理,让我们开启一段旅程。我们将离开抽象数学那洁净明亮的世界,进入生物学、金融学,乃至化学亚原子世界的狂野、纷繁而迷人的领域。你可能会惊讶地发现,几何平均数这一概念,如同一条秘密的线索,将细菌的生死抉择、野花的繁殖策略、成功投资者的逻辑,以及我们模拟分子相互作用基本结构的方式联系在一起。看来,大自然以其无穷的智慧,远在我们之前就发现了乘法平均数的力量。

演化的引擎:在风险世界中进行风险对冲

生命是一场赌博。对任何生物体而言,未来是一系列不可预测的季节,有好有坏。在这场宏大的生存赌场中,制胜策略是什么?是在好光景时全力以赴,以期获得巨大回报?还是保守行事,确保能在坏光景中幸存下来,以待来日?我们被算术思维塑造的直觉常常告诉我们,应该最大化平均成功率。但演化,这场跨越数百万代的博弈,遵循的是一种不同的逻辑——乘法逻辑。

想象一种简单的高山草甸野花,我们称之为 Flos incertus。它的全部繁殖成功与否,都取决于秋季第一次霜冻的时间。有些年份是“有利”的,霜冻来得晚,使其能够结出大量种子。其他年份则是“不利”的,早来的霜冻会毁掉大部分潜在的后代。在这个种群中,我们发现了两种类型的植株。一种是豪赌客,将所有能量投入到晚季开花,在有利年份能产出惊人数量的种子,但如果霜冻提前,则几乎完全失败。另一种是谨慎的玩家——“风险对冲者”——它会提早开花。它永远无法取得豪赌客那样的惊人成功,但无论霜冻何时到来,它都能可靠地产出数量适中的种子。

如果你计算多年来的平均产籽量(算术平均数),豪赌客可能看起来是赢家。它有些年份的巨大成功会拉高其平均值。但一个种群的规模年复一年不是相加,而是相乘的。一个灾难性的年份,种群数量锐减至接近于零,就足以抹去所有先前成功的记忆。因此,长期的演化成功不取决于后代的算术平均数,而取决于*几何平均数*。在这种情景下,风险对冲的植株通过避免灾难性失败,在长期内实现了更高且更稳定的乘法增长率。尽管它从未有过“中大奖”的年份,但其谱系却能稳定地超越赌徒,这揭示了一个深刻的原理:在乘法博弈中,避免毁灭比最大化偶尔的收益更重要。

这种“风险对冲”策略在自然界中无处不在。它解释了为什么一些物种采用一种称为“多次繁殖”(iteroparity)的策略,将繁殖投入分散在多个季节,而不是一次性用完(“一次繁殖”,semelparity)。通过多次繁殖,生物体降低了其整个遗传遗产因单个坏年份而被彻底摧毁的风险。虽然这可能会降低其在任何单一代的期望后代数量(算术平均适应度),但却增加了其谱系的长期乘法增长率(几何平均适应度)。我们在植物种子的行为中也看到了同样的逻辑。许多物种产生的种子不会一次性全部萌发,一部分会以休眠状态留在土壤中,有时长达数年。这些休眠种子是一种生物保险。如果火灾或干旱等干扰杀死了所有已萌发的植株,种子库就能确保谱系的存续。通过优化保持休眠的种子比例,该物种实际上是在好年份和干扰年份的循环中,最大化其几何平均适应度。

同样的戏剧在微观尺度上演。以噬菌体为例,这是一种感染细菌的病毒。当它感染一个宿主细胞时,它面临一个选择。它可以进入“裂解”周期,立即劫持细胞的机制,产生大量新病毒,并在此过程中杀死宿主。或者,它可以选择“溶源”,将其DNA整合到宿主基因组中并潜伏下来,随宿主细胞分裂而被动复制。在充满宿主细胞的环境中(“好时期”),裂解策略似乎更优,能导致快速增殖。但如果宿主种群崩溃(“坏时期”)呢?来自裂解爆发的自由漂浮的病毒将找不到新的家园并迅速衰败。然而,溶源性病毒则安全地躲在幸存的宿主内部。一个可以在这两种策略之间选择的温和噬菌体,必须在裂解周期的快速增长与溶源状态的安全港湾之间取得平衡。选择溶源的最佳概率不是随机的;它是一个经过精细调整的参数,经过选择以在波动的环境条件下最大化噬菌体的长期几何平均增长率。

这一原理甚至阐明了现代医学最大的挑战之一:抗生素耐药性。耐药细菌通常要为其能力付出代价;在无药物环境中,它的生长速度可能比其药物敏感的同类要慢。如果我们只考虑这个“成本”,我们可能会认为敏感菌株总是会赢。但环境并非恒定不变。当存在抗生素时,敏感菌株被大量消灭,而耐药菌株则茁壮成长。这场竞争的最终胜利者,不是由平均生长速度更快的菌株决定,而是由在药物存在和不存在状态间切换的环境中,具有更高长期乘法增长率的菌株决定。即使只有一小部分时间处于抗生素压力下,也足以让“较慢”的耐药菌株获得决定性的长期优势,这是几何平均动态的直接结果。

金钱与信息的逻辑:最优增长

事实证明,大自然和股票市场正在玩着一场惊人相似的游戏。如果你投资,你的资本从一年到下一年会乘以某个增长因子。10%的收益意味着你的资本乘以 1.11.11.1。5%的亏损意味着它乘以 0.950.950.95。多年后你的总财富是所有这些年度乘数的乘积。听起来耳熟吗?

这就引出了金融学和信息论中最强大但又最未被充分赏识的思想之一:凯利准则(Kelly Criterion)。想象一下,你获得一个有正期望值的重复性赌注。例如,你有60%的机会将赌注翻倍,40%的机会输掉它。你的算术平均直觉会尖叫着让你尽可能多地押注!毕竟,平均来看你是赚钱的。但如果你每次都押上全部身家呢?一旦遭遇第一次亏损——这是迟早会发生的事——你就永远出局了。你的最终财富为零。

一个精明投资者的目标不是最大化任何单次投注的期望收益,而是最大化其资本的长期增长率。由于资本是乘法增长的,这等同于最大化增长因子的几何平均数。凯利准则给出了精确的答案:它告诉你应该投注资本的哪个最优比例,以实现这一最大的几何增长率。这是针对你财务的风险对冲策略。这个比例通常比你贪婪的直觉所暗示的要小,因为它巧妙地平衡了收益潜力和毁灭性损失的风险。它认识到,在乘法博弈中,波动性是增长的拖累。一个+50%和-40%的回报序列,其算术平均值为+5%,但几何结果是 1.5×0.6=0.9≈0.948\sqrt{1.5 \times 0.6} = \sqrt{0.9} \approx 0.9481.5×0.6​=0.9​≈0.948,净亏损超过5%!凯利策略找到了最大化这个几何平均数的最佳点,为不确定性下的资本配置提供了一个理性的框架。同样的逻辑也适用于赔率本身随时间变化的环境,例如遵循可预测模式或马尔可夫链。最优策略总是那个能最大化期望对数回报的平稳平均值的策略,这正是几何平均思想的核心。

超越增长:描述自然界的乘法过程

几何平均数不仅是优化增长的工具,也是描述内在乘法过程最自然的方式。在合成生物学中,科学家设计细胞产生荧光蛋白(如GFP)作为基因活性的报告器。当他们使用流式细胞仪测量一个克隆群体中数千个单细胞的荧光时,他们看到的不是一个漂亮的、对称的钟形曲线,而是一个带有很长“亮细胞”尾巴的偏态分布。

为什么?因为基因表达是一系列乘法事件的级联反应。从一个基因转录出的mRNA数量、从每个mRNA翻译出的蛋白质数量、蛋白质折叠的效率——所有这些因素都有其自身的变异性,它们相乘决定了最终的荧光强度。当你有一个由许多随机因素相乘驱动的过程时,其结果通常是对数正态分布。对于这样的分布,算术平均数是一个很差的汇总统计量;它被少数极亮的细胞向上拉高,并不能代表“典型”的细胞。然而,几何平均数却非常完美。在对数尺度上,乘法变成了加法,分布也变成了正态钟形曲线。原始荧光数据的几何平均数对应于这个潜在钟形曲线的中心,它也是该群体的中位数——即一半细胞比它亮,一半比它暗的那个值。对于乘法过程而言,它是物理上和统计上都有意义的集中趋势度量。

这个思想延伸到了物理化学领域。在模拟不同类型原子间的相互作用时,例如气体分子与沸石等多孔材料原子间的相互作用,我们需要为这种混合相互作用定义参数。一个关键参数是有效“尺寸”或碰撞直径 σ\sigmaσ。一种简单的方法是取各个原子尺寸的算术平均数。但这常常会失败,特别是当原子尺寸差异很大时。这种相互作用是一种更复杂的非线性关系。另一种选择,即几何平均数,通常能提供一个好得多的模型。在沸石孔道的狭窄空间内,分子的扩散能力对其所面临的排斥能垒极为敏感,该能垒可以与有效尺寸参数的12次方成正比!算术平均数容易高估这个尺寸,而对该尺寸的微小高估就可能导致对能垒的巨大高估,从而预测扩散不可能发生,而实际上它却很容易发生。几何平均数总是小于或等于算术平均数,它提供了一个更小的有效尺寸,从而可以得出更符合现实的物理行为预测。这表明,“平均”相互作用最好被看作是一种乘法混合,而非加法混合。

从生命的演化到投资的逻辑,再到对基本物理和生物过程的描述,几何平均数作为一个统一的概念浮现出来。它是思考效应复合、结果相乘、以及长期视角至关重要的系统的恰当工具。它教给我们一个微妙但至关重要的教训:在一个充满波动和乘法的世界里,通往长期成功的道路,不在于拥有最高的平均值,而在于经受住风暴,确保自己永远留在游戏中。