风险价值 (VaR) 与预期短缺 (ES)

玻尔百科

关键要点

风险价值 (VaR) 在给定的置信水平下，量化了特定时间范围内的最大预期投资组合损失，但它忽略了超出此阈值的损失幅度。
预期短缺 (ES)，或称条件VaR，是一种更优越、一致性的风险度量，它计算的是在VaR被超过的日子里的平均损失。
VaR和ES可以通过多种方法计算，如假设统计分布的参数法，或使用历史数据的历史模拟法。
在金融领域之外，VaR和ES的原理被应用于精算学、环境经济学和人工智能安全等不同领域，以管理和理解尾部风险。

引言

在复杂的金融及其他领域，量化风险是一项至关重要的挑战。决策者们不断寻求一个简单而深刻问题的明确答案：“情况最糟会到什么程度？”几十年来，风险价值 (VaR) 一直是主流工具，旨在将市场的不确定性浓缩成一个单一、易于理解的数字。然而，仅仅依赖VaR可能会产生误导，因为它无法捕捉潜在灾难性损失的全部程度。本文旨在填补风险评估中的这一关键空白，首先探讨VaR的基础“原理与机制”，详细介绍其计算方法并揭示其内在缺陷。接着，文章介绍预期短缺 (ES) 这一在数学上一致且更直观的替代方案。随后，“应用与跨学科联系”一章将展示这些强大的概念如何不仅应用于现代金融中的投资组合优化和动态风险管理，还贯穿于精算学、生态学和人工智能等不同领域，揭示了理解和管理尾部风险的普遍重要性。

原理与机制

设想您是一艘即将穿越险恶水域的船的船长。您的领航员向您报告一个数字。他们说，这个数字代表了最坏的情况：“船长，我们有99%的把握，在这次航行中不会遇到超过15米高的海浪。”这个数字令人安心，它为您可能遇到的情况设定了清晰的界限。这，在本质上，就是风险价值 (VaR) 的核心思想。它试图将复杂、混乱的金融风险世界提炼成一个单一、易于理解的数字，来回答“情况最糟会到什么程度？”这个问题。

什么是风险价值？沙滩上的一条线

形式上，一个投资组合在给定的置信水平（比如 $1-\alpha$ ）和特定的时间范围内，其VaR是您预期在该概率水平下所能承受的最大损失。如果您的投资组合的一日99% VaR是100万美元，这意味着第二天损失超过100万美元的概率只有1%。它确实像是在沙滩上画的一条线——潜在损失分布上的一个分位数。

但是我们如何画出这条线呢？有几种不同的学派，每种都有其自己的哲学。

参数法：假设一张世界地图

一种方法是假设市场的混乱波动可以用一个简洁的数学公式，即一个已知的概率分布来描述。这就是参数法。

一种方法是假设损失分布本身遵循一个已知的概率分布，例如对数正态分布。如果我们做出这样的假设，就可以利用该分布的性质，解析地推导出损失分布上对应于我们VaR的确切点。如果损失 $X$ 遵循 $\text{LogNormal}(\mu, \sigma^2)$ 分布，那么在置信水平 $\alpha$ 下的VaR就是一个优美、简洁的公式： $\text{VaR}_\alpha(X) = \exp(\mu+\sigma\,\Phi^{-1}(\alpha))$ ，其中 $\Phi^{-1}(\alpha)$ 是标准正态分布的分位数函数。

一种更常见的参数方法是方差-协方差法，它假设资产回报率遵循表现良好的正态分布钟形曲线。如果我们能估计出投资组合中所有资产的预期回报率、波动率以及它们之间的相关性“共舞”，我们就可以计算出投资组合的整体波动率。由此，计算VaR就成了一个直接的步骤。

然而，这种方法带有一个巨大的警示：模型风险。如果我们的世界地图是错的怎么办？金融市场，尤其是像加密货币这样的高波动性资产，以其“肥尾”特性而闻名。这意味着极端事件——市场崩盘——的发生频率远高于正态分布的预测。当现实世界具有肥尾特性时，却假设一个正态世界，这就像你生活在飓风区，却只为一场小雨做准备。你的VaR计算将是对真实风险的危险低估。

历史法：从过去的航行中学习

如果我们对关于世界的假设持谨慎态度，为什么不直接看看它的历史呢？这就是历史模拟法背后的哲学。这个想法非常简单：我们收集我们投资组合过去（比如）1000天的历史回报率。然后，我们将这些天从最好到最差进行排序。99%的VaR就是第10个最差的日子（最差1%的阈值）的损失。我们不需要任何花哨的分布或希腊字母；我们只是让历史自己说话。这种方法直接、直观，并且没有困扰参数模型的那些假设。

当然，这种方法也有其自身的挑战。如果你的投资组合包含一种新型资产，或者像私募股权基金这样的非流动性资产，你没有每日的价格历史怎么办？你不能就这么忽略它——这就像忽略房间里的大象。这时金融工程就显得很聪明了。我们可以不直接研究这种非流动性资产，而是根据它对可观察、流动的市场因子（如整体股市或信用利差）的敏感性来对其行为进行建模。通过理解我们的非流动性资产如何“随同”这些日常因子变动，我们可以推断其风险状况，并将其纳入我们的VaR计算中。这种因子模型是一个强大的工具，用以洞察我们无法直接观察到的事物的风险。

VaR的明显缺陷：一个“有多糟？”的问题

至此，VaR似乎是一个合理且有用的工具。但它有一个微妙而深刻的缺陷。VaR告诉你的是最坏情况中的最好情况。它划定了一条线，告诉你不太可能越过它。但它完全没有告诉你，如果你真的越过了它会发生什么。

让我们想象一个极其狡猾的场景。一位风险经理建立了一个VaR模型。在250天里，该模型预测大约有2-3天的损失会超过VaR。经理对模型进行回测，发现确实有2天的损失大于VaR。模型以优异的成绩通过了测试！它看起来校准得非常完美。但问题在于：在那两天VaR被突破的日子里，实际损失不仅仅是略大一些，而是VaR金额的十倍。

VaR模型在灾难的频率上是“正确”的，但在幅度上却是灾难性的错误。VaR就像是悬崖边上的警示牌，上面写着“危险：前方有悬崖”。但它不会告诉你这个悬崖是10英尺深还是10,000英尺深。这种对分布尾部损失大小的“盲目性”是VaR最大的弱点。

预期短缺：衡量跌落的深度

要解决这个问题，我们需要一个新的度量。我们需要问一个更好的问题。我们不应该问“糟糕的一天的门槛是多少？”，而应该问：“如果我们真的遇到了糟糕的一天，我们的预期损失是多少？”这正是预期短缺 (ES) 告诉我们的。

预期短缺，又称条件风险价值 (CVaR)，是所有大于或等于VaR的损失的平均值。它不只告诉你悬崖边在哪里，还告诉你这个悬崖大概有多深。在我们那个狡猾的场景中，VaR可能是100万美元。而ES则会接近1000万美元，这个数字肯定会引起CEO的注意。

这不仅仅是一个更直观的度量；它在数学上也更优越。风险管理的一个关键原则是分散化。通常情况下，将不同的风险资产组合在一个投资组合中应该会降低你的整体风险。一个“好”的风险度量应该能反映这一点。捕捉这一点的数学特性被称为次可加性：合并后投资组合的风险应小于或等于其各组成部分风险之和，即 $\rho(A+B) \le \rho(A) + \rho(B)$ 。

令人惊讶的是，VaR可能会违反这个规则。对于某些类型的投资，VaR可能会暗示合并两个投资组合会增加风险，从而惩罚了分散化行为。而预期短缺则总是满足次可加性。它是一种一致性风险度量，这意味着它的行为方式与我们对风险的直觉在数学上是一致的。我们甚至可以通过模拟来观察这一特性，证实ES在VaR可能失效的地方能够可靠地促进分散化。

对于我们在金融中看到的具有“肥尾”的分布，VaR和ES之间的差距可能非常巨大。对于一个尾部遵循幂律（帕累托尾）的分布（这是极端事件的一个良好模型），这种关系尤为明显。VaR与ES的比率直接与尾部的“肥胖”程度相关。尾部越肥，ES就越会远超VaR。这个比率本身就成了一个至关重要的诊断工具，告诉我们VaR可能隐藏了多大的危险。

最终，风险度量的选择不仅仅是一个技术细节。它反映了一种哲学。VaR是在管理对“正常”坏日子的预期。ES则是理解和在真正灾难性的日子里生存下来的工具。正如我们所学到的，有时模型可能在另一个方向上出错——过于保守，预测零灾难，这可能会让主要目标是防止银行倒闭的监管机构满意，但却会让风险经理感到沮丧，因为他们认为这不必要地占用了可以创造利润的资本。风险探索之旅是一场在数学严谨性、实际执行以及塑造我们金融世界的非常人性化的激励因素之间的持续对话。

应用与跨学科联系

现在我们已经掌握了风险价值 (VaR) 和预期短缺 (ES) 的数学机制，一个问题可能一直困扰着你：这一切究竟是为了什么？学习这些概念可能感觉像学习国际象棋的规则；或许有趣，但如果你从不下棋，又有什么意义呢？本章就是关于“下棋”的。在这里，我们看到这些思想变得鲜活，从抽象的定义转变为塑造金融、科学甚至我们日常生活决策的强大工具。你会发现，探求“情况最糟会到什么程度？”这个简单问题的答案，是一条贯穿于人类各种惊人多样化事业的线索。

跳动的心脏：现代金融

金融是VaR和ES成长的沃土，它们的诞生源于管理全球市场巨大而复杂风险的需求。但它们在这里的应用远不止是为风险贴上一个数字标签。

从选股到筑堡

设想你在构建一个投资组合。旧的思维方式是把它装满你期望有高回报的资产。但我们知道，高回报往往伴随着高风险。预期短缺提供了一个更精巧的目标。你不再仅仅试图最大化你的平均结果，而是可以尝试构建一个在根本上能抵御糟糕日子的投资组合。

金融工程师现在将ES作为优化算法的直接输入。目标不再仅仅是“在给定风险下最大化预期回报”，而是更深刻的东西，比如“找到一种资产组合，在实现可观回报的同时，最小化在最差5%的日子里的平均损失”。这将投资组合的构建从一场挑选赢家的游戏，转变为一项建筑设计任务——精心打造一个能够抵御不可避免的风暴而不会崩塌的结构。

对你的投资组合的医生诊断

投资组合的一个单一风险数字，就像病人的高烧一样，告诉你出了问题，但没有告诉你是什么问题。一个ES很高的投资组合经理需要知道：风险来自哪里？是那只波动的科技股吗？还是那只本应安全但在危机中表现异常的债券？

这就是“成分ES”概念的用武之地。通过利用风险度量的数学特性，我们可以将投资组合的总ES分解为来自每个单独资产的贡献。这就像能够倾听引擎中的每个气缸，找出那个失火的气缸。这使得精准的风险管理成为可能。经理不必盲目出售资产以降低风险，而是可以识别尾部风险的真正来源，并做出有针对性的、明智的决策。一种资产本身可能波动性很低，但如果它倾向于在其他所有资产同时暴跌时也暴跌，那么它对投资组合尾部风险的贡献可能会非常巨大。成分ES揭示了这些隐藏的、危险的相关性。

与波动共舞：动态风险管理

市场不是一个静态的生物。它会“呼吸”——其波动性会扩张和收缩。今天看似合理的风险限额，如果波动性突然飙升，明天可能就变得极度鲁莽。一个真正有效的风险管理系统必须是灵活的，能够实时适应市场特性的变化。

这是通过将风险模型与时间序列预测联系起来实现的。例如，金融计量经济学家使用像GARCH（广义自回归条件异方差）这样的模型，根据今天的市场动向来预测第二天的波动性。这个波动性预测 $\sigma_{t+1}$ 可以直接代入预期短缺公式。这给出了一个动态的ES估计，当市场变得动荡时它会增长，当市场平静时它会缩小。然后可以给一个交易台设定一个固定的预期短缺预算，比如说，不超过100万美元。在平静的日子里，这个预算可能允许他们持有大量头寸。但如果他们的GARCH模型预示风暴即将来临，每投资一美元的预期ES预测值增加了三倍，那么他们允许的最大头寸规模会自动缩小三分之二，以将总ES控制在预算之内。这创建了一个有纪律的、自我调节的系统，迫使交易员在承担风险最危险的时候精确地降低风险。

驯服黑天鹅

正态分布，即我们熟悉的钟形曲线，是一个非常方便的工具，但金融市场有一个坏习惯，就是不理会它。市场回报的真实分布具有“肥尾”，这意味着极端事件——崩盘和暴涨——发生的频率远比钟形曲线让我们相信的要高。此外，在危机中，相关性会发生变化。通常不相关的资产可能会突然一起下跌。

为了处理这个问题，风险管理者必须超越简单的假设。他们建立复杂的模型，比如用于评估经济衰退中数千家公司债券违约风险的信用投资组合模型。这些模型明确考虑了一个“系统性因子”——导致许多违约同时发生的经济地震。更强大的是，他们求助于一个叫做极值理论 (EVT) 的统计学分支。EVT是关于稀有事件的科学。它提供了一个数学基础，即广义帕累托分布 (GPD)，专门用于对分布的尾部进行建模，而不管其中间的形状如何。应用EVT需要非常小心，涉及到统计诊断、敏感性分析和专家判断的微妙结合，以产生一个可信且稳健的风险估计，真正尊重来自尾部的数据。

关键时刻：回测

一个漂亮的理论或一个复杂的模型如果不能在现实世界中奏效，就一文不值。风险模型是一个科学假设：它做出一个预测，例如，“大于 $X$ 的损失应该只在1%的时间内发生。”科学方法要求我们将这一假设与现实进行检验。这个过程称为回测。

在回测中，我们用我们的模型，将其历史预测与实际的历史结果进行比较。如果我们的99% VaR模型在过去一年中有10%的时间被突破，那它就是一个糟糕的模型。统计学家已经开发了正式的假设检验，如Kupiec检验，来确定VaR突破的次数是否在统计上与模型预测的一致。同样，我们也可以回测我们的ES模型。在VaR被突破的日子里，平均损失是否与ES预测的一致，还是说情况要糟糕得多？这种预测、测量和验证的持续循环，将专业的风险管理与纯粹的猜测区分开来。它是量化分析师的良知，确保优雅的数学始终与现实世界的混乱真相紧密相连。

超越金融：风险的统一视角

如果我们的旅程在金融领域结束，那将是一段有趣的旅程。但预期短缺的真正美妙之处在于，当我们看到它走出自己的主场，在完全不同的领域提供洞见时才得以显现。事实证明，“尾部平均损失”是一个基本概念。

生命的跨度：精算学

考虑一位领取社会保障福利的退休人员。他们正在领取一份年金——只要他们还活着，就能持续获得一系列付款。这里的风险不是市场崩溃，而是长寿。对于政府或养老基金来说，“坏结果”是人们的寿命比预期的要长得多，从而给系统财务带来压力。对于个人规划退休而言，风险则相反：过早去世意味着收到的总福利远低于他们可能计划的数额。

我们可以使用与VaR和ES完全相同的逻辑来分析这个问题。我们可以将“短缺”建模为因在某个年龄前去世而未收到的未来付款的现值。通过将死亡率表（实际上就是风险率列表）与利率相结合，我们可以计算出这种短缺的完整概率分布。由此，我们可以计算年金的预期短缺——例如，在最差5%的寿命结果中损失的平均现值。这为长寿风险提供了一幅丰富而细致的图景，对于公共政策和个人财务规划都至关重要。

大自然的账本：生态与环境科学

我们如何为一片盐沼估值？它对鸟类来说是个好地方，但它的经济价值是什么？其最重要的作用之一是作为一种调节性生态系统服务：它通过吸收风暴潮来提供防洪作用。这项服务以避免损害的形式带来直接的经济效益。但这种效益是不确定的；它取决于天气。

环境经济学家可以使用水文模型来模拟一个流域或海岸线数千种可能的年度结果。对于每种结果，他们可以估计在有沼泽和没有沼泽的情况下会发生的洪水损失。差额就是年度效益，一个随机变量 $B$ 。现在，一个风险规避的规划者可能不关心平均效益，而是关心下行风险。在糟糕的一年里会发生什么？通过计算这些效益的风险价值——比如，95%的时间内能超过的效益水平——我们为项目的表现建立了一个保守的底线。5%的VaR告诉规划者，在除了最坏情况之外的所有情景中，他们可以指望的最低效益是多少，这为在不确定性下做出关于气候变化适应和生态恢复的决策提供了一个强大的工具。

机器中的幽灵：人工智能

我们越来越多地将关键决策交给人工智能 (AI) 和机器学习模型。银行使用AI来批准贷款。医生使用AI来帮助从医学影像中诊断癌症。工程师使用神经网络来预测桥梁的应力。评估这些模型的一个常用方法是看它们的平均准确率或平均误差。但这可能具有危险的误导性。

一个AI可能准确率高达99.9%，但在那0.1%出错的时候会发生什么？它是犯了一个无伤大雅的小错误，还是导致了灾难性的失败？这就是“模型尾部风险”。为了衡量这一点，数据科学家们开始采用一个他们称之为“预期预测误差短缺” (EPES) 的概念。他们计算数据集中每个点的预测误差，然后计算这些误差的ES。5%水平的EPES告诉你：“在这个模型最不理解的5%的案例中，它的平均误差幅度是多少？” 这将注意力集中在最需要的地方：模型的盲点及其潜在的灾难性失败。为确保AI的安全性和可靠性，理解平均情况是不够的；我们必须理解最坏的情况。

个人反思：学生的困境

最后，让我们把这个想法带回家。想想你自己的学业表现。你有一系列课程的成绩。你的平均学分绩点 (GPA) 是这个分布的均值。但它并不能说明全部情况。也许你在某些科目上才华横溢，但在其他科目上却非常吃力。

让我们定义你在10%水平上的“预期成绩短缺”。这是你在表现最差的10%课程中的平均成绩。这个单一的数字具有深刻的洞察力。如果你的总GPA是85分，但你的10%预期成绩短缺是55分，这揭示了一个重大的弱点。它告诉你，当事情不顺利时，情况会非常糟糕。它量化了你在尾部的表现——你个人最薄弱的领域。

这个简单的类比揭示了预期短缺的普遍本质。它是一个自我反省的工具。它迫使我们超越舒适的平均值，去面对我们最差结果的不舒服现实。无论你是在管理一个价值数十亿美元的投资组合，设计一个安全的人工智能，规划一个国家的养老金体系，还是仅仅试图了解自己的长处和短处，核心问题都是一样的：当情况糟糕时，究竟有多糟？正是在对这个问题进行严谨、量化的追求中，才找到了这些概念的真正力量和美妙之处。