市场一起崩，是规律还是错觉？——给「尾部相依」装一把会区分的尺子

[2004 RFS] Extreme Value Dependence in Financial Markets: Diagnostics, Models, and Financial Implications

Ser-Huang Poon, Michael Rockinger, Jonathan Tawn

Jun He June 15, 2004

极值理论尾部相依系统性风险风险管理

Note

本文读的是 Poon, Rockinger & Tawn (2004, Review of Financial Studies)：他们用多元极值理论 (multivariate extreme value theory) 给「市场会不会一起崩」这个问题装上了两把互补的尺子 χ 与 χ̄，并用五大股指证明，国际股市在极端处大多是「渐近独立」(asymptotic independence) 的——这意味着金融界惯用的、默认「渐近相依」的多元极值模型，会系统性高估联合崩盘的概率。

1 一个被相关系数藏起来的问题

先问一个看似简单的问题：当美国股市暴跌的那一天，日本股市同时暴跌的概率有多大？

你大概会脱口而出：去看相关系数 (correlation) 啊。美日股市的 Pearson 相关系数是 0.267，德法之间是 0.695，于是结论似乎现成——德法绑得更紧，美日松一些。

可这里藏着一个魔鬼。相关系数是「偏离均值的乘积」的平均，它把大涨大跌和鸡毛蒜皮一视同仁，把正收益和负收益也搅在一起算。更要命的是，它背后默认了一个线性的、多元高斯的世界。而我们真正关心的从来不是「平均而言两个市场动得像不像」，而是一个尖锐得多的问题：在最极端的那一刻——当一个市场逼近它的崩盘下限时——另一个市场会不会陪着它一起跳下去？

接着，一个自然的问题是：这两件事真的一样吗？

作者给出的回答是——根本不一样，而且区别恰恰发生在分布最末梢、相关系数最看不清的地方。要把它讲清楚，得先引入极值统计里一个朴素却深刻的分类。

2 四种相依：关键在「尾巴的尽头」

把任意两个变量的随机性拆开看，它们的相依结构 (dependence structure) 无非四类：独立、完全相依、渐近相依 (asymptotic dependence)、渐近独立 (asymptotic independence)。前两个是教科书里的极端，真正微妙的是后两个。

它们的差别只在一个地方显形：当两个变量同时逼近各自的上限时。把变量重新标度到 [0,1] 区间，"渐近"指的就是趋于 1 这个上限的过程。

渐近相依：当一个变量冲向极限时，另一个变量也处在极限附近的概率，趋于一个非零的常数。极端值会同时发生。
渐近独立：同样的条件概率，趋于 0。两个变量各自都会有极端值，但它们总在不同的时点出现。

这个区分的杀伤力在于：几乎所有金融文献里的多元极值模型，都默认了渐近相依（Longin & Solnik (2001) 用的就是这一类）。如果真实世界其实是渐近独立的，那这些模型就会一口咬定「极端事件爱扎堆」，从而高估联合崩盘的概率——这正是本文要戳破的那层窗户纸。

3 识别策略：把边际「洗掉」，只留下相依

要干净地谈相依，第一步是把「边际分布」的影响清除掉——否则你分不清两个序列像不像，到底是因为相依强，还是只是各自的胖尾形状碰巧相似。

作者的做法是把原始收益 (X, Y) 变换到单位 Fréchet 边际 (S, T)：

$$ S = -1/\log F_X(X) \quad \text{and} \quad T = -1/\log F_Y(Y) $$

其中 F_X、F_Y 是各自的边际分布函数。之所以选 Fréchet 而非别的，是因为风险资产收益的胖尾 (fat tail) 早被反复记录 [Loretan & Phillips (1994)]。变换后 S、T 服从 F(s) = e^{-1/s}，于是 Pr(S > s) = Pr(T > s) = s^{-1} + O(s^{-2})，当 s → ∞。妙处在于：这一步只动边际、不动相依，(S, T) 与 (X, Y) 的相依结构完全一样。

有了共同的尺度，就能定义那个核心的条件概率 P(q)：

$$ P(q) = \cssId{a1}{\Pr[F(T) > q \mid F(S) > q]} = \cssId{a2}{\Pr[Y > F_Y^{-1}(q) \mid X > F_X^{-1}(q)]} $$

P(q) 大于、等于、小于 1 - q，分别对应在分位 q 处的正相依、独立、负相依。而真正的悬念藏在 q → 1（即越来越极端）时 P(q) 的去向。

作者用图 1 给了一张直观的对照：1990 年 11 月到 2001 年 11 月这 1000 个交易日里，美-日与德-法两对市场的散点图加上各自的 P(q) 曲线。德法那一对，正负极端都黏在一起，P(q) 在左尾稳稳地停在 0.4 附近——渐近相依；美日这一对则不然，最大的那些左尾极值只对应着对方「中等偏大」的同向变动，P(q) 随 q → 1 一路滑向 0——渐近独立。

Tip

一句话的含义：一个横跨太平洋的美日组合，比一个德法欧洲组合，承受的系统性崩盘风险其实更小——而这是单看 0.267 对 0.695 两个相关系数永远读不出来的。

4 两把互补的尺子：χ 与 χ̄

现在到了真正关键的一步。P(q) 只是直觉，作者要把它锻造成两个能估计、能检验的数。

第一把尺子 χ，直接取 P(q) 的极限：

$$ \chi = \lim_{q \to 1} P(q) = \lim_{s \to \infty} \Pr(T > s \mid S > s) = \lim_{s \to \infty} \frac{\Pr(T > s,\, S > s)}{\Pr(S > s)} $$

其中 0 ≤ χ ≤ 1。χ > 0 即渐近相依，χ = 1 即完全相依。但 χ 有一个致命盲区：只要是渐近独立的，χ 一律等于 0，无论这两个变量在极端处其实有多么正相关。一个 Pearson 相关 ρ ≠ 1 的二元正态分布，χ 恒为 0 [Sibuya (1960)]——可它显然不是独立的。χ 在渐近独立的世界里彻底失明。

于是反转出现：要给渐近独立的变量「测体温」，需要第二把尺子。这正是 Ledford & Tawn (1996) 的贡献，由 Coles, Heffernan & Tawn (1999) 写成的 χ̄：

$$ \bar{\chi} = \lim_{s \to \infty} \frac{2 \log \Pr(S > s)}{\log \Pr(S > s,\, T > s)} - 1, \qquad -1 < \bar{\chi} \le 1 $$

它衡量的是 Pr(T > s | S > s) 趋于零的速率。完全相依时 Pr(S>s,T>s)=Pr(S>s)，χ̄ = 1；独立时 Pr(S>s,T>s)=[Pr(S>s)]^2，χ̄ = 0；正相联、独立、负相联在极端处分别对应 χ̄ > 0、= 0、< 0。对二元正态，恰有 χ̄ = ρ。

两把尺子合在一起，才完整刻画了尾部相依的「形态 + 强度」。而且顺序不能乱：必须先检验 χ̄ 是否等于 1。

若 χ̄ = 1 → 渐近相依，强度由 χ > 0 给出；
若 χ̄ < 1 → 渐近独立，此时强制 χ = 0，强度改由 χ̄ 度量。

这套「先判类型、再量强度」的逻辑，是全文方法论的骨架。

5 怎么估：Hill 估计量与一个聪明的变量替换

抽象的极限要落到数据上。作者把 χ、χ̄ 的估计，统一归约到「拟合一个超过高阈值的一元胖尾模型」这件事上。

一元胖尾变量 Z 在高阈值 u 之上满足 Pr(Z > z) = L(z) z^{-1/ξ}，其中 ξ 是尾指数 (tail index)，L(z) 是慢变函数。把 L 近似当常数，最大似然就给出经典的 Hill (1975) 估计量：

$$ \hat{\xi} = \frac{1}{n_u} \sum_{j=1}^{n_u} \log\!\left(\frac{z_{(j)}}{u}\right) $$

聪明的一步在于估计 χ̄。Ledford & Tawn 证明在弱条件下 Pr(S>s,T>s) ≈ L(s) s^{-1/η}，且 χ̄ = 2η − 1。于是只要令 Z = min(S, T)：

$$ \Pr(Z > z) = \Pr\{\min(S,T) > z\} = \Pr(S > z,\, T > z) = L(z) z^{-1/\eta} $$

——η 摇身一变成了 min(S,T) 这个一元变量的尾指数！直接套 Hill 估计量即可。Draisma (2000) 的结果表明这个估计器表现良好，且没有 Hill 估计量在别处常见的偏误。阈值则用 Danielsson & de Vries (1997) 的自助法 (bootstrap) 选取。

Warning

一个诚实的脚注：以上推导都假设观测独立同分布。但收益有波动率聚集和自相关，时间相依会让标准误被低估。作者在实证里专门评估了这一偏误，下文会回到这点。

6 两个参数模型：逻辑斯蒂 vs. 高斯

识别出类型后，要做 VaR 之类的具体推断，还需要参数化的联合尾模型。作者各挑一个代表。

渐近相依的代表——逻辑斯蒂模型 (logistic)，金融界用得最多的那一类：

$$ \Pr(S \le s,\, T \le t) = \exp\!\left\{-\left(s^{-1/\gamma} + t^{-1/\gamma}\right)^{\gamma}\right\}, \qquad 0 < \gamma \le 1 $$

它的 (χ, χ̄) = (2 − 2^γ, 1)。γ = 1 时退化为独立、χ = 0；γ < 1 时渐近相依、χ > 0。注意 χ̄ 被钉死在 1——这恰恰暴露了它的先天缺陷：逻辑斯蒂模型从结构上就排除了渐近独立的可能。你用它去拟合一对其实渐近独立的市场，它会强行把它们当成「会一起崩」。

渐近独立的代表——高斯模型 [Bortot, Coles & Tawn (2000)]：

$$ \Pr(S \le s,\, T \le t) = \Phi_2\!\left(\Phi^{-1}\{\exp(-1/s)\},\, \Phi^{-1}\{\exp(-1/t)\};\, \rho_{ext}\right) $$

其 (χ, χ̄) = (0, ρ_ext)。作者用 ρ̂_ext = χ̄ 来估它。本文一个方法论上的独创是：不靠通常的极大似然拟合，而是让模型的 (χ, χ̄) 去匹配前面非参估出来的 (χ̂, χ̄)——把非参诊断和参数建模严丝合缝地缝在一起。

7 数据与主要结果

数据是五大股指的日收益：美国 S&P 500、英国 FTSE 100、德国 DAX 30、法国 CAC 40、日本 Nikkei 225，样本从 1968-12-26 到 2001-11-12，每个序列 8577 个日度观测。由于美国市场收盘最晚、且对其余市场影响最大 [Martens & Poon (2001)]，凡涉及 S&P 500 的配对都用前一天的美国收益。

把全文的发现拧成几句话：

国际股市倾向于渐近独立。 这是最重磅的一击——意味着默认渐近相依的传统多元极值模型，会高估联合极端事件的概率。
左尾相依显著强于右尾。 一起跌，比一起涨，黏得更紧——和既有文献一致。
尾部相依随时间增强，尤以欧洲国家之间为甚。 全球化在末梢留下了指纹。
异方差是尾部相依的主要来源，但不是全部。 用一元和二元波动率滤波器处理后，残差收益的尾部相依明显减弱，且滤波器的具体选择无关紧要。然而——波动率聚集解释不掉全部的「同崩」。剔除了异方差，市场之间仍残留着真实的、结构性的一起跳水的倾向。

第四点尤其要紧：它说明「一起崩」既不是纯粹的统计假象（异方差），也不是无法分解的玄学，而是一个可以被部分归因、又留有真实硬核的现象。

8 文献脉络

这条研究线，是统计学的极值理论与金融学的危机关切两股水流的交汇。

源头在纯统计：Sibuya (1960) 早就证明了二元正态在 ρ ≠ 1 时是渐近独立的——这个反直觉的事实，正是后来一切「相关系数会骗人」论述的种子。Hill (1975) 给了胖尾尾指数的经典估计量。真正的转折是 Ledford & Tawn (1996) 提出 χ̄，第一次让人能在「渐近独立」的内部度量相依强度；Coles, Heffernan & Tawn (1999) 把这对测度 (χ, χ̄) 系统化，Bortot, Coles & Tawn (2000) 补上了高斯联合尾模型。

金融这一侧，Longin & Solnik (2001) 是绕不开的坐标：他们率先把多元极值方法用于国际股市的极端相关——但默认了渐近相依。本文正是站在 Longin & Solnik 的肩上、又对它最关键的那个假设提出反诘：你怎么知道它们是渐近相依、而不是渐近独立？把这个问题量化、检验、再翻案，就是 Poon, Rockinger & Tawn (2004) 的位置。

这条「极端处才显形的相依」的线索，在后来的资产定价里开枝散叶。今天我们谈论的「一起崩」是否被定价、是不是一个独立的风险因子，可参见《因子动物园之外，那种没人定价的「一起崩」》；而「涨时各走各的、跌时一起跳水」这种不对称，也有人专门用无关模型的尺子去量，见《涨时各走各的，跌时一起跳水：给「不对称」一把无关模型的尺子》。把下行的相依直接写进定价的，则可参见《跌的时候才显形：被 CAPM 漏掉的那半个 beta》。

9 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：χ̄ 和 χ 到底有什么不同，为什么非要两个？

一句话：χ 只在「会一起崩」（渐近相依）的世界里有分辨力，一旦进入「渐近独立」的世界它就恒为 0，彻底失明。χ̄ 专门在 χ = 0 的区域里继续度量相依的强弱与正负。所以必须先用 χ̄ 判定属于哪个世界（检验 χ̄ 是否 = 1），再决定用哪把尺子量强度。

Q：渐近独立不就是「独立」吗？听起来像在玩文字游戏。

不是。渐近独立的两个市场，平时可以高度正相关（二元正态 ρ 可以很大），它们只是在最末梢的极限处才彼此松开。直觉上：它们会一起经历中等程度的大跌，但「双双触底」这种最惨的事，渐近独立下概率趋于零，渐近相依下则趋于一个正数。区别全在尾巴的尽头。

Q：用相关系数 0.267 / 0.695 判断风险，错在哪？

错在它把全分布的信息压成一个数，且默认线性高斯。它读不出美日其实渐近独立、德法渐近相依这个对风险管理最致命的区别。结果是：一个相关系数更低的组合（美日），系统性崩盘风险反而更小，而相关系数本身完全无法揭示这一点。

Q：异方差既然是尾部相依的主要来源，那是不是 GARCH 滤一下就没事了？

不行。作者明确说，波动率滤波后尾部相依显著减弱，但解释不掉全部的同崩。残差里仍有真实的结构性尾部相依。换言之，「市场一起崩」不只是波动率聚集的副产品，存在不可约的硬核。

Q：i.i.d. 假设被时间相依破坏了，结论还可信吗？

这是最实在的担忧。时间相依会让标准误被低估（点估计仍近似无偏）。作者在实证中专门评估了这一偏误，但 Hill 类估计量在慢变函数非常数时的偏误「在实务中没有简便的克服办法」，所以他们对结论持谨慎态度——这也是读者应保留的态度。

Q：那逻辑斯蒂模型是不是就该被淘汰？

不能一概而论，但要小心它的先天约束：它的 χ̄ 恒等于 1，结构上排除了渐近独立。如果你的数据其实渐近独立，用它会强行高估联合尾概率。作者的建议是先做非参诊断 (χ̂, χ̄)，再据此在逻辑斯蒂与高斯之间择一，而不是无脑套用渐近相依模型。

(b) 几个可能的研究问题与提案

1. 公司债的「同时违约」是渐近相依还是渐近独立？

【经济故事】信用组合的尾部风险核心就是「会不会一起违约」。CDO 定价里盛行的高斯 copula（Li (2000)）本质上是渐近独立的设定（χ = 0），而现实中危机里的违约扎堆，可能更接近渐近相依。用 χ/χ̄ 去诊断信用利差或 CDS 的联合尾，可能直接改写组合信用风险的定价。【可行性】中。TRACE 公司债成交、CDS 报价、违约事件数据可得；难点在违约是稀疏事件，极值样本太少，可能要退而用信用利差的联合尾做代理。

2. 公司债流动性的「同时枯竭」有没有渐近相依？

【经济故事】2008 和 2020 年的教训是流动性会突然、且跨券种地一起蒸发。把单券的流动性度量（如价差、Amihud）变换到 Fréchet 边际，估它们的 χ/χ̄，能判断「流动性同崩」究竟是统计假象还是结构事实。【可行性】高。日度公司债流动性指标构造成熟（关于危机里的流动性，可参见《差点死掉的那个市场：一场公司债流动性危机的微观解剖》），样本充足，方法可直接移植。

3. 外资持有人是放大还是稀释了跨国尾部相依？

【经济故事】本文发现欧洲国家间尾部相依随时间增强，一个自然的机制猜想是共同的外资持有人在危机里同步抛售。把「可投资度」或外资持股比例与配对市场的 χ̄ 放进面板回归，看外资敞口是否预测更强的尾部相依。【可行性】中。需跨国持股数据（如 FactSet/EPFR），识别上要处理内生性——可借「指数纳入」之类的准自然实验做工具。

4. 把 χ/χ̄ 做成时变的「系统性尾部风险」指标。

【经济故事】本文是全样本静态估计，但尾部相依显然随危机起伏。用滚动窗口或状态切换框架估时变 χ̄，可构造一个比 VIX 更聚焦「共崩」的系统性风险温度计，检验它能否预测危机。【可行性】中。滚动窗口下极值样本进一步稀疏，估计噪声大；需在窗口长度与时变分辨率之间权衡。

5. 尾部相依是否被定价为一个风险因子？

【经济故事】Harvey & Siddique (2000) 证明系统性 coskewness 被定价。若尾部事件本身是系统性的，那资产收益与市场因子之间的 χ（尾部相依）也应当索取风险溢价。本文的测度恰好能把正、负、无符号的系统性尾部相依分开检验定价。【可行性】高。个股对市场组合的 χ̂ 可估，纳入横截面定价检验即可，数据与方法都现成。

参考文献

Bortot, P., S. G. Coles, and J. A. Tawn (2000). The Multivariate Gaussian Tail Model: An Application to Oceanographic Data. Applied Statistics 49, 31–49.
Coles, S. G., J. Heffernan, and J. A. Tawn (1999). Dependence Measures for Extreme Value Analyses. Extremes 3, 5–38.
Danielsson, J., and C. G. de Vries (1997). Tail Index and Quantile Estimation with Very High Frequency Data. Journal of Empirical Finance 4, 241–257.
Harvey, C. R., and A. Siddique (2000). Conditional Skewness in Asset Pricing Tests. Journal of Finance 55, 1263–1295.
Hill, B. M. (1975). A Simple General Approach to Inference About the Tail of a Distribution. Annals of Statistics 3, 1163–1173.
Ledford, A., and J. A. Tawn (1996). Statistics for Near Independence in Multivariate Extreme Values. Biometrika 83, 169–187.
Li, D. (2000). On Default Correlation: A Copula Function Approach. Journal of Fixed Income 9, 43–55.
Longin, F. M., and B. Solnik (2001). Extreme Correlation of International Equity Markets. Journal of Finance 56, 649–676.
Loretan, M., and P. C. B. Phillips (1994). Testing the Covariance Stationarity of Heavy-Tailed Time Series. Journal of Empirical Finance 1, 211–248.
Martens, M., and S. Poon (2001). Returns Synchronization and Daily Correlation Dynamics Between International Stock Markets. Journal of Banking and Finance 25, 1805–1827.
Poon, S.-H., M. Rockinger, and J. Tawn (2004). Extreme Value Dependence in Financial Markets: Diagnostics, Models, and Financial Implications. Review of Financial Studies 17(2), 581–610.
Sibuya, M. (1960). Bivariate Extreme Statistics. Annals of the Institute of Statistical Mathematics 11, 195–210.

我的判断。 这篇文章的贡献是方法论上的、却有锋利的实证含义：它把「市场会不会一起崩」从一个模糊的相关性问题，重铸成一个可检验的「渐近相依 vs. 渐近独立」二选一，并提供了 χ、χ̄ 这对干净的诊断工具，外加一个把非参诊断与参数模型缝合的估计流程。最有冲击力的一句话是——传统模型在系统性高估联合崩盘概率，这对 VaR、压力测试和信用组合都是直接的警示。

对识别的担忧主要有两点。其一是 i.i.d. 假设：收益的时间相依让标准误被低估，作者虽做了评估，但 Hill 类估计量在慢变函数非常数时的偏误难以根除，所以「渐近独立」的判定本身带着不可忽视的估计不确定性。其二是阈值选择：χ/χ̄ 的极限是「s → ∞」，但样本里能用的极端点永远有限，结论对阈值的稳健性值得更多审视。

后续最想看到的，是把这套静态、全样本的诊断时变化，并推广到公司债违约、流动性枯竭这些真正稀疏的尾部事件上——那里「会不会一起崩」不是学术趣味，而是定价与监管的生死线。