因子动物园之外,那种没人定价的「一起崩」

[2022 JFE] Multivariate Crash Risk
Note

本文读的是 Chabi-Yo, Huggenberger & Weigert (2022, JFE):作者把「崩盘风险」从「只跟市场一起崩」扩展到「跟任意一个系统性因子一起崩」,提出一个叫 MCRASH 的新度量。结果是——高 MCRASH 的股票,未来一年比低 MCRASH 的股票多赚约 4.68%(风险调整后 5.28%,t≈4.79);而这件事,居然不需要往本已拥挤的「因子动物园」里再塞一个新因子。

1 引言:动物园已经够挤了

过去二十年,资产定价的「因子动物园 (factor zoo)」越长越大。每隔一阵,就有人端出一个新变量,号称能解释横截面收益。学界为此头疼已久——到底哪些因子是真的,哪些只是数据挖掘的产物?(关于这场旷日持久的争论,可参见《弱替代:因子动物园是从哪里冒出来的?》《压缩横截面:因子动物园的尽头,不是更少的因子,而是更聪明的收缩》。)

在动物园的一个角落里,住着一类专门研究「下行风险 (downside risk)」与「崩盘风险 (crash risk)」的因子。它们的逻辑很朴素:投资者怕的不是波动,而是「一起跌」——当市场崩盘时,你手里的股票也跟着崩,那才最要命。于是有了下行 beta、尾部 beta、下尾相依 (lower tail dependence, LTD)、bear beta 等一系列度量。

但这里藏着一个被所有人默认、却几乎没人质疑的假设:所有这些「崩盘」度量,都只用「市场」这一个因子来定义什么叫「崩」。

这就奇怪了。自 Fama and French (1993) 以来,整个行业都接受一个事实:随机贴现因子 (stochastic discount factor, SDF) 不可能只由市场张成,它还依赖规模、价值、盈利、投资、动量等一堆非市场因子。既然定价的「内核」依赖这么多因子,凭什么我们只担心「跟市场一起崩」,却对「跟价值因子一起崩」「跟动量因子一起崩」视而不见?

这就是本文的张力所在。

2 一个直觉:三只股票,两次崩盘

作者先用一张图把直觉讲透。设想有两个因子 A(市场)和 B(某个非市场因子),各自经历过一次大跌;再设想三只股票:

这三只股票的「单变量崩盘风险」是一样的——各自都经历了两次幅度相当的大跌。但如果你只用「跟市场(因子 A)一起崩」来衡量系统性崩盘风险,你会得到一个荒谬的结论:股票 1 和股票 3 风险相同,而股票 2 的系统性崩盘风险为零

可股票 2 明明会在 B 崩时受伤。一个真正在乎多个因子尾部事件的投资者,凭什么对它毫无要求?而股票 3 同时暴露在两次崩盘里,它显然该要求最高的崩盘溢价。

于是一个自然的问题浮出水面:有没有一个度量,能把「跟任意一个系统性因子一起崩」的风险,一次性装进去?

3 识别的核心:MCRASH 是什么

这正是本文的核心建构。先定义「尾部事件」:对任意收益 \(Y\),固定一个小概率 \(p\),把落在 \(p\)-分位数及以下的实现值称为它的崩盘,

$$T_p[Y] := \{\, Y \le Q_p[Y]\,\}$$

把这个定义从单变量推广到 \(N\) 个因子 \(X=(X_1,\dots,X_N)\),作者定义「多变量系统性尾部事件」为——至少有一个因子落入自己的左尾

$$T_p[X] := \bigcup_{j=1}^{N} T_p[X_j] = \bigcup_{j=1}^{N}\{\, X_j \le Q_p[X_j]\,\}$$

注意这个「并集 \(\bigcup\)」是全文的灵魂。它说的不是「所有因子同时崩」,而是「哪怕只崩了一个」。有了它,多变量崩盘风险 (multivariate crash risk, MCRASH) 就是一个条件概率:在「至少一个因子崩」的前提下,这只股票自己也崩的概率,

$$MCRASH_i^X := P\!\left[\, T_p[R_i] \,\big|\, T_p[X]\,\right] = P\!\left(\, R_i \le Q_p[R_i] \,\Big|\, \bigcup_{j=1}^{N}\{X_j \le Q_p[X_j]\}\,\right)$$

几个性质值得停下来体会:

第一,它是下尾相依的自然推广。 当 \(N=1\)、唯一的因子就是市场时,MCRASH 退化成股票与市场之间的下尾相依——也就是 Chabi-Yo et al. (2018) 用的那个 LTD。所以 MCRASH 不是另起炉灶,而是把一个已经被验证有效的双变量度量,沿着「因子维度」拉开。

第二,它只跟「相依结构」有关,跟边际分布无关。 因为用的是分位数阈值,作者证明 MCRASH 完全由随机向量 \((R_i, X_1,\dots,X_N)\) 的 copula(连接函数)决定。这意味着 MCRASH 在构造上就与波动率、偏度、VaR、期望损失这些「单变量」风险指标正交——它捕捉的是别的东西。事后的数据也印证了这一点:MCRASH 与各种因子 beta、公司特征的横截面相关性最高也只有 0.28(出现在市场 beta 上),其余都更低。

第三,它介于 0 和 1 之间,干净利落。 实测中 MCRASH 的取值在 00.17 之间,均值 0.08

4 模型:为什么「凸的 SDF」会给崩盘付钱

但真正关键的一步,是把这个统计度量和「溢价」挂上钩——凭什么高 MCRASH 就该有更高的预期收益?这就要回到 SDF 上。

标准做法是这样的。任何无套利的非负 SDF \(M\) 满足 \(E[M(1+R_i)]=1\)。如果 \(M\) 能被一组因子 \(X\) 张成,我们就用它在因子上的投影 \(M^X=E[M\mid X]=m(X)\) 来定价,得到那个人人熟悉的结果:

$$E\!\left[R_i - R_f\right] = -(1+R_f)\,\mathrm{cov}\!\left[m(X),\, R_i\right]$$

接下来,教科书的套路是把 \(m(X)\) 在均值 \(x_c=E[X]\) 处做一阶泰勒展开,得到一个线性近似:

$$m^L(X) = m(x_c) + \nabla' m(x_c)\cdot (X - x_c)$$

代回去,就长出了我们熟悉的「线性因子 beta」分解。换句话说,所有的线性多因子模型,本质上都是「把真实的 SDF 用一条切线去近似」。

Warning

切线近似有个致命弱点:它只在均值附近准。一旦因子实现值跑到很远的地方——也就是落入左尾 \(T_p[X]\)——这条切线就会偏得离谱。而这恰恰是崩盘发生的地方。

作者的关键动作,就是给这条切线打一个尾部补丁,提出一个分段线性 (piecewise linear) 的近似:

$$ m^{L,e}(X) = \cssId{a1}{m^L(X)} + \cssId{a2}{\mathbf{1}(T_p[X])}\;\cssId{a3}{d_{tail}(X)} $$

直觉是这样的:如果 \(m\) 是因子收益的凸函数 (convex function),那么真实的 SDF 在尾部会高于它的切线(凸函数永远在切线之上)。也就是说,在崩盘状态里,代表性投资者的边际效用,比线性模型以为的还要高。

于是反转出现了:一只在「联合崩盘」时跌得最狠的股票(高 MCRASH),恰恰在 SDF 被「凸性」顶起来的那些状态里给你最差的回报。它和 SDF 正相关,是不折不扣的「坏」资产,理性投资者当然要求补偿。把这层逻辑代进定价方程,就能推出一个标准线性模型的扩展——预期超额收益里,多出一项正比于 MCRASH 的溢价。

Tip

这一节的妙处在于:MCRASH 溢价不是一个新因子,而是对已有因子的一种非线性(尾部)暴露。所以它能改进定价,却不必把动物园再撑大一圈。这正是标题「without further expanding the factor zoo」的含义。

5 数据与估计

理论说完,来看怎么落地。

6 主要结果:高 MCRASH,高未来收益

先看最直观的等权单变量分组。把股票按月末 MCRASH 从低到高分成 10 组,下个月的超额收益单调递增。最高组(第 10 组)减最低组(第 1 组)的收益差,年化达 4.68%,t 值 3.69,在 1% 水平显著。

更有意思的是,当你把这个 10–1 价差对市场以及 SMB、HML、RMW、CMA、UMD、BAB 做风险调整后,它不但没缩水,反而到了年化 5.28%,t 值 4.79。也就是说,剔除掉对这些因子的线性暴露,MCRASH 的效应更干净、更强了——这正是「它捕捉的是非线性尾部暴露」的直接证据。

Table 2

Table 2

多变量检验也讲同一个故事。Fama and MacBeth (1973) 回归里,把 \(t+1\) 月的超额收益对 \(t\) 月的 MCRASH 回归,同时控制各种因子 beta 和公司特征(规模、账面市值比、动量、反转、流动性、当月最大日收益)。在「塞进全部因子 beta」、与理论中那个扩展线性模型相匹配的设定里,MCRASH 的系数估计是 4.37,t 值高达 5.89。跨所有设定,系数落在 2.695.56 之间,t 值在 3.586.70 之间。

考虑到第 10 组与第 1 组之间 MCRASH 的差距约为 0.08,这些系数翻译成年化溢价大约是 2.58%5.34%——和分组法给出的量级彼此印证。

Table 3

Table 3

而且效应有持续性:MCRASH 对收益的影响不止管一个月,对风险调整后的累计收益一直延伸到 \(t+6\) 月仍然显著。

7 它不是已知风险的「马甲」

到这里,一个怀疑论者一定会问:这会不会只是某个已知下行风险因子换了个名字?作者花了大力气回应。

他们把 MCRASH 逐一对下列度量做「赛马」:下行 beta(Ang, Chen, Xing 2006)、尾部 beta(Kelly and Jiang 2014)、特质波动率与特质偏度(Ang et al. 2006)、协偏度与协峰度(Harvey and Siddique 2000)、VaR(Atilgan et al. 2020)、以及 bear beta(Lu and Murray 2019)。无论是多变量回归还是双重分组,MCRASH 的效应都稳健地活了下来。

Table 4

Table 4

反过来才更耐人寻味:当作者把 MCRASH(以及公司特征)放进回归后,那些只盯着市场的双变量崩盘度量——市场、规模、盈利因子的——反而都不显著了。这强烈暗示,「跟市场一起崩」只是「跟某个因子一起崩」的一个特例;一旦你用 MCRASH 把整张因子表都纳进来,单看市场的那套度量就被吸收了。

稳健性上,作者还做了样本期切分(1965–1991 与 1992–2018 分别检验)、改变尾部阈值、换用 49 个行业组合作检验资产、市值加权分组等。一个诚实的边界是:在包含全部股票的市值加权分组里,风险调整后的 10–1 价差降到年化 1.92%,t 值 1.39——不显著。但只要剔除横截面里最大的 1% 股票,显著性就回来了。换句话说,除了那批超级大盘股,MCRASH 在哪儿都成立

最后,作者还把单纯的「并集」崩盘换成「交集」崩盘——定义了一个 JCRASH(多个因子同时崩时股票一起崩的条件概率),用全参数 copula 估计。发现 MKT&SMB、MKT&RMW 这两对因子的联合崩盘,溢价最显著,且在控制 MCRASH 后依然稳健。

8 文献脉络

把这篇论文放回它生长的那条藤蔓上,脉络相当清晰。

源头是 Roy (1952) 与 Markowitz (1959) 的「安全第一」思想——投资者真正怕的是亏损,而非波动。沿着这条线,Ang, Chen and Xing (2006) 证明下行 beta 带正溢价,把「下行风险定价」做实。接着,研究的焦点从「下行」推进到「极端」:Kelly and Jiang (2014) 发现暴露于时变尾部风险因子的股票有更高收益;Chabi-Yo et al. (2018) 则证明股票与市场的下尾相依(LTD)带正溢价,并被 Weigert (2016) 在 40 国样本里证实。与此同时,Longin and Solnik (2001)、Poon et al. (2004) 把极值理论与 copula 引入金融,为「非线性相依」打好了工具基础。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

然后,一个自然的问题是:所有这些尾部度量,为什么只用市场来定义崩盘?van Oordt and Zhou (2016) 发现尾部 beta 能预测崩盘期表现却不带溢价;Lu and Murray (2019) 用 S&P 500 期权里的 bear beta 捕捉市场崩盘概率——但它们仍然是「市场单因子」的世界。本文站的位置,正是把这条「下行/崩盘风险」的主线,第一次系统地从「双变量(与市场)」推到「多变量(与任意因子)」,并给出了相应的 SDF 理论。

评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:MCRASH 和「下尾相依(LTD)」到底差在哪?

差在「维度」。LTD 是股票与单个因子(通常是市场)之间的双变量下尾相依。MCRASH 把条件事件换成「至少一个因子崩」的并集,是 LTD 沿因子维度的推广;当只留市场这一个因子时,MCRASH 精确退化回 LTD。

Q:用「并集(至少一个崩)」而不是「交集(同时崩)」,会不会把概念稀释了?

这是有意的设计。「同时崩」(即 JCRASH)发生得太罕见,估计噪声大、可用样本少,作者只敢在因子对上估它。而「至少一个崩」既覆盖了单因子崩、也覆盖了联合崩,是个更稳、更一般的定义。作者把 JCRASH 单列在第 5 节作为补充,正说明二者是互补而非替代。

Q:风险调整之后价差不降反升,是不是哪里出了问题?

恰恰相反,这是核心证据。MCRASH 度量的是对因子的非线性尾部暴露,与因子的线性暴露(beta)正交。剔除线性暴露,等于把混在里面的「线性噪声」洗掉,留下更纯的非线性信号——所以价差变大,逻辑自洽。

Q:市值加权全样本里 t 值只有 1.39,是不是说这溢价主要是小盘股的故事?

一半对一半。作者坦承全样本市值加权下不显著,但只要剔除最大的 1% 股票,显著性立刻恢复。结论应是「除超级大盘股外普遍成立」,而非「只是微盘垃圾股」——毕竟剔的只是 1%。

Q:MCRASH 会不会只是 MAX(彩票偏好)或特质偏度的另一种写法?

不会。MAX、特质偏度都是单变量特征,而 MCRASH 由 copula 决定、在构造上独立于边际分布。回归里同时控制了当月最大日收益和特质偏度,MCRASH 依然显著。

Q:凭什么相信 SDF 是「凸」的?

这是把溢价符号钉死的关键假设,也确实是一个需要的条件,而非凭空成立。它对应代表性投资者效用函数的三阶导数为正(即审慎/prudence),与 Harvey and Siddique (2000) 在单因子下用凸 SDF 解释协偏度溢价同源。作者也指出,配合额外的尾部相关近似项,凸性约束可以适当放松。

(b) 几个可能的研究问题与提案

1. 把 MCRASH 搬进公司债横截面。

【经济故事】公司债的尾部风险天然是多维的——违约因子(DEF)、期限因子(TERM)、流动性因子可能各自崩、也可能一起崩。一只债券对「任意一个崩」的暴露,理应索取信用尾部溢价。【可行性】中。数据用 TRACE 日度(或周度)交易价 + 公司债因子;难点是债券交易稀疏,需要先把 MCRASH 的滚动窗口和 GARCH 边际换成适配低频、含零交易日的估计。识别上可沿用本文的 Fama-MacBeth + 双重分组框架,doable。

2. 外资持有人与多变量崩盘暴露。

【经济故事】外资持仓往往在全球性冲击中同步撤离,可能同时点燃多个因子的左尾。若外资重仓的股票/债券有系统性更高的 MCRASH,就为「外资是崩盘风险的搬运工」提供了直接证据。【可行性】中。股票端可用 13F/FactSet 持仓 + 本文 MCRASH;债券端可结合外资持有数据。识别难点在区分「外资导致高 MCRASH」与「外资偏好本就高 MCRASH 的资产」,需借助外生的指数纳入或资本账户事件作工具。

3. MCRASH 溢价里,有多少其实是「流动性一起干涸」?

【经济故事】多因子联合崩盘的时刻,往往也是流动性枯竭的时刻。MCRASH 溢价可能部分是被错贴成「尾部相依」的流动性风险。【可行性】中。把 Amihud (2002) 非流动性、Pástor and Stambaugh (2003) 流动性因子纳入 MCRASH 的因子集合,看市场/规模/盈利因子的 MCRASH 溢价是否被流动性维度吸收。数据现成,识别清晰,doable。

4. JCRASH 与系统性风险监测。

【经济故事】JCRASH(多因子同时崩)天然对应「系统性事件」。把横截面平均 JCRASH 做成时间序列,看它能否提前预警市场层面的崩盘或信用利差跳升。【可行性】中偏低。同时崩事件稀少,时间序列噪声大;需要更长样本或跨国面板(如 Weigert 2016 的 40 国数据)来攒出统计功效。

我的判断

这是一篇「概念干净、执行扎实」的论文。它最漂亮的地方不在哪个具体系数,而在问对了一个所有人都绕过去的问题:既然 SDF 依赖多个因子,崩盘风险就不该只跟市场算账。把双变量下尾相依推广成 copula 决定的多变量度量,再用一个分段线性 SDF 把它和溢价严格挂钩,整条逻辑链既有理论又有实证,且「不扩张动物园」的卖点切中了当下的痛点。

担忧主要有两点。其一是识别更像「定价」而非「因果」:MCRASH 是事后估计的统计量,高 MCRASH 与高收益的关系是横截面相关,作者并未(也很难)提供一个外生冲击来证明投资者「确实在为多变量崩盘要价」,而非两者同被某个遗漏变量驱动。其二是估计的自由度:滚动窗口长度、\(p\) 的取值、GARCH 的设定、参数与非参数的选择,都会影响 MCRASH,虽然作者做了大量稳健性,但「研究者自由度」始终存在。

后续我最想看到的,是把这套「多变量崩盘」逻辑搬到信用市场和外资持有人上——那里的尾部本就是多维的,联合崩盘的代价也更真切。如果 MCRASH 在公司债里同样定价,并且能和外资抛售、流动性枯竭对上号,这个概念的分量会比在股票横截面里重得多。

参考文献