三个『股市指标』,竟能预测黄金和大豆的价格

[1992 JFE] Time-varying Risk Premia and Forecastable Returns in Futures Markets
Note

本文读的是 Bessembinder & Chan (1992, Journal of Financial Economics):那些在股票和债券市场里早被证明「能预测收益」的工具变量——短期国债收益率、股息率、垃圾债溢价——拿到农产品、金属、货币这 12 个期货市场里,竟然同样有预测力;而且这种可预测性符合一个两潜变量 (two-latent-variable) 的均衡模型。但当作者追问「期货里的这两个潜变量,和股票里的那两个是不是同一对」时,答案是:

1 一个让人不太舒服的事实

先说一件在 1990 年前后已经不算新鲜、却始终让人不太舒服的事实:股票和债券的超额收益,是可以被预测的。

用什么预测?无非是几个老面孔——股息率 (dividend yield)、短期利率、违约溢价 (default premium)、期限结构。Fama (1991) 在那篇著名的《Efficient Capital Markets: II》里把这一摊文献做了总结,并且说了一句意味深长的话。他承认,收益可预测这件事,要么反映均衡预期收益随时间变化,要么反映价格对价值的非理性偏离,要么两者皆有。但他在结论里点了一句(p. 1610):

如果预期收益的变动,源于对偏好或技术的冲击,那么这种变动应当在不同证券、不同市场之间是共同的 (common across different securities and markets)

这句话其实是一道考题。如果可预测性真的是「风险溢价随经济状态变化」的结果,那它就不该只长在股市这一棵树上——它应该是一种弥散在整个经济里的东西,凡是承担系统性风险的资产,都该被它扫到。

那么,一个最干脆的检验办法是:找一个跟股票八竿子打不着的市场,看看股市里那几个预测变量,到了那边还灵不灵。

期货市场,恰好就是这样一个「八竿子打不着」的地方。黄金、白银、大豆、棉花、英镑、日元——它们的价格凭什么要听「股息率」的话?这就是 Bessembinder 和 Chan 这篇 1992 年论文的起点。

2 期货里到底有没有「风险溢价」

接着,一个自然的问题是:期货价格里,本来就该有可预测的成分吗?

这要回到一个很老的争论。在没有风险溢价、也没有市场无效的世界里,均衡期货价格的变动应当是完全随机的——今天的期货价格已经包含了对到期日现货价的最优预测,剩下的只有噪声。可是经济学家很早就怀疑事情没这么简单。Keynes (1930) 和 Cootner (1960) 提出了「正常贴水 (normal backwardation)」和「升水 (contango)」:套保者为了转移风险,愿意付一笔钱给投机者,于是期货价格会系统性地向上(或向下)漂移。这笔钱,就是风险溢价。

Tip

期货和股票有一个本质区别:进场不需要本金。所以在现代的、基于「所有头寸都可自由分散」的均衡定价模型里(Dusak 1973、Black 1976、Breeden 1980、Richard & Sundaresan 1981 等),期货的定价函数里没有「零 beta」截距项——这是它和普通资产最大的不同。但除此之外,逻辑是一样的:期货收益对经济状态变量的敏感度(beta),乘以每个状态变量的市场化因子溢价 (factor premium),就构成了它的预期收益。

这里有一个关键的研究取舍。预期收益要随时间变,要么是 beta 在变,要么是因子溢价在变。Ferson & Harvey (1991) 发现,在股票里,绝大部分可预测的变动来自因子溢价(风险的价格)在变,而不是 beta 在变;Bessembinder (1992) 自己也发现,期货的 beta 用滚动回归估出来,时间序列上几乎不动。于是本文做了一个干净的设定:假设 beta 恒定,把全部可预测性都归到因子溢价的时间变动上。

在这个框架下,逻辑链就闭合了:如果期货和股票对同一批状态变量敏感,而这些状态变量的因子溢价又有共同的经济决定因素,那么——同一批工具变量,就该既能预测股票,也能预测期货。

3 数据与「收益」的造法

然后,是怎么把这件事变成一个可以回归的数据集。

期货收益的构造看似琐碎,却是这篇论文的细节功夫。作者取 12 个市场,1975 年 1 月到 1989 年 12 月的月度数据:四个金属(黄金、白银、铜、铂)、四个农产品(大豆、小麦、棉花、活牛)、四个货币(英镑、日元、瑞郎、马克)。每个月的「收益」是结算价的百分比变化,用的是月末时离到期最近、但当月没到期的那张合约;定义一笔收益的两个结算价,永远是同一张合约上的相邻观测。直观上,这模拟了一个投资者长期持有最近月合约、在到期前一个月末「滚」到次近合约的真实体验。

Note

这个做法刻意绕开了「现货-期货基差」那一套——后者必须处理存储成本、便利收益这些麻烦事(如 Fama & French 1987 把基差拆成「预期溢价」和「现货价预测变动」两块)。本文直接看价格变化,干净。

三个工具变量,全部滞后一期:(1) CRSP 价值加权指数的股息率(按 Fama & French 1988 的方法去季节性);(2) 三个月期国债收益率;(3) 一个「垃圾债溢价 (junk bond premium)」,定义为 Moody's 的 BAA 级公司债收益率减去 AAA 级的收益率。三个变量,无一例外,都是因为「在股债市场被证明有预测力」而被选进来的。注意它们全部来自股票和债券市场——没有一个是期货市场自己的变量。这正是检验的要害。

4 识别策略:从「记录现象」到「检验模型」

本文的方法分两层,理解这两层的区别,是读懂全文的关键。

第一层,只记录可预测性。 把一个回归方程组写成

$$ R_t = \Pi\, X_{t-1} + \varepsilon_t $$

这里 \(R_t\) 是 \(N\) 个证券的超额收益向量,\(X_{t-1}\) 是 \(J\) 个工具变量的实现值向量,\(\Pi\) 是系数矩阵(典型元素记为 \(\pi_{ij}\))。\(\Pi\) 里有非零元素,就意味着收益可预测。 全部估计用的是 Hansen (1982) 的广义矩估计 (generalized method of moments, GMM)——在无约束时,它给出的系数与普通最小二乘 (OLS) 完全相同,但标准误在条件异方差下依然一致。检验「某市场三个斜率是否联合为零」,就是把相应系数约束为零再做 GMM。

第二层,才真正检验一个模型。 这一步要害得多。作者要问:收益的行为,是否符合一个「因子溢价随时间变、但 beta 恒定」的 \(K\) 因子均衡模型?设 \(\beta_{ik}\) 是证券 \(i\) 对第 \(k\) 个状态变量的 beta,模型预测:

$$ E[r_{it}\mid Z_{t-1}] = \sum_{k=1}^{K} \beta_{ik}\, \lambda_{k,t} $$

其中 \(\lambda_{k,t}\) 是第 \(k\) 个状态变量上 beta 风险的市场价格(也可解读为:一个对第 \(k\) 个状态变量 beta 为 1、对其余状态变量 beta 为 0 的「对冲组合」的预期超额收益),它依赖于 \(t-1\) 时刻的信息集 \(Z_{t-1}\)。

但 \(\lambda_{k,t}\) 是看不见的。于是关键的一步来了:假设信息集可以由那 \(J\) 个工具变量代表,且风险价格的预期对信息集是线性的,那么

$$ \lambda_{k,t} = \sum_{j=1}^{J} \gamma_{kj}\, x_{j,t-1} $$

把它代回去,预期收益就变成了可观测工具变量的函数。这两层一拼,就在系统 (1) 的参数上压出了一组可检验的非线性约束

$$ \pi_{ij} = \sum_{k=1}^{K} \cssId{a1}{\beta_{ik}}\, \cssId{a2}{\gamma_{kj}} $$

这个式子是全文的心脏。它说的是:那个原本「自由」的 \(\Pi\) 矩阵,其实不该自由——它的每一个元素 \(\pi_{ij}\),都必须能被分解成「beta × 风险价格载荷」的形式。如果世界上真的只有 \(K\) 个共同的定价因子,那么 \(N\times J\) 个 \(\pi_{ij}\) 里,只有 \(J\cdot K + (N-K)\cdot K\) 个是自由的,剩下 \((N-K)(J-K)\) 个被锁死了。这些「过度识别 (overidentifying)」约束,就是模型的检验点。

Warning

这里有一个绕不开的「联合假设」问题,Wheatley (1989) 早就强调过:潜变量检验是经济定价模型beta 恒定假设的联合检验。模型被拒绝,可能是因为均衡理论错了,也可能仅仅是因为 beta 其实在动。这一点在解读结论时必须记在心里。

归一化。 既然看不见状态变量,就得归一化:指定前 \(K\) 个证券为「参考证券 (reference securities)」,把 \(\Pi\) 的前 \(K\) 行约束成单位矩阵。当 \(K=1\) 时最直观——令 \(\beta_1=1\),于是其余 \(\beta_i\) 被解读为「相对于证券一的 beta」。GMM 检验统计量用的是 Hansen (1982) 的定理:\(T\) 乘以最小化后的准则函数值,渐近服从自由度为约束个数 \((N-K)(J-K)\) 的 \(\chi^2\) 分布。统计量小,说明未预期收益与工具变量不相关,模型拟合好;统计量大,就是反对潜变量模型的证据。

5 主要结果:三连击

第一击:期货确实可以被预测。 表 2 是全文的主结果。不加任何约束时,对每个市场检验「三个斜率联合为零」,结果在 12 个市场里有 9 个联合显著(p < 0.10),另外三个也只是略高。分组看:商品期货 p < 0.01、货币期货 p = 0.036,证据很强;金属期货稍弱(p = 0.232)。把全部 36 个斜率一起检验「都为零」,被拒绝,p = 0.012

Table 2

Table 2

但同时要诚实:可预测的部分很小。各市场回归 \(R^2\) 只在 0.028 到 0.070 之间。作为对照,同样三个变量对 CRSP 股票超额收益的 \(R^2\) 是 0.105,p 值 0.015。换句话说,预期收益确实在动,但未预期收益的时间变动要大得多

第二击:符号是「共同」的——正中 Fama 的预言。 这才是把「可预测」上升为「均衡」的关键证据。看表 2 里斜率的符号:

每个工具变量在跨市场之间方向高度一致——这正是 Fama (1991) 说的「预期收益的变动应当跨市场共同」。值得玩味的是,垃圾债溢价对股票收益的影响是的,对期货多数是的,符号相反。

第三击:风险溢价高度同步。 图 1 到图 3 画出了三组期货的估计风险溢价(即系统 (1) 的拟合值)。这些溢价在经济上并不小——每月 1%–3% 的绝对值最常见——而且随时间剧烈摆动、会变号(1980 年代初普遍为负)。肉眼就能看出它们跨市场高度相关。

Figure I: Estimated risk premia in currency futures

Figure I: Estimated risk premia in currency futures

正式地,用 Cumby & Huizinga (1991) 的方法算「非中心 (noncentered)」相关系数:期货预期收益两两之间,66 个相关系数里有 36 个在零以上两个标准误,只有 3 个在 1 以下两个标准误之外;平均非中心相关高达 0.655。这是一个高度一体化的图景。

Figure 2: Estimated risk premia in commodity futures

Figure 2: Estimated risk premia in commodity futures

于是反转出现了。 既然期货之间如此同步,而且股市的指标能预测期货,一个诱人的猜想是:期货和股票,背后是同一套定价因子。 作者顺势检验:先看几个潜变量。结果,单潜变量模型被拒绝,但两潜变量模型不被拒绝——这和 Ferson (1990) 在股票里发现「两个潜变量」遥相呼应。

那么最后一问:期货里的这两个潜变量,和解释规模分组股票组合收益的那两个潜变量,是同一对吗?

这个假设被拒绝了。 含义很尖锐:要么股票市场与期货市场在某种程度上是分割 (segmented) 的,要么——更可能——期货承担的,是与股票不同来源的「被定价的风险」。股市的指标能预测期货,不是因为它们共享同一台定价引擎,而更像是这些指标本身携带了某种弥散在整个经济里、连接不同风险源的信息。

6 文献脉络

把这条线捋一捋,会看得更清楚。

最早的源头是 Keynes (1930) 和 Cootner (1960):期货溢价是套保需求的产物。接着是 1970–80 年代的均衡定价模型——Dusak (1973)、Black (1976)、Breeden (1980)、Richard & Sundaresan (1981)——把期货溢价归结为「beta × 因子溢价」,并指出期货没有零 beta 截距。与此并行,股债市场的「可预测性」文献蓬勃生长:Keim & Stambaugh (1986)、Campbell (1987)、Fama & French (1988, 1989) 一步步把股息率、利率、违约溢价确立为预测变量。

真正给本文搭好脚手架的是两篇:Fama (1991) 提出「可预测性若是均衡的,就该跨市场共同」这一可证伪的命题;Ferson (1990) 则把「潜变量模型」用到股票上,发现需要两个潜变量。本文的位置,就在这两者的交汇处——它把可预测性文献的工具,搬到期货这个「外部样本」上做了一次跨市场的压力测试,并用潜变量框架追问「是不是同一批因子」。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

(关于「贴现率/预期收益变动才是资产定价的中心议题」这条大线索,可参见《贴现率:资产定价的中心议题》;关于这些预测变量后来「会不会失灵」的争论,见《风险溢价,是「消失」了,还是「断」掉了?》;而货币期货的可预测性后来又被重新审视,见《货币动量的真身:它不过是因子在「重复自己」》。)

7 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:\(R^2\) 只有 0.03–0.07,这点可预测性,真有意义吗?

有,但要看从哪个角度。从「能不能据此赚大钱」看,未预期收益远大于预期收益,单月 \(R^2\) 低得可怜。但从「检验市场效率/均衡理论」看,重要的不是 \(R^2\) 的大小,而是斜率的符号是否跨 12 个市场系统性一致——后者才是 Fama 命题的检验点,而它确实成立了。低 \(R^2\) 与「显著的、共同的可预测性」并不矛盾。

Q:期货收益和股票收益的同期相关其实很低,怎么还能说「股市指标预测期货」?

这正是本文最微妙处。表 1 显示,已实现期货收益与 CRSP 股票收益的同期相关很低,只有两个金属市场显著。但作者明确指出:已实现收益的低相关,并不排除预期收益的高相关。 可预测性住在「预期收益」里,而预期收益的非中心相关平均高达 0.655。两件事不是一回事。

Q:潜变量模型被拒绝,到底是经济理论错了,还是 beta 在动?

无法区分——这就是 Wheatley (1989) 强调的联合假设问题,作者自己也承认。本文的辩护是间接的:Ferson & Harvey (1991) 和 Bessembinder (1992) 的证据都指向「beta 相对稳定、因子溢价才是变动来源」。但这是一个维持假设 (maintained hypothesis),不是被本文证明的结论。读者有理由保留一份怀疑。

Q:「期货与股票的潜变量不同」,是不是只能说明两个市场分割?

不一定。作者给了两种解读:市场分割,或者期货承担了不同来源的被定价风险。后者其实更耐人寻味——它意味着即便市场是一体的,期货也可能对一些「股票组合里照不到」的状态变量敏感(比如与实物商品、存储、产出相关的冲击)。论文止步于「拒绝同一性」,没有进一步指认那两个因子是什么,这是它留下的空白。

Q:用「股市变量」预测期货,会不会只是数据窥探 (data snooping)?

这是合理的担忧,但本文的设计恰恰削弱了它:三个工具变量不是从期货数据里挑出来的,而是从独立的股债文献里「拿来」的——这是一种样本外检验的精神。再加上跨 12 个市场、跨三个资产组的符号一致性,纯属偶然的概率不高。

Q:为什么垃圾债溢价对股票是正号、对期货多为负号?

论文没有给出机制性的解释,只是报告了这个符号反转。一个可能的方向是:垃圾债溢价是经济状况的代理(坏时期它升高),而期货(尤其商品)与股票在「坏时期」的风险暴露方向可能相反。这是个开放问题,本文没展开。

(b) 几个可能的研究问题与提案

1. 把这套检验搬到公司债 / 信用市场。

【经济故事】本文证明了股市指标能预测期货,且二者潜变量不同。一个自然的延伸:垃圾债溢价本身就是工具变量之一,那么公司债的超额收益,是否也由「与股票不同」的潜变量驱动?信用市场介于股与债之间,正是检验「市场分割 vs. 共同因子」的理想战场。 【可行性】。数据可用(TRACE、Merrill/ICE 指数),潜变量 GMM 框架可直接复用。识别上需注意公司债的流动性溢价污染——可借鉴按交易量调整的流动性度量。

2. 重估「期货的两个潜变量是什么」。

【经济故事】本文止于「拒绝与股票相同」,却没指认期货那两个因子的经济身份。用 30 年后的数据和已发展成熟的商品因子(carry、momentum、basis-momentum)去「命名」这两个潜变量,是一个干净的接力。 【可行性】。数据充足,但潜变量本身不可观测,要把它和可观测因子对齐需要额外假设;存在「因子动物园」式的过拟合风险。

3. 时变 beta 会不会救活单潜变量模型?

【经济故事】本文的硬约束是「beta 恒定」。如果允许 beta 随经济状态平滑变动(如 Ferson & Foerster 1992 的方向),被拒绝的单/双潜变量结论会不会翻案?这直接针对 Wheatley 的联合假设批评。 【可行性】。需要可观测的状态变量来参数化 beta 的动态,否则识别困难;条件矩 GMM 在小样本里的有限样本性质也需谨慎(Ferson & Foerster 1991 已警示)。

4. 外资持有人与商品期货溢价的同步性。

【经济故事】本文发现期货风险溢价跨市场高度同步(平均相关 0.655)。2004 年后的「商品金融化」把大量机构与跨境资金引入期货,一个问题是:这种同步性是否随外资参与度上升而增强?这会把「时变风险溢价」和「投资者基础变化」连起来。 【可行性】。CFTC 的持仓报告 (COT)、跨境资金流数据可用;难点在于把「外资参与」与「风险溢价同步」之间的因果分离出来,需找外生冲击(如指数纳入、监管变动)。

参考文献