什么在推动国债收益率?——一个「当下按兵不动、三年后才发作」的冲击

[2022 JFE] What Moves Treasury Yields?
Note

本文读的是 Moench & Soofi-Siavash (2022, Journal of Financial Economics):作者用一个结构动态因子模型,识别出一个「收益率新闻冲击 (yield news shock)」——它在当期【完全不动】国债收益率,却能解释收益率未来变化的最大份额。这个冲击当天不动收益率,是因为期限溢价和预期短端利率的反应恰好相互抵消;可几年之后,它却能解释高达 50% 的国债收益率方差。它的另一面,是一次股债波动率的骤升、实体经济的持续走弱,以及美联储的随后宽松。

1 一个被问烂、却没答清的问题

国债收益率为什么会动?

这个问题听上去近乎幼稚——任何一本固定收益教材都会告诉你,收益率曲线的横截面可以被几个因子概括:第一主成分是 水平因子 (level),决定曲线整体的平移;第二主成分是 斜率因子 (slope),决定曲线变陡还是变平。Litterman & Scheinkman (1991) 早就把这件事讲清楚了。于是顺理成章地,「什么在推动收益率」似乎就等于「什么在推动 level 和 slope 的当期创新 (innovation)」。

但作者一上来就给这个看似闭合的答案凿开了一道缝。他们指出:level 和 slope 的【当期】冲击,确实几乎解释了收益率的【短期】波动——可一旦把视野拉长到几年之后,这两个冲击合起来,最多只能解释一半的收益率方差。

Warning

换句话说,把收益率曲线在某一时点拍成一张照片,你看到的全部信息(level + slope),对「三年后收益率会去哪里」只说了一半的故事。另一半,藏在今天的收益率横截面【看不见】的地方。

这就是全篇的张力所在:剩下那一半,是什么在推动?

2 「藏起来」的因子,与一个大胆的转译

接着,一个自然的问题是:这「另一半」是不是早有人察觉?

是的。过去二十年,期限结构文献里一直有一条暗线,反复指向同一个直觉——存在某些因子,它们对未来收益率有强预测力,却【几乎不】与当期收益率相关:

这些证据像是从不同方向射向同一个靶心:存在一类冲击,它在当期【正交于】收益率曲线,却会带着时滞推动收益率。

然后,真正关键的一步出现了。作者说:这种东西,概念上不正是宏观文献里的 新闻冲击 (news shock) 吗?Barsky & Sims (2011) 当年识别「全要素生产率新闻冲击」的办法,就是去找一个【正交于当期 TFP】、却最能解释【未来 TFP】方差的创新。把「TFP」换成「收益率」,把「正交于当期 TFP」换成「不动当期收益率」——同一套逻辑,就能拿来识别一个收益率上的新闻冲击。

Tip

这里有一个漂亮的「转译」:以往文献把这类东西当作一个隐藏的【因子 (hidden / unspanned factor)】来找;本文则把它当作一个【冲击 (shock)】来识别。从因子到冲击,看似只是措辞之差,却让我们可以追踪它在一大批宏观与金融变量上的脉冲响应,从而给它一个经济学解释。

3 识别策略:怎样「框住」一个当下不动的冲击

要把上面的直觉做成计量,作者搭了一个 结构动态因子模型 (structural dynamic factor model, DFM)。我们一步步看。

设 \(X_t\) 是 \(N\times 1\) 的观测变量向量(收益率 + 宏观),由少数几个共同因子驱动:

$$X_t = \Lambda F_t + e_t$$

其中 \(F_t\) 是 \(r\times 1\) 的因子向量,\(\Lambda\) 是载荷矩阵,\(e_t\) 是特异成分。因子自身服从一个向量自回归 (VAR):

$$\Phi(L)F_t = \eta_t,\qquad \Phi(L)=I-\Phi_1 L-\cdots-\Phi_p L^p$$

把两式合并,就得到约化型的移动平均表示 \(X_t=\Lambda\,\Phi(L)^{-1}\eta_t + e_t\)。这里 \(\eta_t\) 是因子 VAR 的【约化型】创新,彼此相关;我们真正想要的是背后那批互相正交的 结构冲击 (structural shocks) \(\nu_t\)。两者之间隔着一个映射

$$\eta_t = H\nu_t$$

只要给 \(H\) 施加恰当的限制,就能把结构冲击「解」出来。

第一步:把 level 和 slope 钉死。 作者把因子排序,让前两个因子正好是 level 和 slope。然后对 \(H\) 施加一组 短期时序限制 (short-run timing restrictions)

$$ \begin{pmatrix}\eta_t^{Level}\\[2pt]\eta_t^{Slope}\\[2pt]\eta_t^{3:r}\end{pmatrix} = \begin{pmatrix}H_{11}&0&0\\[2pt]H_{21}&H_{22}&0\\[2pt]H_{\cdot 1}&H_{\cdot 2}&H_{\cdot\cdot}\end{pmatrix} \begin{pmatrix}\nu_t^{Level}\\[2pt]\nu_t^{Slope}\\[2pt]\nu_t^{3:r}\end{pmatrix} $$

注意右上角那两个 \(0\):它们意味着第三个(及更高阶的)结构冲击,【在当期】对 level 和 slope 没有任何影响。这正是「新闻冲击当天不动收益率」这句话的数学化身。这种递归识别并不新鲜——Diebold, Rudebusch & Aruoba (2006)、Bianchi, Mumtaz & Surico (2009) 等都用过类似的下三角结构来识别收益率因子的冲击。

第二步:让它最大化未来方差。 光是「当下不动」还不够——满足这个条件的冲击有无穷多个。作者要的是其中那个【最能解释未来收益率波动】的。于是把第三个冲击 \(\nu_3\) 指定为如下优化问题的解:

$$ Q_3^{\ast} = \arg\max_{Q_3}\; \cssId{a1}{\sum_{i=1}^{2}}\; \cssId{a2}{\sum_{k=1}^{h}}\; \big(\cssId{a3}{D_{k,i\cdot}\,Q_3}\big)^2 \quad \text{s.t.}\quad \cssId{a4}{Q_3'Q_3=1,\;\; H_{ij}=0} $$

这个目标函数有一个干净的闭式解:\(Q_3\) 就是矩阵 \(\sum_{k=1}^{h} D_{k,1:2}'\,D_{k,1:2}\) 中、对应【最大特征值的特征向量】(在被时序限制约束住的子空间内)。直觉上,它在「当下不动收益率」这条窄路上,挑出了让未来一年 level 与 slope 预测误差方差被解释得最多的那个方向。

这套 最大化预测误差方差 (forecast error variance, FEV) 的识别思路,源自 Uhlig (2003)(论文标题 What moves real GNP?——本文标题显然是在向它致敬),后来被 Barsky & Sims (2011) 用于 TFP 新闻、被 Kurmann & Otrok (2013) 用于收益率斜率新闻。

Note

于是收益率的全部波动被拆成了三块:level 当期冲击、slope 当期冲击,以及这个收益率新闻冲击。三者合起来,几乎解释了收益率的【全部】方差。前两者管短期,新闻冲击管长期。

4 数据

因子个数怎么定?作者用 Bai-Ng (2002) 的 IC2 准则,并辅以「对未来收益率的预测能力」作为补充判据(这一点呼应了 Crump & Gospodinov 关于收益率因子个数易被高估或低估的提醒)。一个值得玩味的对比是:在宏观数据集里,第一个因子的 trace \(R^2\) 只有约 0.15,且高阶因子的贡献衰减很慢;而在收益率数据集里,头一两个因子就吃掉了绝大部分方差——这正是 level/slope 主导收益率横截面的数字注脚。

Table 1: provides the Bai-Ng (2002) IC2 criterion for

Table 1: provides the Bai-Ng (2002) IC2 criterion for

5 主要结果:当下抵消,未来发作

第一个、也是最核心的发现:这个新闻冲击在当期对收益率的净影响为零,不是因为它没作用,而是因为两股力量恰好抵消。

一个正的收益率新闻冲击,会让收益率的两个成分——【预期未来短端利率】与【期限溢价】——朝相反方向运动。在冲击当天,二者大小相当、符号相反,于是收益率纹丝不动。这与「期限结构里存在隐藏因子」的既有文献完全一致:它藏的方式,恰恰是让两个分量在当期对冲掉。

但接下来,两条腿走出了完全不同的步伐:

正因为这种「快消退 vs. 慢发作」的不对称,新闻冲击的解释力随着预测期限的拉长而【越来越大】:在长达三年的预测期上,它解释了高达 50% 的国债收益率方差。一个当天「看不见」的冲击,几年后成了收益率的头号推手。

第二个发现,是给这个抽象冲击赋予了血肉。一个正的收益率新闻冲击,同时伴随着:股票与债券市场【隐含波动率的骤升】、股价下跌、领先经济指标的大幅当期反应,随后是实体经济活动与通胀的【持续走弱】;而美联储则以【持续下调政策利率】来回应——这又反过来压低了预期未来短端利率和收益率,形成闭环。

6 反转:这个「新闻」,到底是谁的新闻?

到这里,故事其实可以收尾了。但作者没有停手,他们追问:既然收益率新闻冲击当天就伴随波动率飙升,那会不会,广义的金融市场波动率,才是推动收益率长期变化的那只手?

为验证这个猜想,他们如法炮制:再识别两个冲击。

其一,是对股市【隐含与已实现波动率】近期方差贡献最大的冲击。结果令人吃惊——这个波动率冲击的脉冲响应,与收益率新闻冲击【高度相似】,且二者高度相关。更精细的一点呼应了 Berger et al. (2020):是【已实现】波动率的冲击、而非对未来波动率的【前瞻性不确定性】冲击,在驱动收益率的持续变化。

其二,是对领先指标未来一年预测误差方差贡献最大的 商业周期新闻冲击 (business cycle news shock)。它同样给出与收益率新闻冲击相似的脉冲响应,对预期短端利率和收益率有持续影响,却只对通胀有温和影响。作者指出,这最接近 Angeletos, Collard & Dellas (2018, 2020) 所说的「信心冲击 (confidence shock)」——关于近期经济前景的消息,几乎不影响长期产出和通胀,却是商业周期的关键驱动。

那么这两个「实在」的冲击,是否就把收益率新闻冲击【完全解释】了?没有。已实现波动率冲击与商业周期新闻冲击虽两两正相关、也都与收益率新闻冲击正相关,但合起来只能解释后者约 四分之三的方差。

剩下那四分之一呢?作者再识别出一个【残差】收益率新闻冲击——正交于 level、slope、已实现波动率和商业周期新闻。这个残差冲击对波动率和实体活动几乎不含信息,却仍能解释经济与统计上都显著的收益率方差份额,而且它与【国际主权债市场】的变动相关。换句话说,全球债券收益率的联动,也在为美国国债收益率的长期变化添柴。(关于国际国债之间「一起涨跌、却未必一起被定价」的暗线,可参见《一起涨跌,不等于一起被定价:国际国债里那条「被付了钱」的暗线》。)

7 文献脉络

把这条线索捋一遍,本文坐落的位置就清楚了。

【源头】是期限结构的因子表示:Litterman & Scheinkman (1991) 的 level / slope / curvature,奠定了「几个因子概括整条曲线」的范式。

【方法的另一支】来自宏观计量:Sargent & Sims (1977) 与 Stock & Watson (2002) 把动态因子模型变成处理大规模宏观数据的主力工具;Uhlig (2003) 提出用最大化预测误差方差来识别结构冲击;Barsky & Sims (2011) 把它发扬为识别「新闻冲击」的标准做法。

【两支汇流之前】,期限结构文献已经反复撞见「藏起来的预测力」:Cochrane & Piazzesi (2005)、Ludvigson & Ng (2009)、Duffee (2011)、Joslin, Priebsch & Singleton (2014) 各自从不同角度证明,未来收益率的信息并不完全写在当期收益率横截面里。

【最近的邻居】是 Kurmann & Otrok (2013):他们识别了收益率【斜率】上的新闻冲击,并发现它与未来 TFP 正相关。本文与之最像,差异也最关键——本文最大化的是 level 和 slope【合起来】的预测误差方差,而 level 才是收益率联动里最重要的维度,因此本文的新闻冲击解释的收益率方差,远大于只盯斜率的版本;此外,DFM 框架让作者能追踪一大批宏观金融变量的脉冲响应,从而把这个冲击解读为「波动率 + 商业周期新闻」,而非「未来生产率新闻」。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

8 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:这个「新闻冲击」和 Kurmann & Otrok (2013) 的斜率新闻冲击到底差在哪?

差在「盯住谁」。Kurmann-Otrok 只最大化斜率因子的未来方差,本文则同时最大化 level 与 slope。由于 level 是收益率联动里份量最重的维度,纳入它之后,新闻冲击能解释的收益率方差大得多(长期约 50%)。本文在稳健性里也复现了一个 à la Kurmann-Otrok 的斜率新闻冲击,并显示它的性质更接近本文「正交掉」的那个 slope 当期冲击。

Q:「当期不动收益率」是靠假设强加的,会不会只是把答案写进了识别?

「当期零影响」确实是施加的时序限制(矩阵 H 右上角的零)。但这并非全部——满足该约束的冲击仍有无穷多,真正的识别力来自「最大化未来一年 FEV」这个目标。所以结论里「未来解释 50%」不是假设的产物,而是数据挑出来的方向。当然,零影响这一恒等式式的约束是否站得住,取决于你是否相信 level/slope 之外的冲击当月真的不动收益率。

Q:50% 这个数字,是不是被收益率的高持续性「虚高」了?

这是合理的担忧。Crump & Gospodinov 就指出,收益率高度持续,会让因子个数被高估;而收益率是远期利率的横截面平均,又可能让因子数被低估。作者的回应是:因子个数用 Bai-Ng IC2 选,并额外用「对未来收益率的预测力」交叉验证。但持续性对长期方差分解的影响,仍是这类研究绕不开的脆弱点。

Q:把期限溢价和预期短端利率拆开,靠的是 ACM 模型——这层「模型依赖」有多重?

不轻。「当期净影响为零 = 期限溢价与预期短端利率反向抵消」这个核心叙事,依赖于 Adrian, Crump & Moench (2013) 的分解。换一个期限结构模型(例如 KW、GSW 的拟合方式),抵消的精确程度和两条腿的相对快慢可能改变。好在「收益率长期被预期短端利率拖低、被美联储宽松确认」这条主线,与无模型的脉冲响应是一致的。

Q:既然波动率冲击和商业周期新闻冲击的脉冲响应几乎一样,它们是不是同一个东西?

高度相关,但不是同一个。二者两两正相关,合起来也只解释收益率新闻冲击约四分之三的方差。剩下那约四分之一来自国际主权债联动等其他来源。作者特意把「已实现波动率」与「前瞻性不确定性」分开,发现是前者在驱动收益率的持续变化——这点呼应 Berger et al. (2020)。

Q:这对「靠收益率曲线预测衰退」的老经验有什么含义?

它给那条经验补了一个机制。曲线之所以能预报衰退,未必只是「市场预期降息」,更可能是:一个伴随波动率骤升、实体走弱的新闻冲击,先压低了预期短端利率,再由美联储的宽松确认。预测力的源头,部分是金融市场波动率和近期商业周期前景,而非未来生产率。

(b) 几个可能的研究问题与提案

1. 把同一套识别搬到公司债与信用利差上。

【经济故事】既然收益率新闻冲击伴随波动率骤升和实体走弱,它对【信用利差】的冲击应当更猛烈(违约与流动性双重承压)。可以问:是否存在一个「信用利差新闻冲击」,当期不动利差、却解释其长期方差的大头? 【可行性】中。数据现成(TRACE、ICE/BAML 利差指数、GZ 超额债券溢价已在本文数据集里),把 DFM 的目标因子从 level/slope 换成信用利差因子即可。识别上沿用 Uhlig (2003) / 本文的 FEV 最大化,难点在因子个数与利差的高持续性。

2. 外资持有人是不是那「残差四分之一」的一部分?

【经济故事】本文把无法被波动率/商业周期解释的残差,归到国际主权债联动上。一个自然的延伸:用外国官方与私人投资者对美债的持有/流动数据(TIC、官方储备),检验残差收益率新闻冲击是否与外资需求的结构性变动同步。 【可行性】中偏低。TIC 月度数据可得,但口径粗、噪声大,且与「冲击」的因果方向难定。或可借高频事件(如大型储备再配置、汇率干预)做辅助识别。

3. 把波动率冲击的「腿」拆给做市商资本约束。

【经济故事】已实现波动率冲击推动收益率长期变化,但波动率本身可能是中介资本受约束的【果】。能否进一步识别一个「中介约束冲击」,看它是否跑在波动率冲击之前? 【可行性】中。需要交易商资产负债表/杠杆代理变量(如一级交易商持仓、回购利差),识别上可借 local projection。与本文的 DFM 框架兼容性好。

4. 同一识别在零利率下限期间还成立吗?

【经济故事】本文样本止于 2019 年 6 月,主体仍是常规货币政策期。在 2009–2015、2020–2021 的零下限期,「美联储下调政策利率确认收益率下行」这条腿被截断,新闻冲击的传导机制可能改变。 【可行性】高。延长样本、引入影子利率 (shadow rate) 或加入 QE 代理变量重估即可,数据与方法都现成。

5. 把波动率「充耳不闻」的问题接到期限结构模型上。

【经济故事】本文显示波动率冲击是收益率长期变化的主力,但很多无套利期限结构模型对波动率的拟合并不好。可以检验:在能解释收益率的模型里,加入对波动率的拟合,会不会反而损害收益率的拟合? 【可行性】高。这正与《收益率拟合得再好,也可能对波动率「充耳不闻」》的关切相通,文献和数据都成熟。

9 我的判断

本文最漂亮的地方,是一次概念上的「转译」:把期限结构里那个二十年来被反复目击、却始终面目模糊的「隐藏 / 未跨期 (hidden / unspanned)」因子,从一个【因子】重新表述成一个【冲击】,再借宏观新闻冲击的成熟工具箱给它做了一次「全身扫描」。结论既统一又有力——三个冲击解释收益率几乎全部方差,其中一个当下隐形的新闻冲击独占长期解释力的半壁江山,且它的经济内核是金融波动率与近期商业周期前景,而非未来生产率。这把 Cochrane-Piazzesi、Duffee、Joslin et al. 的零散线索,收束进了一个可解释的框架里。

对识别,我有两点保留。其一是「当期零影响」的时序限制:它把「新闻冲击当天不动收益率」从一个【可检验的实证发现】降格为一个【恒等式约束】,读者只能选择信或不信,而无法从数据里验证。其二是期限溢价/预期短端利率的拆分对 ACM 模型的依赖——而「当期抵消」这个全篇最优雅的叙事,恰恰建立在这个拆分之上;换一个期限结构模型,抵消的精确程度未必还那么干净。

后续我最想看到的,是把这套识别延伸到信用市场和零利率下限期:前者能检验「收益率新闻冲击」是否在更承压的资产上放大,后者能告诉我们,当美联储那条「确认收益率下行」的腿被截断时,这个冲击还剩多少传导力。

参考文献