向上的收益率曲线,到底在预言通胀,还是在预言利率?

[1991 JFE] A Multicountry Comparison of Term-structure Forecasts at Long Horizons
Note

本文读的是 Jorion & Mishkin (1991, Journal of Financial Economics):把「收益率曲线斜率能预测什么」这件事,从美国一国搬到了英国、西德、瑞士四国一起检验。结论分成对照鲜明的两半——期限结构对未来通胀变化有很强的预测力(尤其在长期限),但对未来一年期利率变化的预测力要弱得多,只有最长的五年期才显著。而且作者坚持用蒙特卡洛模拟的小样本临界值做推断,因为用渐近分布会把显著性「夸大」到离谱的地步。

1 一个让央行心动、又让央行不安的问题

先从一个几乎人人都听过的说法讲起:当一国的收益率曲线(yield curve)向上倾斜——长期利率高于短期利率——人们往往把它读成「市场预期未来通胀会更高」。如果这个读法是对的,那它的政策含义就大得惊人:央行只要盯着收益率曲线的斜率,就能从市场价格里「读」出未来的通胀路径,并据此调整货币政策。

这是个诱人的故事。可它也让人不安。因为「斜率预言通胀」这件事,几乎所有证据都来自美国(关于远期利率到底在预言什么,可参见《利率走过的那道长弧:远期利率预言的,究竟是什么?》)。Fama (1984)、Fama and Bliss (1987) 发现远期—即期利差能预测即期利率的变化,长期限尤其强;Fama (1990) 和 Mishkin (1990a, 1990b) 则报告,期限结构的斜率与未来通胀的变化相关。

但这些研究有一个共同的软肋:它们几乎都用一段三十年左右的美国月度数据。问题是,长期限预测天然要用「重叠样本」(overlapping forecasts)——你拿这个月起算的五年通胀,和下个月起算的五年通胀,重叠了四年十一个月。重叠让相邻观测高度相关,于是「有效样本」远比名义样本小,结果的稳定性很难评估。换句话说,我们其实不太确定,美国那条漂亮的「斜率—通胀」关系,到底是一条经济规律,还是一段特定历史时期的巧合。

接着,一个自然的问题就是:怎么检验它的稳健性? 作者给出的答案干净利落——换一批国家。

2 为什么偏偏是英、德、瑞?

这正是本文识别思路里最聪明的一笔。检验「美国结论是不是普适」,最有说服力的办法不是再多挖几年美国数据,而是去看那些通胀过程截然不同的国家。

英国是高通胀、且高波动的代表(样本期年均通胀约 10%);西德和瑞士则是低通胀的典范(约 3.5%);美国居中(约 6%)。如果「斜率预言通胀」真是一条规律,它就该在这三种迥异的通胀环境里都站得住脚。反过来,若它只在美国成立,那多半是数据挖出来的幻觉。

为此,作者亲手构造了一套此前并不存在的数据集:英、德、瑞三国一到五年期的利率。美国即期利率取自 Shiller and McCulloch (1987) 的样条拟合并更新到 1989 年 6 月;英国金边债(gilt)用同样的方法对《金融时报》报价拟合贴现函数;西德联邦债(bund)的即期利率由 Bundesbank 的固定期限收益率反推;瑞士因为政府债市场太小(1989 年末存量仅约 70 亿美元,而同期美国国债市场约 1.53 万亿美元),只能用欧洲瑞郎(Euro Swiss franc)利率代替。样本是 1973 年 8 月到 1989 年 6 月的月度数据——起点选在浮动汇率开始之后,也是四国数据齐备的第一个时点。

Table 1

Table 1

3 两条回归,和它们各自要回答的问题

然后,要把「期限结构含有什么信息」翻译成可估计的东西。作者沿用 Mishkin (1990a, 1990b, 1991) 的设定,跑的核心是通胀变化回归(inflation-change regression):

$$\pi^m_t - \pi^1_t = \alpha_m + \beta^m\,(i^m_t - i^1_t) + \varepsilon^m_t$$

左边是从 \(t\) 到 \(t+m\) 的年化 \(m\) 年期通胀率,减去一年期通胀率;右边的解释变量 \(i^m_t - i^1_t\) 是期限结构的斜率,即 \(m\) 年期利率与一年期利率之差。全文所有利率、通胀率都用连续复利、年化表示。

真正关键的一步,是看懂斜率系数 \(\beta^m\) 的两重含义——这也是这篇论文最容易被读者跳过、却最值得细品的地方:

记住这把「双刻度尺」,下一节的结果才有味道。

作为对照,作者还跑了 Fama (1983)、Fama and Bliss (1987) 那条以即期利率变化为对象的回归:

$$i^1_{t+m-1} - i^1_t = \alpha_m + \delta^m\,(f^m_t - i^1_t) + \varepsilon^m_t$$

其中 \(f^m_t\) 是由 \(m-1\) 期和 \(m\) 期即期利率推出的一年期远期利率。\(\delta^m\) 显著不为 0,意味着期限结构含有未来即期利率变化的信息;\(\delta^m\) 显著不为 1,则是对期限结构预期假说(expectations hypothesis)的拒绝。

更妙的是,这两条回归并非各说各话。因为 \(t+m-1\) 时观测到的一年期即期利率,可以拆成一个「事后」一年期通胀分量加一个「事后」一年期实际利率分量。于是 Fama (1990) 式的分解把即期回归切成两半:

$$\pi^1_{t+m} - \pi^1_t = \gamma'_m + \delta'^m(f^m_t - i^1_t) + \varepsilon'^m_t$$

$$rr^1_{t+m} - rr^1_t = \gamma''_m + \delta''^m(f^m_t - i^1_t) + \varepsilon''^m_t$$

两式相加正好还原即期回归,所以 \(\delta'^m + \delta''^m = \delta^m\)。这就把「斜率预言的到底是通胀还是实际利率」摆到了同一张账本上。

4 一个绕不开的坑:渐近分布在「撒谎」

但在看结果之前,必须先解决一个棘手的计量问题——否则所有 \(t\) 值都是假的。

重叠预测会让误差项带上很强的序列相关。具体说,\(m=5\) 年时,即期回归的重叠会诱导出一个 \(\text{MA}(12(m-1)-1)=\text{MA}(47)\) 过程;而通胀回归的误差因为是一年后才实现的,服从 \(\text{MA}(12m-1)\),即 \(m=5\) 时是 \(\text{MA}(59)\)。普通 OLS 标准误在这里完全失效。作者先用 Cumby and Huizinga (1989) 的统计量检验「重叠之外是否还有额外序列相关」,结论是没有;随后用 Hansen and Hodrick (1980) 的方法、叠加 White (1980)/Hansen (1982) 的条件异方差修正与 Newey and West (1987) 的正定化处理,得到修正后的标准误。

于是反转出现了。Mishkin (1990b) 早就指出:这些修正后的标准误虽然渐近有效,在小样本里却会严重误导,尤其是「用十五年数据去估五年预测」这种情形。作者的蒙特卡洛(Monte Carlo)模拟把这个偏差量化得触目惊心——

Warning

若沿用渐近分布的 5% 临界值,在原假设成立时,检验会远远过度拒绝:\(m=2\) 年时大约 20% 的时间错误拒绝,\(m=5\) 年时常常高达 50%。模拟得到的真实 5% 临界值,\(m=2\) 时约为 3.5,\(m=5\) 时约为 5.0——远高于教科书里那个 1.96

所以本文里每一个检验统计量的临界值和 \(p\) 值,都来自蒙特卡洛模拟的有限样本分布,而不是渐近分布。这是一个常被忽视、却足以推翻别人结论的细节(关于「长期回归会凭空看见根本不存在的东西」,可参见《回归用得越「长」,越容易看见根本不存在的东西》)。

5 主结果:四国都点头,而且越长越准

铺垫到这里,结果反而变得简单了。

先看美国。\(\beta^m\) 从 \(m=2\) 到 \(m=5\) 分别是 0.9481.2201.3721.491,其中 \(m=2\) 和 \(m=3\) 在 5% 水平显著,\(m=4\) 也几乎显著(\(p\) 值 0.08)。更有说服力的是 \(R^2\) 随期限单调上升——从 26% 一路涨到 53%。而且没有任何一个 \(\beta^m\) 显著不等于 1。

回到第 3 节那把双刻度尺:\(\beta^m\) 显著不为 0、却不显著异于 1,意味着——长期限的名义期限结构含有未来通胀的信息,却几乎不含关于实际期限结构的信息(实际利率期限结构的斜率近似是常数)。这就是全文要反复讲透的那一个核心。

Table 3

Table 3

接着看其余三国,故事惊人地一致:

四国的 \(\beta^m\) 都无法被拒绝等于 1。把它们放在一起,作者还做了一个跨国相等性的卡方检验,发现没有一个统计量显著——也就是说,无法拒绝「四国期限结构所含的信息是相似的」这一假设。一条本来只在美国被观察到的关系,在通胀环境天差地别的四个国家里都站住了。

图 1 把这件事画得很直观:纵轴尺度对四国统一,于是英国通胀的剧烈波动和德国通胀的稳定一目了然;美国的期限结构拟合得相当好。

Figure I: Z-to-l-year inflation change and term spread. Time series of the annualized two-year

Figure I: Z-to-l-year inflation change and term spread. Time series of the annualized two-year

6 被忽略的另一半:利率变化预测得并不好

到这里,如果只讲「斜率预言通胀」,那这篇论文就成了一篇皆大欢喜的稳健性报告。但它真正有分量的地方,恰恰在于它老老实实地报告了对照的、不那么漂亮的一半

当把预测对象换成未来一年期即期利率的变化(第二条回归),期限结构的预测力就明显减弱了。如摘要所言:只有在最长的五年期,利率变化才有显著的可预测性。换句话说——

把同一条收益率曲线斜率拆开看:它对通胀变化是个好的预报员,对名义利率变化却乏善可陈。结合分解式 \(\delta'^m + \delta''^m = \delta^m\),这等于在说,斜率所携带的那点关于未来名义利率的信息,主要来自通胀那一支,而非实际利率那一支。

这一长一短的对照,还能从另一个维度看清楚。把本文的长期限结果与 Mishkin (1991) 的短期限(12 个月及以内)结果对照:

短期限(≤12 个月) 长期限(2–5 年,本文)
\(\beta^m\) 是否显著异于 0 否(系数小、不显著) 是(长期限显著)
\(\beta^m\) 是否显著小于 1
含未来通胀的信息
含实际期限结构的信息 几乎没有
\(R^2\) 远低于 0.10 随 \(m\) 上升至 0.5 左右

短期限和长期限,竟是两种几乎相反的图景。这也正解释了为什么 Table 3 里 \(R^2\) 会随 \(m\) 一路递增——期限越长,名义期限结构里「关于通胀」的信号越纯。

7 文献脉络

把这条线索捋一捋。早期的源头是 Fama (1984) 关于期限结构信息含量的研究,随后 Fama and Bliss (1987) 证明长期限远期利率含有即期利率变化的信息,Fama (1990) 进一步把利率、通胀、实际收益的预测统一到期限结构上。与此并行,Mishkin (1990a, 1990b, 1991) 把焦点从「利率」转向「通胀」,系统地问「期限结构究竟告诉了我们多少关于未来通胀的事」。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

本文 Jorion and Mishkin (1991) 处在这条线索的两个交汇点上:一是把 Mishkin 的通胀回归从美国扩展到多国,用通胀过程的跨国异质性做了一次硬核的稳健性检验;二是在方法上把 Hansen and Hodrick (1980)、White (1980)、Hansen (1982)、Newey and West (1987) 的标准误修正,连同 Cumby and Huizinga (1989) 的序列相关检验,统统嵌进一个蒙特卡洛小样本推断框架里——而这恰恰是同期许多长期限回归研究最薄弱的一环(关于通胀如何写进整条利率曲线,可参见《通胀这道暗税,如何写歪了整条利率曲线》;关于收益率曲线「反常」与最短端,可参见《利率曲线的「反常」,其实藏在最短的那两年里》)。

8 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:\(\beta^m\) 显著不为 0、却不显著异于 1,这两件事放在一起到底意味着什么?

意味着在长期限上,名义期限结构的斜率主要在反映未来通胀的变化,而实际利率期限结构的斜率近似是常数。直觉是:你看到的那段「向上倾斜」,长端几乎全是通胀预期在动,实际期限结构没怎么变。这正好和短期限相反——短期限上 \(\beta^m\) 显著小于 1,说明那里名义曲线主要在讲实际利率的故事。

Q:把瑞士的政府债换成欧洲瑞郎利率,会不会污染结论?

这是个真实的隐忧,因为瑞士国债市场太小(存量仅约 70 亿美元)。作者的缓冲是:他们对美元和德国马克同时有政府债和欧洲市场两套利率,验证了换用欧洲市场利率不改变结论。这算是一个间接但合理的稳健性背书,但严格说,瑞士这一国的结果仍要打个折扣。

Q:为什么唯独英国「系数对了、显著性没了」?

不是关系不在,而是检验功效太低。英国通胀本身波动极大(部分还来自增值税开征、房贷利息计入零售物价指数等口径扭曲),加上长期限预测的数据重叠更严重,估计的标准误被推得很高。佐证是:英国长期限回归的 \(R^2\) 反而高于其短期限结果,且随期限上升。所以更可能是「测不准」,而非「没有」。

Q:用蒙特卡洛临界值,是不是把门槛抬得太高、反而埋没了真信号?

恰恰相反,这是在纠偏。模拟显示渐近分布会让原假设下的拒绝率高达 20%50%,也就是大量「显著」其实是假阳性。把临界值从 1.96 提到 3.55.0,是在还原真实的第一类错误率。能在这么严的尺子下依然显著,结论才更可信。

Q:「斜率预言通胀」能直接拿来当货币政策的指针吗?

作者自己留了余地。一旦央行真的开始依据斜率行事,货币政策的转变本身就可能改变「期限结构—通胀」的长期关系——这是典型的卢卡斯批判式担忧。所以这篇论文说的是「斜率含有通胀信息」,而非「央行照着斜率操作就万无一失」。

Q:这篇论文跟「期限结构预期假说」是什么关系?

它没有直接、全面地检验预期假说。即期利率回归里 \(\delta^m\) 显著不为 1 才对应拒绝预期假说,但作者明确指出,在通胀回归里检验 \(\beta^m=1\) 另有独立的经济含义(实际期限结构斜率是否为常数),不要把两者混为一谈。

(b) 几个可能的研究问题与提案

1. 把检验搬到「外资持有结构」剧变的国家

【经济故事】若一国国债的边际定价者从本国机构变成外资,期限结构里嵌入的通胀预期、风险溢价都可能被重写,「斜率—通胀」关系或随之松动。【可行性】中。需要分国别的国债期限结构数据加外资持有比例(如各国央行/IMF 的持有人结构),用持有结构的外生变动做识别;难点在于持有结构变化往往与宏观环境同步,内生性不易剥离。

2. 公司债期限结构里有没有同样的「通胀信号」?

【经济故事】本文做的是无(低)违约的政府债。公司债斜率同时混入信用利差与流动性溢价,那么它对未来通胀的预测力是被增强还是被稀释?这能把宏观与信用市场连起来。【可行性】中。美国有较长的公司债收益率曲线数据,但需要先把信用与流动性成分剥离(可借助同评级 CDS 或匹配国债),识别上要小心共同的宏观驱动。

3. 央行真的开始盯斜率之后,关系是否漂移?

【经济故事】直接回应作者自己的卢卡斯批判式担忧:在通胀目标制(inflation targeting)前后,「斜率—通胀」回归的系数是否发生结构性变化?【可行性】高。各国采纳通胀目标制的时点是清晰的、近乎外生的政策事件,可用断点或事件式设计比较前后 \(\beta^m\) 与 \(R^2\),数据也相对易得。

4. 用现代小样本/自助法重估这套老回归

【经济故事】本文的蒙特卡洛在 1991 年是前沿。如今有更长样本与更稳健的(block/wild)自助法,重估四国乃至更多国家,能检验这套结论是否经得起方法升级。【可行性】高。纯方法+数据扩展,doable;主要价值在于把「渐近会过度拒绝」这件事在更广样本上系统钉死。

9 我的判断

这篇论文的贡献有两层,且都很扎实。第一层是识别上的:用通胀过程极度异质的四国,给「美国式」结论做了一次真正意义上的样本外检验,并且把那个常被一句话带过的「斜率预言通胀」拆成了对照鲜明的两半——通胀变化可预测、且越长越准,利率变化却只在最长端勉强显著。第二层是方法上的:它没有满足于渐近标准误,而是用蒙特卡洛把小样本的过度拒绝量化出来,这种诚实,在长期限重叠回归泛滥的年代里尤其难得。

对识别,我有两点保留。其一是瑞士用欧洲瑞郎利率替代国债,虽有美元/马克的交叉验证,但终究隔了一层。其二是英国的「不显著」被归因于低功效——这个解释合理,却也提醒我们:四国一致的结论里,真正提供独立信息的其实只有美、德、瑞三国,英国更像是「证据不足」而非「证据相反」。

后续我最想看到的,是把这套框架接到持有人结构信用市场上去:当国债的边际定价者变了,或者把对象换成带违约风险的公司债,那条「长期限名义斜率近似只反映通胀、实际期限结构斜率为常数」的优美结论,还成不成立?这恰好是连接宏观利率与信用、外资两条线索的天然接口。

参考文献