把利率曲线的「定价」和「预测」装进同一个模型，为什么这么难？

[2003 RFS] Term Structure Dynamics in Theory and Reality

Jun He June 02, 2026

利率期限结构资产定价无套利模型信用风险

Note

本文读的是 Dai & Singleton (2003, Review of Financial Studies)：一篇关于动态利率期限结构模型的批判性综述。作者把任意一个 DTSM 拆成「三块积木」——风险中性下的状态分布、短率与状态变量的映射、以及因子风险溢价——然后追问一个尖锐的问题：当我们逼着同一个模型既要在横截面上给债券和衍生品定准价，又要在时间序列上复现收益率曲线的历史动态时，理论的「可解性」和现实的「拟合度」会在哪里打架，又靠哪根杠杆和解。

1 引言：一个模型，两份差事

先抛一个看似平常、其实要命的问题。

你手上有一个利率模型。它要干两件事。第一件事是定价：给定今天的状态，算出各个期限的零息债价格、算出 cap、swaption 的价格——这是华尔街交易台「即时定价」(point-in-time) 的刚需。第二件事是描述现实：收益率曲线在过去几十年里怎么变陡、变平、变驼峰，波动率如何聚集又消散，长债收益能不能被曲线斜率预测——这是计量经济学家估参数、做检验时盯着的东西。

麻烦在于，这两件差事，分别活在两个不同的概率测度下。定价活在风险中性测度 (risk-neutral measure, Q) 里，历史动态活在真实测度 (actual measure, P) 里。一个模型要同时把两边都做对，就必须把 P 和 Q 之间那道桥——风险溢价——也一并设定好。而恰恰是这道桥，长期以来被研究者出于「为了能算」的考虑，设得过于死板。

于是张力出现了：你越是追求解析可解性 (analytic tractability)，就越是把模型的函数形式锁死；而锁得越死，它能生成的收益率分布就越贫瘠，越对不上现实里那几个顽固的经验事实。这篇综述，从头到尾就是在讲这一个故事。

（顺带一提，把利率曲线拆解、并追问「风险价格」该怎么放，是这一脉文献反复纠缠的母题，可参见《把利率曲线拆成三个人：稳态、习惯、与期待》。）

2 三块积木

作者的第一个贡献，是给「什么叫一个 DTSM」立了一套干净的语言。任何一个动态期限结构模型，都由三块积木拼成：

$I_{M(P)}$：状态向量 $Y$ 在某个由计价物 $P$ 诱导的定价测度 $M(P)$ 下的时间序列过程；
$I_P$：状态向量 $Y$ 在真实测度 $P$ 下的时间序列过程；
$I_r$：短期利率 $r(t)$ 对状态 $Y$ 的函数依赖。

逻辑分工很清楚：$I_{M(P)}$ 和 $I_r$ 负责定价，$I_P$ 和 $I_r$ 负责构造债券回报在 $P$ 下的矩、从而估参数。三块缺一不可。

这里有一句话值得划重点：「无套利」这个要求，对这三块积木的选择只施加了很弱的约束。 真正把模型逼成今天这副样子的，不是无套利，而是「要能算」——既要零息债价格有封闭解或近似封闭解，又要似然函数能最大化。是计算的便利、而非经济学的真理，塑造了我们手里的模型。这是全文的灵魂判断。

3 定价的骨架：从定价核到无套利方程

接着，一个自然的问题是：给定这三块积木，价格到底怎么算出来？

作者用定价核 (pricing kernel) $M$ 来统一描述定价机制。设经济状态由马尔可夫状态向量 $Y(t)$ 完整刻画：

$$dY(t) = \mu^P(Y,t)\,dt + \sigma_Y(Y,t)\,dW(t)$$

其中 $\mu^P$ 是 $P$ 测度下的漂移、$\sigma_Y$ 是状态依赖的波动率矩阵。而定价核本身的演化，可以一般地写成下面这个最关键的方程——它把这篇综述的整个张力都浓缩在了一个 $\Lambda$ 上：

$$ \frac{dM_t}{M_t} = \cssId{a1}{-r_t\,dt} \;\cssId{a2}{-\,\Lambda_t'\,dW(t)} $$

这里 $r_t = r(Y(t),t)$ 是瞬时无风险利率，$W(t)$ 是 $N$ 维独立布朗运动，$\Lambda_t = \Lambda(Y(t),t)$ 是风险的市场价格 (market prices of risk) 向量。

为什么说 $\Lambda$ 是灵魂？因为持有一份 FIS 的期望超额回报，恰好由它决定：

$$e_P(t) \equiv E_t\!\left[\frac{dP(t)+h(t)dt}{P(t)dt} - r \,\Big|\, \mathcal{F}_t\right] = \frac{1}{P(t)}\frac{\partial P(t)}{\partial Y(t)'}\,\sigma_Y(t)\,\Lambda$$

也就是说，$\Lambda$ 是每单位风险因子波动所要求的风险溢价。Q 测度下的漂移，不过是把 P 测度的漂移减掉 $\sigma_Y \Lambda$ 而已：$\mu^Q_Y(t) \equiv \mu^P_Y(t) - \sigma_Y(t)\Lambda(t)$。于是，P 和 Q 的差别，全写在 $\Lambda$ 里。 你怎么设 $\Lambda$，就决定了同一套定价能配上一套怎样的历史动态。把这件事记牢，下一节的全部纠结都由它而来。

至于价格本身，把 $M_t$ 一代入、用 Feynman–Kac，就得到熟悉的无套利偏微分方程：折现项 $-rP$、加上分红 $h$、加上由无穷小生成元 $\mathcal{A}$ 作用出来的项，三者归零。这套机制在数学上无可挑剔——问题从来不在这里，而在于你给它喂什么样的 $\mu^Q$、$\sigma_Y$ 和 $\Lambda$。

4 仿射模型：可解性是要付代价的

然后，真正关键的一步来了。

在所有 DTSM 里，仿射 (affine) 模型是被研究得最多的一族，原因只有一个：它能给出（本质上）封闭解。仿射模型的设定是，在 Q 测度下，状态因子的漂移和方差都是 $Y$ 的仿射函数：

$$\mu^Q_Y(t) = \kappa^Q(\theta^Q - Y(t))$$

$$\sigma_Y(t)\sigma_Y(t)' = g_0 + \sum_{i=1}^N g_i\,Y_i(t)$$

第一式说漂移线性地均值回复到 $\theta^Q$；第二式说瞬时方差线性地随状态变动。再配上一个仿射的短率映射，零息债的对数价格就是状态的仿射函数——一切可解。

但是。第二式里那个「方差随状态线性变化」的设定，埋了一颗雷。在最早的「完全仿射 (completely affine)」设定里，为了保证 $\Lambda$ 不破坏可解性，人们让风险价格也正比于同一个 $\sqrt{g_0 + \sum g_i Y_i}$。这意味着：驱动条件方差的那个状态，同时也驱动了风险溢价的大小——两件本该独立的事，被一根绳拴死了。

于是反转出现：正是这根绳，让完全仿射模型在面对现实时屡屡碰壁。当数据要求「波动率很高、但风险溢价的符号和波动率的变化要能各走各路」时，模型做不到。后来文献松开这根绳（让 $\Lambda$ 有更灵活的设定），才把定价和时间序列两边同时救活——这正是「给风险价格松绑」的整条支线，详见《给「风险的价格」松一道绑：利率模型里那场按不下去的跷跷板》。

作者也讨论了仿射之外的两条出路：二次高斯 (quadratic-Gaussian, QG) 模型（短率是状态的二次型，能容纳更丰富的方差结构，Ahn, Dittmar & Gallant 2002）和非仿射的随机波动率模型。它们都在用各自的方式，赎回仿射框架为了可解性而牺牲掉的那部分丰富度。

5 理论照进现实：三个对不上的事实

讲完模型，作者把它们拖到现实面前对账。方法很朴素也很有说服力：从几族流行的 DTSM 里模拟出收益率，再看模拟数据能不能复现历史上的几个经验规律。对不上的，主要有三处。

其一，可预测性。 历史回归告诉我们，债券的持有期回报可以被收益率曲线变量（尤其是斜率）预测——这是 Fama & Bliss (1987) 和 Campbell & Shiller (1991) 留下的著名「谜题」：把长债收益变化对斜率回归，系数系统性地偏离预期假说预言的值。一个好的 DTSM，必须能在 $P$ 测度下生成这种可预测性。而能不能生成，几乎完全取决于你怎么设 $\Lambda$——这再次把矛头指回了第 4 节那根绳。

其二，波动率的两副面孔。 收益率的条件波动率高度持续 (Brenner, Harjes & Kroner 1996)，而无条件波动率的期限结构呈驼峰形（中段期限波动最大）。这是两个不同维度的要求，模型要同时拍中并不容易。事实上，能把收益率曲线水平拟合得天衣无缝的模型，未必能听见波动率在说什么——关于「拟合曲线」和「拟合波动率」是两件事，可参见《收益率曲线拟合得再好，也可能对波动率「充耳不闻」》，以及把波动率藏进潜变量的尝试《既要贴合今天，又要会呼吸》。

其三，斜率与隐含波动率的「独立性」。 当作者把视线从现券移到衍生品时，又冒出两个事实：不重叠的收益率曲线段，其斜率变化之间的相关性，比收益率本身的相关性要小得多 (Rebonato & Cooper 1997)；cap 和 swaption 的隐含波动率，似乎含有独立于标的互换市场的变动 (Collin-Dufresne & Goldstein 2002a; Heidari & Wu 2003)。后者就是著名的「未跨越的随机波动率」(unspanned stochastic volatility) ——债券价格竟然「张不满」整个固定收益市场，期权里藏着现券看不到的风险。

三个事实，一条主线：低维、可解的模型，要把它们一次性全部装下，捉襟见肘。

6 跳出扩散：跳跃与机制转换

如果扩散框架不够用呢？作者顺势把模型推到扩散之外。跳跃 (jump) 让短率可以瞬时跃迁，机制转换 (regime shifts) 让模型参数在若干个「状态」之间切换（Bansal & Zhou 2002; Ang & Bekaert 2002）——「换挡」这件事本身，也成了一种被定价的风险。这一支后来发展成专门的文献，可参见《利率会换挡：当「换挡」本身也成了一种被定价的风险》。

7 当债券会违约：把短率换成 r + λ

故事的最后一块，是可违约 (defaultable) 证券。这里作者展示了同一套定价语言的延展力。

在简约式 (reduced-form) 模型里，违约由一个强度为 $\lambda^P(t)$ 的计数过程触发，定价核要多吞下一个跳跃项：

$$\frac{dM_t}{M_t} = -r_t\,dt - \Lambda_t'\,dW_t - \gamma_t\,(dz_t - \lambda^P_t\,dt)$$

其中 $\gamma_t$ 是违约风险的市场价格。最漂亮的结论是：可违约零息债，可以用一个违约调整折现率 $r_t + \lambda^Q_t$ 来定价——把无风险利率换成「无风险利率 + 风险中性违约强度」，其余照旧。直觉很清楚：用 $r+\lambda^Q$ 折现，同时算进了货币的时间价值和「发行人得活到那一天才能付钱」这件事。在 Duffie & Singleton (1999) 的「市值比例回收」假设下，折现率进一步变成 $R_t \equiv r_t + \lambda^Q_t L^Q_t$，$L^Q$ 是违约时损失的市值比例。

但作者也敏锐地点出一个常被忽视的陷阱：$\lambda^P$ 和 $\lambda^Q$ 不只是水平不同，连持续性、时变波动、甚至「一个跳一个连续」都可以不同。 在 $\lambda^P$ 和 $\lambda^Q$ 之间移动，绝不等同于给 $r$ 的漂移做标准的风险中性调整。债券价格只透露 $\lambda^Q$ 的信息；要算真实违约强度 $\lambda^P$、要算超额回报，必须借助额外的 P 测度信息。这一点，对今天做信用利差分解的人仍是当头棒喝。

与之对照的是结构式 (structural) 模型：从 Black & Scholes (1973)、Merton (1974) 的「到期日资产不足以偿债即违约」，到 Black & Cox (1976) 引入「资产首次跌破边界即违约」的首次穿越 (first-passage) 思想，债券变成了「无风险债减去一份公司价值看跌期权」。关于结构式框架只盯着「还债那一天」的局限，可参见《公司随时都可能倒下，期权定价却只盯着还债那一天》；而结构式模型实证上的真正病症，其实是利差「太散」而非「太低」，见《结构模型给债券定价，错的从来不是「太低」，而是「太散」》。

8 文献脉络

把这条线拉直来看。定价的地基由 Black & Scholes (1973) 和 Merton (1974) 浇筑——用无套利和或有索取权的语言给风险债券定价；Black & Cox (1976) 把违约从「到期日一锤」推广到「首次穿越边界」，奠定了结构式一脉。

现实的拷问则来自实证：Fama & Bliss (1987)、Campbell & Shiller (1991) 用回归把「长债回报可被斜率预测」钉成了谜题，逼着任何无套利模型必须在 P 测度下交代清楚风险溢价；Brenner, Harjes & Kroner (1996) 则把「条件波动率高度持续」立为另一道硬约束。

两条线的汇流，是 Duffie & Singleton (1999) 的简约式违约定价，以及仿射/二次族的精细化（Ahn, Dittmar & Gallant 2002 的二次高斯模型）。Dai & Singleton (2003) 这篇综述，正站在这个汇流处，回头把整片地形画成一张图：用「三块积木 + 风险价格 $\Lambda$」这套坐标，丈量每一族模型在「可解性—丰富度」之间到底站在哪里。

9 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：这只是一篇综述，它的「贡献」到底是什么？

贡献不在新模型，而在新的「坐标系」。它把五花八门、互不嵌套的 DTSM，统一归约为三块积木（$I_{M(P)}$、$I_P$、$I_r$）与一个风险价格 $\Lambda$，从而能在同一张表上比较「谁为了可解性牺牲了什么」。综述的价值，是让后来者一眼看清取舍的边界在哪。

Q：为什么说「无套利约束很弱」这句话重要？

因为它戳破了一个常见误解：以为模型形式是被无套利「逼」出来的。作者指出，真正逼出仿射这类形式的，是封闭解和可估计性的计算便利。一旦意识到这一点，你就会去问：那些「为了能算」而做的设定，是不是正好牺牲掉了拟合现实所必需的自由度？答案往往是肯定的。

Q：完全仿射模型到底卡在哪？

卡在它把「条件方差」和「风险溢价」用同一个 $\sqrt{g_0+\sum g_i Y_i}$ 绑死了。现实要求二者能各自变动（甚至反向），而完全仿射做不到，于是无法同时复现 Fama–Bliss / Campbell–Shiller 的可预测性。松开 $\Lambda$ 的设定是后续的关键突破。

Q：「未跨越的随机波动率」为什么是个麻烦？

因为标准 DTSM 默认债券价格能「张满」所有风险维度——你用几个收益率就该能复制出期权。但 Collin-Dufresne & Goldstein (2002a)、Heidari & Wu (2003) 发现，cap/swaption 的隐含波动率含有现券里看不到的独立变动。这意味着低维 yield-only 模型对衍生品定价存在系统性缺口。

Q：$\lambda^P$ 和 $\lambda^Q$ 的区别，对实证有什么实际后果？

后果很大。债券价格只识别 $\lambda^Q$；若你想从利差反推「真实违约概率」或计算信用债的期望超额回报（依赖 $\lambda^P$），就必须额外引入 P 测度信息（如历史违约率、评级迁移）。两者持续性都可能不同，简单地「把 Q 当 P 用」会系统性地把风险溢价算错。

Q：互换利差里，$R_t - r_t$ 都是信用风险吗？

不是。作者明确提醒：长端互换利率和 LIBOR 未必反映同一信用质量，且 $R_t - r_t$ 里流动性风险可能与信用风险同样、甚至更重要 (Grinblatt 1994; Liu, Longstaff & Mandell 2001)。把利差一股脑当信用，会高估违约补偿。

(b) 几个可能的研究问题与提案

1. 把「未跨越波动率」搬到公司债 / CDS 市场。

【经济故事】现券若张不满风险空间，那么单只名字的 CDS 期权（swaption on CDS）或信用波动率，可能含有现券利差看不到的独立变动——即「未跨越的信用波动率」。【可行性】中。需要单名 CDS 与 CDS 期权报价（数据稀疏是主要障碍），识别上可借鉴 Collin-Dufresne & Goldstein 的跨越检验，把现券利差对期权隐含波动率做投影看残差。

2. 外资持有人结构与简约式强度的 P–Q 楔子。

【经济故事】若一国主权/公司债的边际买家结构（本土 vs 外资）变化会改变 $\gamma_t$（违约风险的市场价格），那么 $\lambda^Q/\lambda^P$ 的比值应随外资份额系统性变动。【可行性】中。需要持有人微观数据 + 历史违约/评级迁移来锚定 $\lambda^P$，用持有人结构的外生冲击（如指数纳入）做识别，doable 但对 $\lambda^P$ 的测量误差敏感。

3. 流动性 vs 信用：给互换/公司债利差做一次干净分解。

【经济故事】把 $R_t - r_t$ 拆成信用、流动性两块，并检验各自的市场价格是否随市场状态时变。【可行性】高。TRACE 成交数据 + 同一发行人不同流动性证券（on/off-the-run、新老券）能提供横截面变异，识别策略成熟，是相对扎实的实证题。

4. 风险价格设定与可预测性的「桥」是否在危机中断裂。

【经济故事】既然可预测性几乎全由 $\Lambda$ 承载，那么在流动性危机中 $\Lambda$ 是否发生结构性跳变，使得「斜率预测回报」的回归系数失稳？【可行性】中。可用滚动窗口或机制转换框架估 $\Lambda$ 的时变，难点在于把 $\Lambda$ 的变化和波动率结构的变化干净地分开。

10 我的判断

这篇综述真正的分量，不在它罗列了多少模型，而在它给了后来者一把统一的尺子：三块积木 + 一个风险价格。读完你会建立一种近乎本能的警觉——每当看到一个「漂亮、可解」的利率或信用模型，先去问它在 $\Lambda$ 上做了什么妥协，那个妥协又会让它在哪个经验事实上摔跤。这种「从可解性反推牺牲」的思维方式，是这篇文章留给我最值钱的东西。

要说担忧，综述本身没有识别问题，但它框定问题的方式留了两处隐患。其一，全文几乎把「丰富度」等同于「拟合那几个一阶/二阶矩」，而对模型的经济机制（为什么风险价格会这样动、背后是怎样的偏好或市场结构）着墨偏少——这也是后来宏观金融把利率模型与基本面挂钩的动机所在。其二，文章成于 2003 年，彼时「未跨越波动率」「流动性 vs 信用」还只是初露端倪；今天回看，这两条恰恰是低维无套利框架最深的裂缝。

后续我最想看到的，是把这套「三块积木」语言，认真地搬进公司债与信用衍生品：在那里，$\lambda^P$ 与 $\lambda^Q$ 的楔子、流动性与信用的纠缠、以及持有人结构对风险价格的影响，远比国债市场更剧烈、也更有故事可讲。

参考文献

Ahn, D.-H., R. F. Dittmar, and A. R. Gallant (2002). Quadratic Term Structure Models: Theory and Evidence. Review of Financial Studies 15(1), 243–288.
Ang, A., and G. Bekaert (2002). Regime Switches in Interest Rates. Journal of Business and Economic Statistics 20(2), 163–182.
Bansal, R., and H. Zhou (2002). Term Structure of Interest Rates with Regime Shifts. Journal of Finance 57(5), 1997–2043.
Black, F., and J. Cox (1976). Valuing Corporate Securities: Some Effects of Bond Indenture Provisions. Journal of Finance 31(2), 351–367.
Black, F., and M. Scholes (1973). The Pricing of Options and Corporate Liabilities. Journal of Political Economy 81(3), 637–654.
Brenner, R. J., R. H. Harjes, and K. F. Kroner (1996). Another Look at Models of the Short-Term Interest Rate. Journal of Financial and Quantitative Analysis 31(1), 85–107.
Campbell, J., and R. Shiller (1991). Yield Spreads and Interest Rate Movements: A Bird's Eye View. Review of Economic Studies 58(3), 495–514.
Collin-Dufresne, P., and R. S. Goldstein (2002a). Do Bonds Span the Fixed Income Markets? Theory and Evidence for Unspanned Stochastic Volatility. Journal of Finance 57(4), 1685–1730.
Dai, Q., and K. Singleton (2003). Term Structure Dynamics in Theory and Reality. Review of Financial Studies 16(3), 631–678.
Duffie, D., and K. Singleton (1999). Modeling Term Structures of Defaultable Bonds. Review of Financial Studies 12(4), 687–720.
Merton, R. C. (1974). On the Pricing of Corporate Debt: The Risk Structure of Interest Rates. Journal of Finance 29(2), 449–470.