结构模型给债券定价，错的从来不是「太低」，而是「太散」

[2004 RFS] Structural Models of Corporate Bond Pricing: An Empirical Analysis

Young Ho Eom, Jean Helwege, Jing-Zhi Huang

Jun He June 02, 2026

公司债结构模型信用利差实证检验

Note

本文读的是 Eom, Helwege & Huang (2004, Review of Financial Studies)：他们把 Merton、Geske、Longstaff-Schwartz、Leland-Toft、Collin-Dufresne-Goldstein 这五个结构模型，放到同一批 182 只「干净」的公司债上做了一次正面对账，结论却把流传了三十年的「常识」掀翻了一半——老的 Merton 模型确实把利差算低了，可那些更「先进」的新模型，平均反而把利差算高了；而真正的病根，既不是太高也不是太低，是预测值离谱地散：给安全债算出近乎零的利差，给高风险债算出大得吓人的利差。

1 一个三十年的「老问题」

故事得从一句几乎人人会背的「定论」讲起。

自 Black 和 Scholes (1973)、Merton (1974) 把期权定价的那套随机分析搬到公司债上之后，信用风险的理论文献就像滚雪球一样膨胀。它的核心想法优雅得让人着迷：一家有限责任公司的股权，本质上就是一份以公司资产价值为标的、以债务面值为执行价的看涨期权——资产值钱，股东行权（继续经营）；资产不值钱，股东弃权（违约），把公司丢给债权人。于是债券价格、违约概率、信用利差，全都能从一个 Black-Scholes 式的公式里推出来。

可这套漂亮的框架，从诞生第一天起就背着一个洗不掉的污点：它算出来的信用利差，太低了。 市场上一只 BBB 级公司债的利差动辄一两百个基点，而 Merton 模型却常常只给出几十个、甚至几个基点。这就是著名的「信用利差之谜」(credit spread puzzle)。

接着，一个自然的反应是：既然模型算低了，那就把模型做得更复杂、更贴近现实，让它能吐出更高的利差。 三十年里，理论家们确实是这么干的——给模型加上息票 (coupon)、允许到期前就违约 (default before maturity)、放进随机利率 (stochastic interest rates)、让杠杆率围着一个目标值均值回归……每一篇新论文，都在「Merton 之上」叠一块砖。

然后，一个看似理所当然的推论悄悄成了行业共识：新模型 = 好模型。 既然这些扩展都是为了修复 Merton 的「利差太低」病，那它们当然应该比 Merton 更准。

但真正关键的一步，恰恰是几乎没人认真做过的那一步——把这些模型放到同一批真实债券上，正面比一比。 Eom、Helwege 和 Huang 这篇文章，做的就是这件不性感、却极其要紧的脏活累活。于是反转出现了。

2 五个模型，一条流水线

要做正面对账，先得把对手摆齐。文章挑了五个有代表性的结构模型，并按惯例简称 M、G、LS、LT、CDG：

M（Merton, 1974）：最古典的版本。本文把附息债当成「一篮子零息债」(portfolio of zeroes) 来定价，每个现金流用对应期限的即期利率贴现——这是为了让它能和 LS、CDG 公平比较。
G（Geske, 1977）：把附息债的息票看成一连串复合期权 (compound option)。每个付息日，股东要么卖新股付息、公司续命，要么违约、把整个公司交给债权人。
LS（Longstaff & Schwartz, 1995）：引入 Vasicek (1977) 的随机利率；当资产价值跌到某个事先设定的边界时违约，债权人按本金的一个固定比例回收。
LT（Leland & Toft, 1996）：公司连续滚动发行一笔固定期限、连续付息的债，违约边界是内生决定的（股东在「再发股续命」和「干脆违约」之间最优选择）。
CDG（Collin-Dufresne & Goldstein, 2001）：在 LS 之上加了一条平稳杠杆率 (stationary leverage ratio)——公司只能在短期内偏离目标杠杆，长期会被拉回去。（关于「债务本身会动」这条线索如何补全了信用风险的另一半，可参见《债，其实一直在动》。）

这五个模型在四个维度上各不相同：违约边界怎么定、回收率多少、息票怎么处理、利率是否随机。文章的实现逻辑是一条标准流水线：每个模型都有解析或准解析的债券定价公式（G 模型的多元正态积分太难算，改用二叉树/有限差分），算出模型价格后，再换算成半年复利的「债券等价收益率」(bond equivalent yield)，与市场收益率相减，得到预测利差与实际利差之差。

Tip

注意：这是一篇实证检验论文，不是又一个新模型。它的「识别」不在于找外生冲击，而在于控制变量式的公平比较——同一批债、同一套参数估计口径、同一个利差定义，让五个模型在完全相同的赛道上各跑一遍。谁高谁低、谁准谁糙，一目了然。

参数估计是这条流水线里最容易藏污纳垢的环节，文章也最较真。几个关键约定：违约边界用资产负债表上的总负债账面值（而非单只债的面值），因为样本公司还有别的债，股权只有在所有债都还清后才有剩余价值；面值 F 取总负债，公司价值 V 取「股权市值 + 总负债账面值」；税率统一假设为 0.35；利率曲线用 Nelson & Siegel (1987) 或 Vasicek (1977) 拟合 CMT 数据。

3 把「结构模型」拆开看：从 Merton 说起

为了让后面的结果读得明白，值得把这套框架最底层的那块积木——Merton 模型——一步步摆出来。

第一步，资产价值服从几何布朗运动。设公司总资产价值 $V_t$ 在风险中性测度下满足

$$dV_t = (r - \delta)\,V_t\,dt + \sigma_V\,V_t\,dW_t$$

其中 $r$ 是无风险利率，$\delta$ 是资产的支付率 (payout ratio)，$\sigma_V$ 是资产波动率——注意它是不可观测的，这一点后面会要命。

第二步，把股权写成看涨期权。债务是一只面值 $F$、期限 $T$ 的零息债；到期时若 $V_T \ge F$，股东还钱、拿走剩余 $V_T - F$；若 $V_T < F$，股东违约、拿到 $0$。这正是一份执行价为 $F$ 的看涨期权的收益结构 $\max(V_T - F,\,0)$。于是由 Black-Scholes 公式：

$$ E = \cssId{a1}{V e^{-\delta T} N(d_1)} \;-\; \cssId{a2}{F e^{-rT} N(d_2)} $$

其中

$$d_1 = \frac{\ln(V/F) + (r - \delta + \tfrac{1}{2}\sigma_V^2)\,T}{\sigma_V\sqrt{T}}, \qquad d_2 = d_1 - \sigma_V\sqrt{T}$$

第三步，债券价值是「资产减股权」的另一种写法。既然股东拿走了那份看涨期权，债权人拿到的就是剩下的部分：

$$B = V e^{-\delta T} N(-d_1) + F e^{-rT} N(d_2)$$

第四步，信用利差就这么挤出来了。把债券价格折算成连续复利收益率，再减去无风险利率：

$$s(T) = -\frac{1}{T}\ln\!\left(\frac{B}{F}\right) - r$$

这条式子是整篇文章的灵魂。它告诉你：结构模型里的信用利差，完全由三个东西驱动——杠杆 $V/F$、资产波动率 $\sigma_V$、期限 $T$。 杠杆越高、波动越大，期权越可能出局，利差越高。其余四个模型，无非是在违约边界、利率、息票、杠杆动态上各做文章，但「利差是资产期权的影子」这个内核没变。

这里也埋着结构模型实证最棘手的钉子：$\sigma_V$ 看不见。文章的做法是用历史股权波动率、再用杠杆「还原」出资产波动率（直觉上 $\sigma_E\,E \approx N(d_1)\,\sigma_V\,V$，股权是放大了杠杆的资产）。他们一口气试了七种波动率估计（30/60/90/150 个交易日、事后 150 日、GARCH(1,1)、以及债券隐含波动率），最后正文统一汇报「150 个交易日历史波动率」这一种。记住这把尺子——它后面会成为「利差太散」的一大嫌疑人。

4 数据：182 只「干净」的债

识别要可信，样本就得「干净」。文章的取样逻辑近乎洁癖，目的只有一个：让定价误差只反映模型的好坏，而不是公司资本结构太复杂导致的噪声。

数据来自 Fixed Income Database 里 1986–1997 年每年 12 月最后一个交易日的债券价格（年末观测才好和年末财报对齐）；只留非金融、非公用事业（电力/燃气受监管，违约风险被监管者左右）、标准现金流（固定息票 + 到期还本）、且非可赎回、非可回售的债。从近 8700 只满足条件的债出发，再要求公司只有一两只公开债、且非次级债，剩 628 只；删掉只有「矩阵报价」(matrix price) 的不可靠观测；要求公司有公开股票、且 CRSP 上有至少五年股价（这样才能估波动率）；最后用 Moody's 手册逐一核对资本结构，剔掉债务种类超过五种、或债务有优先级差异的公司。层层筛下来，最终样本只剩 182 只债。

这批债长什么样？平均到期 8.97 年、平均息票 7.916%、平均评级约 7.5（Moody's 与 S&P 评级的均值，AAA=1）、平均资产市值 65.78 亿美元、平均市场杠杆 0.303、平均资产波动率 0.236。而最关键的因变量——对 CMT 的平均收益利差，只有 93.53 个基点（标准差 84.75）。换句话说，这是一批以投资级、低杠杆、大公司为主的「安全债」。文章也坦承，和市场上 7531 只同类债相比，本样本略偏安全（收益 7.4% vs. 7.6%）。这个「样本偏安全」的特征，待会儿读结果时要时刻记在心里。

5 主要结果：不是「太低」，而是「太散」

现在，把五个模型放上同一条赛道，看看跑出了什么。

第一个发现，证实了一半旧常识。 Merton 模型（M）的预测利差确实偏低——这与「信用利差之谜」、与 JMR (1984)「价格平均高估 4.5%」、与 Ogden (1987)「利差平均低估 104 个基点」的老结论一脉相承。G 模型同样偏低。到这里，故事还沿着教科书的剧本走。

但第二个发现，是彻底的反转。 LS、LT、CDG 这三个「更先进」的模型，平均利差不但不低，反而太高了。尤其是 Leland-Toft，它在绝大多数债上都高估利差，对高息票债尤其离谱——以至于它连短期债的信用风险都高估了（而旧文献一口咬定结构模型在短期债上利差「永远不够高」，这里恰好被打脸）。所以「结构模型一律低估利差」这句流传三十年的话，至少错了一半。

而第三个、也是最深刻的发现是：平均值本身就是个骗局。 文章反复强调，这些模型的预测利差「要么小得荒唐，要么大得离谱」(ludicrously small or incredibly large)，平均误差几乎不携带信息。真正的病不在水平 (level)，而在离散 (dispersion)：新模型对高杠杆、高波动的公司严重夸大信用风险，却对最安全的债依旧低估。于是平均下来「看着还行」，逐只看却全是大错。LS、CDG、LT 三个模型共享这个毛病；若再叠上随机利率、再用「面值回收」规则去刻画破产成本，离散度还会进一步恶化。

把三步连起来，文章给整个领域留下一句斩钉截铁的诊断：

Warning

结构债券定价的真正挑战，不是「把平均利差抬到比 Merton 高」——那太容易了，随便夸大点违约风险就行——而是要在抬高均值的同时，不把波动率、杠杆、息票带来的风险一起放大到失真。一句话：别为了喂饱风险债的胃口，而饿死安全债的利差。

这个洞见之所以重要，是因为它把「信用利差之谜」从一道「水平题」改写成了一道「形状题」。后来者若想做出更好的结构模型，得避开那些「专挑高风险债下狠手、却几乎不碰最安全债」的设定。这条思路，也呼应了后来文献对结构模型「漏掉了什么」的反思（比如把会计透明度这类信息摩擦请进利差的期限结构，见《财报越「干净」，短债越便宜》）。

6 文献脉络

把这条线索捋直，会看到一个相当清晰的「理论狂奔、实证滞后」的故事。

源头是 Black & Scholes (1973) 与 Merton (1974)：股权即看涨期权，债券定价从此有了第一性原理。紧接着 Black & Cox (1976) 引入「触界即违约」的安全边界，打开了「到期前违约」的大门。Geske (1977) 用复合期权处理息票。这是理论的第一波。

到 1990 年代，扩展进入第二波高潮：Longstaff & Schwartz (1995) 把随机利率装进来，Leland & Toft (1996) 把违约边界内生化、并刻画了信用利差的期限结构，Collin-Dufresne & Goldstein (2001) 又补上平稳杠杆。模型越来越精巧。

可实证这条线，几乎是空白。最早的认真尝试是 Jones, Mason & Rosenfeld (1984)——把 Merton 用到简单资本结构公司上，发现价格平均高估 4.5%，且对投机级债误差最大。Ogden (1987) 用新发债数据，发现利差平均低估 104 个基点。直到 Lyden & Saraniti (2000)，才第一次用个券价格同时实现并比较了 M 和 LS 两个模型，结论是两者都低估利差。Huang & Huang (2002) 则从另一个角度发问：用真实违约率校准，结构模型到底能解释信用利差里多大一块？

Eom-Helwege-Huang (2004) 正落在这条脉络的关键节点上：它第一次把五个主流模型一次性、同口径地放上同一批债，于是才有了「不是太低、而是太散」这个超越前人的判断。

7 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：既然 Merton「低估」、新模型「高估」，那是不是说明新模型至少在方向上对了？

不能这么读。文章的核心恰恰是「平均方向」毫无意义。新模型的高估是离散度撑起来的虚高——它把一小撮高杠杆、高波动公司的利差吹到天上，平均一拉就「够高了」，但对绝大多数安全债它仍然低估。方向对、形状错，比方向错更难修。

Q：样本只有 182 只、且偏安全、偏投资级，结论能外推到高收益债吗？

这是最实在的担忧。样本偏安全意味着「对安全债低估」这条结论是稳的（样本里安全债多），但「对高风险债高估」是靠样本里那十几只低评级债撑起来的，统计上更脆。文章自己也承认样本比市场整体略安全。换言之，对垃圾债市场的推断，得打个折扣。

Q：会不会根本不是模型错，而是参数估错了——尤其那个看不见的资产波动率 $\sigma_V$？

文章很警惕这一点，所以试了七种波动率口径。结论是：除了债券隐含波动率，其余几种差别不大，离散度主要由极端值（短窗口更容易出极端值）贡献。所以波动率估计是「离散」的嫌疑人之一，但不是唯一元凶；息票处理、Vasicek 利率模型同样在制造离散。

Q：用「总负债账面值」而不是单只债面值当违约边界，会不会人为抬高了利差？

方向上确实会抬高（违约边界更高 = 更容易违约）。但这个选择是对的：样本公司还有银行贷款、商业票据等其他债，股权只有在所有债清偿后才有价值，用单只债面值会系统性低估违约风险。它能解释一部分「新模型偏高」，但解释不了「离散」——离散是跨债券的形状问题，不是一个水平平移能造成的。

Q：这和「信用利差里有多少是信用风险、多少是流动性/税收」那条文献是一回事吗？

不是同一个问题，但互补。本文问的是「给定结构模型框架，它定价准不准」；Huang & Huang (2002) 那条线问的是「信用利差里究竟有多大比例应该由信用风险解释」。如果后者的答案是「信用风险只占一小半」，那结构模型「平均低估」就部分是因为它本就不该解释全部利差——利差里还掺着流动性等成分（这一块的拆解，可参见《一个买卖价差，为什么越来越贵了？》）。

Q：LT 模型为什么偏偏在高息票债上错得最离谱？

因为 LT 假设公司连续滚动发行、连续付息，这套「简化的息票处理」在息票高时会过度放大持续的现金流出压力，从而把违约风险——进而把利差——顶得过高。文章明确把 LT 的系统性高估归因于它对息票的简化假设。

(b) 几个可能的研究问题与提案

1. 把「离散度」当成因变量，而不是「平均误差」。 【经济故事】本文最大的贡献是指出病在离散而非水平，但它停在了诊断。一个自然的延伸是：系统地把各模型的预测误差离散度对杠杆、波动率、息票、期限做回归，定位究竟哪个设定特征在制造离散。这等于给「下一个结构模型该避开什么」画一张地图。【可行性】高。本文的数据与实现已具备，只是把分析对象从均值换成离散度，纯增量工作。

2. 在现代、更大的公司债样本（含 TRACE 与高收益债）上重做这场对账。 【经济故事】本文样本止于 1997、偏安全、且依赖不那么可靠的报价。2002 年后 TRACE 提供了成交价，样本可扩到数千只、覆盖垃圾债。重做能检验「对高风险债高估」这条脆弱结论到底稳不稳。【可行性】高。TRACE + Compustat + CRSP 公开可得，识别就是同口径复制本文流水线。

3. 把流动性溢价显式地从结构模型残差里剥出来。 【经济故事】结构模型只管信用风险，可利差里掺着流动性。若把模型预测利差当「信用部分」，用实际利差减去它得到残差，再看残差能否被流动性指标（成交量、买卖价差、外资持有比例）解释，就能给「利差里有多少不是信用」一个结构化的答案。【可行性】中。需要流动性数据与成交数据，识别难点在于模型设定误差与流动性会混在残差里，得用工具变量或制度断点把两者分开。

4. 外资持有人会不会系统性地改变结构模型的定价误差？ 【经济故事】若某只债的边际买家是受监管约束、或风险偏好不同的外资机构，其市场利差就会偏离纯信用基准，表现为结构模型的「系统性误差」。把模型残差对外资持有份额回归，能检验「持有人结构」是否是利差之谜的一块拼图。【可行性】中。需要债券层面的持有人数据（如保险公司明细持仓、NAIC 数据），识别上可借助指数纳入或监管分类变化作为外生冲击。

5. 内生 vs. 外生违约边界，到底谁的定价误差更小？ 【经济故事】LT 的边界内生、LS/CDG 的边界外生，本文发现 LT 系统性高估。一个干净的对照实验是：在完全相同的样本上，把「边界设定」作为唯一变化的维度，分离出「内生化」本身对定价误差的净贡献，回答「违约边界该不该让股东最优选择」这个老争论。【可行性】中。实现五个模型的工程量不小，但识别思路清晰，属于「难在体力、不难在逻辑」。

评论与判断

我的看法是：这篇文章的贡献，不在于又「检验」了几个模型，而在于重新定义了问题。在它之前，整个领域把信用利差之谜当成一道「模型吐出的利差太低、需要往上抬」的水平题；它之后，问题变成了「如何在不破坏横截面形状的前提下抬高均值」的形状题。这种把诊断从一阶矩推进到二阶矩的洞见，是真正的学术增量——它让后来者明白，简单地「加大违约风险」是死路，因为代价是安全债被进一步饿死、风险债被进一步喂撑。

对识别的担忧，我有两点。其一是样本：182 只、偏安全、偏投资级、且部分依赖矩阵报价，使得「对高风险债高估」这条最反直觉的结论，其实建立在十几只低评级债的薄弱基础上，统计上经不起太重的推敲。其二是参数与模型误差的纠缠：资产波动率不可观测、违约边界靠总负债近似、利率用 Vasicek 拟合，这些都会进入残差，使得「模型错」与「参数估错」难以彻底切开——文章已尽力（七种波动率口径）但无法根除。

后续我最想看到的，是用 TRACE 时代的大样本、把信用与流动性显式分离之后，本文那张「高风险债高估、安全债低估」的图景还成不成立——以及，能不能找到一个既不饿死安全债、又不喂撑风险债的设定。这恰恰是本文留给整个领域、至今仍未完全合上的那道题。

参考文献

Black, F., and J. Cox (1976). Valuing Corporate Securities: Some Effects of Bond Indenture Provisions. Journal of Finance 31(2), 351–367.
Black, F., and M. Scholes (1973). The Pricing of Options and Corporate Liabilities. Journal of Political Economy 81(3), 637–659.
Collin-Dufresne, P., and R. Goldstein (2001). Do Credit Spreads Reflect Stationary Leverage Ratios? Journal of Finance 56(5), 1929–1957.
Eom, Y. H., J. Helwege, and J.-Z. Huang (2004). Structural Models of Corporate Bond Pricing: An Empirical Analysis. Review of Financial Studies 17(2), 499–544.
Geske, R. (1977). The Valuation of Corporate Liabilities as Compound Options. Journal of Financial and Quantitative Analysis 12(4), 541–552.
Huang, J.-Z., and M. Huang (2002). How Much of the Corporate-Treasury Yield Spread is Due to Credit Risk? Working paper, Penn State and Stanford.
Jones, E. P., S. Mason, and E. Rosenfeld (1984). Contingent Claims Analysis of Corporate Capital Structures: An Empirical Investigation. Journal of Finance 39(3), 611–625.
Leland, H. (1994). Corporate Debt Value, Bond Covenants, and Optimal Capital Structure. Journal of Finance 49(4), 1213–1252.
Leland, H., and K. Toft (1996). Optimal Capital Structure, Endogenous Bankruptcy, and the Term Structure of Credit Spreads. Journal of Finance 51(3), 987–1019.
Longstaff, F., and E. Schwartz (1995). Valuing Risky Debt: A New Approach. Journal of Finance 50(3), 789–820.
Lyden, S., and D. Saraniti (2000). An Empirical Examination of the Classical Theory of Corporate Security Valuation. Barclays Global Investors, San Francisco, CA.
Merton, R. (1974). On the Pricing of Corporate Debt: The Risk Structure of Interest Rates. Journal of Finance 29(2), 449–470.
Nelson, C., and A. Siegel (1987). Parsimonious Modeling of Yield Curves. Journal of Business 60(4), 473–489.
Ogden, J. (1987). Determinants of the Ratings and Yields on Corporate Bonds: Tests of the Contingent Claims Model. Journal of Financial Research 10(4), 329–339.
Vasicek, O. (1977). An Equilibrium Characterization of the Term Structure. Journal of Financial Economics 5(2), 177–188.