HML 和 SMB 到底是什么？——它们其实在替「明年的 GDP」打工

[2003 JFE] News Related to Future GDP Growth as a Risk Factor in Equity Returns

Jun He June 02, 2026

资产定价宏观风险 Fama-French GMM

Note

本文读的是 Vassalou (2003, Journal of Financial Economics)：把一个「与未来 GDP 增长有关的新闻」因子和市场因子放进定价核，对横截面收益的解释力就能逼平 Fama-French 三因子模型；更要命的是，一旦这个 GDP 新闻因子在场，HML 和 SMB 几乎丧失了所有增量解释力——它们看上去，主要就是「未来 GDP 增长的新闻」的代理。

1 一个悬而未决的老问题

先把时间拨回 1992 年。Fama 和 French 在那篇著名的论文里干了一件让 CAPM 很难堪的事：他们证明，美国股票的横截面平均收益，单靠市场 beta 几乎解释不动，反倒是 账面市值比 (book-to-market, B/M) 和 规模 (size) 这两个「特征」说了算。于是他们提出了一个替代模型，在市场因子之外加了两条腿——和 B/M 挂钩的 高减低因子 (High-Minus-Low, HML)，以及和规模挂钩的 小减大因子 (Small-Minus-Big, SMB)。

这个模型（下称 FF 模型）好用得出奇。Fama-French 在 1993、1995、1996 一连串文章里反复证明：它把平均收益解释得相当漂亮。可问题也就在这儿——它好用，但没人说得清它为什么好用。

HML 和 SMB 到底是什么？它们代表的是某种真实的、系统性的经济风险，还是仅仅是从数据里「挖」出来的、carryover 了规模效应（Banz, 1981）和账面市值比效应（Rosenberg et al., 1985）这两个老异象的统计构造？这不是一个吹毛求疵的问题。Fama-French 自己（1993, 1996）也辩护说，HML 和 SMB 是 Merton（1973）跨期资本资产定价模型 (Intertemporal CAPM, ICAPM) 意义上的 状态变量 (state variables)——也就是说，它们应当携带关于经济基本面风险的信息，这种风险会改变投资者的投资机会集。

Tip

这是一句很重的话。如果 HML、SMB 真是 ICAPM 的状态变量，那它们背后就该藏着某个看得见摸得着的宏观量。问题是：是哪一个？

接着，一个自然的线索浮了出来。Liew 和 Vassalou（2000）发现：HML 和 SMB 能够预测未来的经济增长。也就是说，这两个因子里确实掺着关于未来宏观状况的信息。那么——本文要追的，就是这条线索的下一步：如果把「未来 GDP 增长的新闻」直接做成一个因子塞进定价模型，会发生什么？HML 和 SMB 还剩下多少独立的解释力？

这篇论文的贡献，可以用一句话概括：它没有去发明新因子，而是去给旧因子「验明正身」。 结论相当锋利——HML 和 SMB，主要就是未来 GDP 增长新闻的代理。

2 真正棘手的一步：新闻是「看不见」的

要把「未来 GDP 增长的新闻」做成因子，第一道坎就来了：新闻 (news) 本身是不可观测的。

注意，这里要的不是「预期」，也不是「实际值」。在资产定价里，只有创新 (innovation)——也就是预期之外的那一部分——才赚风险溢价。你把「市场预期的未来 GDP」或者「实际的未来 GDP」塞进定价核，都不能回答「关于未来 GDP 的新闻有没有被定价」这个问题。而新闻恰恰是最难直接测量的东西。

那怎么办？作者的办法是构造一个 模仿组合 (mimicking portfolio)。

思路其实很优雅：既然新闻会影响资产价格，那它一定已经反映在某些资产的收益里了。于是反过来——用一组资产的收益去「张成」这个不可观测的宏观变量，回归的拟合值就保留了同样的信息，只不过现在它被表达成了一个可交易组合的收益（这是 Breeden et al., 1989 提出的经典做法）。模仿组合还有一个副产品：它天然回避了宏观变量的测量误差问题。

但真正关键的一步在于「过滤」。一个朴素的模仿组合，混着的是 GDP 的水平信息；我们要的是新闻。Lamont（2001）给出的处理是：在回归右边加入一组能预测基础资产收益的控制变量，把可预测的部分剥掉，剩下的拟合值就更接近「创新」。本文正是这么做的——基础资产用了 8 个组合（6 个股票组合 + 2 个固定收益组合：TERM 和 DEF），控制变量则是 4 个老牌收益预测变量：违约利差 DEFY、期限利差 TERMY、30 天国库券利率 RF，以及 Lettau-Ludvigson（2000）的去趋势财富变量 CAY。

Note

这里藏着一个常被忽略的细节：基础资产里的那 6 个股票组合，正是 Fama-French 用来构造 HML 和 SMB 的那 6 个组合（两个规模 × 三个 B/M 的交叉排序）。换句话说，作者是用造 HML/SMB 的同一批砖头，去砌「GDP 新闻」这堵墙。后面那个「夺权」式的结论，根子就埋在这里。

3 基础资产真能预测未来 GDP 吗？

在把模仿组合塞进定价模型之前，得先回答一个前提问题：这 8 个基础资产，真的含有关于未来 GDP 增长的信息吗？如果连这一步都不成立，后面整套故事就是空中楼阁。

作者跑的是一个「四个季度之后的 GDP 增长」对当期基础资产收益的回归：

$$GDPGR_{t,t+4} = a + c\,B_{t-1,t} + e_{t,t+4}$$

这里 $GDPGR_{t,t+4}$ 是 $t$ 到 $t+4$ 之间的 GDP 增长，$B_{t-1,t}$ 是 8 个基础资产在 $t-1$ 到 $t$ 之间的收益向量（6 个股票组合的收益都已减去无风险利率 RF，所以 8 个全是零投资组合）。标准误用 Newey-West（1987b）估计量，修正了三阶序列相关和 White（1980）异方差。

结果是站得住的。全样本（1953:Q1–1998:Q4）的调整 $R^2$ 达到 16.12%，意味着未来 GDP 增长里有相当一块能被这 8 个资产预报出来；联合检验「8 个系数全为零」的渐近 p 值是 0.0000，更稳健的 bootstrap（10,000 次模拟）经验 p 值也只有 0.0020。两个子样本的调整 $R^2$ 都在 18% 量级（18.58% 和 18.78%）。单看个体系数，因为基础资产之间共线性严重，多数不好解释，但有一个例外格外醒目：DEF（长期公司债减长期国债的收益）的系数是 0.333，t 值 3.06——违约利差类资产对未来增长的预报力，是这组里最扎实的。

Tip

顺带一提，把 4 个控制变量也放进右边后，调整 $R^2$ 跳到 38.62%。这说明控制变量本身预测力很强；正因为它们强，把它们剥掉之后剩下的「新闻」才更干净。

4 方法论：用一步 GMM 把「生成因子」的标准误补回来

到这里，故事的骨架已经清楚了，但还有一个技术性的、却又绕不开的麻烦：模仿组合是「估」出来的。如果先估一个因子、再拿这个估计值当自变量去做第二阶段回归，就会掉进经典的 生成回归量 (generated-regressors) 陷阱——第二阶段的标准误会被低估，因为它假装第一阶段的因子是已知的。

本文的资产定价检验走的是 随机贴现因子 (stochastic discount factor, SDF) 路线。在无套利下，存在一个定价核 $m$，使每个资产都被正确定价：

$$E(Rm) = p$$

其中 $R$ 是 $n\times 1$ 的总收益向量，$p$ 是价格向量（超额收益时 $p=0$，简单收益时 $p=1$）。所有被比较的模型——CAPM、FF、以及本文的 GDP 因子模型——都是线性因子模型，因此它们的定价核都能写成因子的线性组合：

$$ m = \cssId{a1}{b_0} + \cssId{a2}{f'}\,\cssId{a3}{b_1} $$

Cochrane（1996）证明了「定价核是因子的线性函数」与「用 beta 和因子风险溢价表达的因子定价模型」二者等价：

$$E(R) = R_0\,p + b'\lambda$$

其中 $R_0 = 1/E(m)$ 是零 beta 利率，$b = \mathrm{cov}(r, f')\,\mathrm{var}(f)^{-1}$ 是资产收益对因子的投影，$\lambda = -R_0\,\mathrm{cov}(f, f')\,b_1$ 是风险溢价。估计用 Hansen（1982）的 广义矩估计 (Generalized Method of Moments, GMM)，目标函数是

$$J_T = g_T(b)'\,W_T\,g_T(b)$$

$g_T(b)$ 是样本定价误差向量，$W_T$ 是权重矩阵。

那么生成回归量的问题怎么解决？作者借用了 Cochrane（2001）的招法：把模仿组合和资产定价模型放进同一步 GMM 里一起估。具体做法是把模仿组合回归的矩条件，摞在资产定价模型的矩条件上方，再选一个权重矩阵 $A$，让上方那块（识别模仿组合的矩）被精确匹配——也就是在 $A$ 的左上角放一个单位矩阵。这样一来，模仿组合和定价模型的系数估计，与「两步法」完全相同；但标准误不同——它被调整过，反映了「模仿组合是被生成出来的」这一事实。

Warning

一步法只能用季度数据，因为 GDP 只有季度频率。所以作者也保留了两步法：两步法的系数和一步法一模一样，但能上月度数据（用模仿组合做因子，540 个月度观测），并且方便用到一些做模型比较和诊断所必需的特定权重矩阵。两条腿走路，各取所长。

为了比较模型，作者祭出了三件趁手的工具：(1) Hansen-Jagannathan 距离 (HJ-distance)——用 $E[RR']^{-1}$ 做权重矩阵，它跨模型不变，且有一个漂亮的解释：它就是一组资产的最大定价误差（Campbell-Cochrane, 2000 正是这么用的）；(2) Andrews（1993）的 supLM 检验，看参数在样本期里稳不稳；(3) 最关键的——一个直接检验 HML、SMB 在 GDP 因子在场时还有没有增量解释力的统计量。

这第三件工具值得单说。在两步法里，它是 Newey-West（1987a）的 $\Delta J$ 检验：先估一个含 GDP 因子 + HML + SMB 的非约束模型，拿它的权重矩阵去估一个剔除 HML、SMB 的约束模型。如果这俩因子真没有增量贡献，约束模型的 $J$ 函数就不该上升多少：

$$\Delta J = T J(\text{restricted}) - T J(\text{unrestricted}) \sim \chi^2(\#\,\text{restrictions})$$

在一步法里，同一假设用 Wald 检验。Newey-West（1987a）证明二者在一般的异方差和序列相关假设下渐近等价。整篇论文的「胜负手」，就压在这个检验上。

5 结果：GDP 因子来了，HML 和 SMB「下岗」了

数据是 25 个 Fama-French 组合加上 30 天国库券利率（共 26 个测试资产），样本期 1953–1998。月度检验 540 个观测，季度检验 180 个；季度估计因为观测数只有月度的三分之一，为了不拖垮 GMM 估计量的表现，只用了 12 个能很好概括全部 25 个组合性质的组合（外加国库券），并刻意挑了那些历来最难定价的，比如小盘成长股。

主要结论有两层。

第一层，能力上「打平」。 把 GDP 新闻因子加到 CAPM 上（即「市场 + GDP 新闻」两因子模型），对横截面的解释力显著提升，定价误差的模式和量级都与 FF 模型相仿。也就是说，一个只有两条腿、但其中一条腿有明确宏观含义的模型，干得和 FF 三因子模型差不多好。

第二层，也是真正的反转——HML 和 SMB 几乎被「吸干」。 当 GDP 新闻因子在场时，HML 和 SMB 对横截面几乎没有剩余的增量解释力。$\Delta J$ 检验（两步法）和 Wald 检验（一步法）都指向同一个结论：剔除这两个因子，约束模型的 $J$ 函数没有显著上升。换句话说，HML 和 SMB 之前在 FF 模型里扮演的角色，相当大一部分可以由「未来 GDP 增长的新闻」来接管。

如表 6 所示，把几个竞争模型放在同一张表上对比——CAPM、FF、以及 GDP 因子模型——GDP 因子模型在 HJ 距离（最大定价误差）等口径上与 FF 模型旗鼓相当，而它所依赖的因子，宏观解释更干净。

Table 6: presents a summary of the results from estimating the competing models

至此，文章开头那个悬案就有了一个有说服力的答案：HML 和 SMB 之所以能定价，很可能不是因为它们神秘，而是因为它们替「明年的经济」打了工。这与「HML/SMB 是 ICAPM 状态变量」的辩护是自洽的——它们确实在携带基本面风险的信息，只不过那个基本面，现在被指认成了「未来 GDP 增长的新闻」。

（关于「风险究竟能不能把价值、规模这些异象收编」这个更大的争论，可参见《会「看天」的 beta：当风险收编了价值与规模，动量却躲进了商业周期》；而把宏观风险反推回每一家公司的努力，可参见《理论最美、却没人用的模型：把「消费风险」反推回每一家公司》。）

6 文献脉络

把这条线索捋直，故事其实很清楚。

起点是 Sharpe（1964）的 CAPM——一个因子（市场）定天下。但市场 beta 解释不了规模效应（Banz, 1981）和账面市值比效应（Rosenberg et al., 1985）这些顽固的异象。于是 Fama 和 French（1992, 1993）干脆把这两个异象「升格」成因子，造出了 HML 和 SMB，实证上大获成功，却留下了「它们到底是什么」的理论欠账。

与此同时，Merton（1973）的 ICAPM 提供了一个理论容器：多因子可以是描述投资机会集变动的状态变量。Fama-French 借这个框架为自己辩护，但始终没能指出那个具体的宏观状态变量是谁。方法论上，Cochrane（1996）把 SDF 与 beta 定价打通、并提出用条件信息缩放收益做稳健性，给这一脉的实证检验铺好了路。

真正点燃本文的是 Liew 和 Vassalou（2000）：他们发现 HML、SMB 能预测未来经济增长。本文则把这条线索推到尽头——直接用模仿组合把「未来 GDP 增长的新闻」做成因子，并证明它能在很大程度上取代 HML 和 SMB。

这条脉络后来一直延续到把宏观、消费、投资基本面与横截面收益挂钩的种种努力，也延续到 Cochrane 那句著名的判断——资产定价的中心议题是贴现率（可参见《贴现率：资产定价的中心议题》）。本文是这条「给因子找经济灵魂」道路上一块结实的踏脚石。

7 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：这篇文章是不是说 HML 和 SMB 没用了？

不是。文章说的是「在 GDP 新闻因子在场时，HML、SMB 没有增量解释力」，这是一个关于「谁包含谁的信息」的论断，而非否定 FF 模型的定价能力。FF 模型依然好用——只是它好用的原因，被指认成了「未来 GDP 增长的新闻」。两者更像是同一枚硬币的两面。

Q：为什么非要用「模仿组合」，直接拿实际 GDP 或预期 GDP 当因子不行吗？

不行，这是全文的方法论命门。风险溢价只奖励创新（新闻），而非水平或预期。把实际/预期未来 GDP 放进定价核，回答不了「关于未来 GDP 的新闻有没有被定价」。模仿组合做了两件事：把不可观测的新闻表达成可交易收益，同时（通过加控制变量过滤）剥掉可预测部分、留下创新。它还顺手回避了 GDP 数据的测量误差。

Q：用造 HML/SMB 的那 6 个组合去构造 GDP 因子，再说 GDP 因子能取代 HML/SMB，这不是循环论证吗？

这是最该警惕的一点，但严格说不算循环。基础资产相同，不代表「张成」出来的因子相同——HML/SMB 是这些组合的特定线性组合（多空价差），而 GDP 模仿组合是「最能预测未来 GDP 增长」那个方向上的线性组合，并经过控制变量过滤。两者是同一组砖头砌出的不同结构。真正的证据在于：GDP 方向的组合能预测 GDP（$R^2=16\%$、bootstrap p=0.002），且在它在场时 HML/SMB 的 $\Delta J$ 不显著。不过这个共享基础确实让人想追问：换一批基础资产，结论稳不稳？这正是作者用第 6 节专门检验的。

Q：HJ 距离凭什么比 Hansen 的 J 检验更可信？

因为标准的过度识别 J 检验（Eqs. 6–7）很容易漏掉模型误设（Newey, 1985 早有提醒）。HJ 距离用的是跨模型不变的权重矩阵 $E[RR']^{-1}$，因此适合横向比较；更重要的是它有经济解释——最大定价误差。比起「模型有没有被拒」，「模型最多错多少」对实务更有意义。

Q：DEF 的系数 0.333（t=3.06）这么突出，是不是说信用利差才是真正的主角？

很值得玩味。DEF 是这组里对未来 GDP 增长预报最稳的单个资产，呼应了「信用利差含宏观增长信息」的大量证据。但因为基础资产之间共线性很强，作者明确说不要过度解读单个系数，检验主要看联合显著性。换句话说，DEF 抢眼，但故事是「8 个资产合力」，而非「DEF 一人定乾坤」。

Q：结论对数据频率敏感吗？季度只用了 12 个组合，会不会是挑出来的？

作者对此是诚实的：季度只能上 12 个组合，是因为 180 个观测撑不起 26 个资产的 GMM；挑的标准是「能概括全部 25 个组合的性质」，并刻意纳入最难定价的小盘成长股。同时月度（540 obs，两步法）能上全套资产，结论一致。两个频率互相印证，降低了「挑样本」的嫌疑——但季度估计的小样本属性，仍是这类 GMM 检验天然的软肋。

(b) 几个可能的研究问题与提案

1. 把「GDP 新闻因子」搬到公司债横截面上。

【经济故事】公司债收益对宏观增长的暴露，理论上比股票更直接——违约本质上是经济周期的函数，而本文里恰恰是 DEF 这个固定收益资产对未来 GDP 预报最强。一个自然的问题是：未来 GDP 增长的新闻，能不能定价公司债的横截面（按评级/久期分组），并取代信用市场里那些「特征因子」？【可行性】中。数据可得（TRACE + 评级 + 宏观），识别沿用本文的模仿组合 + 一步 GMM 即可。难点在于公司债流动性噪声大、收益测量误差比股票严重，需谨慎处理。

2. 外资持有人是否改变了「GDP 新闻」的定价。

【经济故事】如果某国股票的边际投资者越来越是全球分散的外资，那么本地 GDP 新闻作为系统性风险的「价格」应当被压低——因为对全球投资者而言它更接近可分散风险。把本文因子放进一个随「外资可投资度」变化的设定里，可以检验「谁是边际投资者」如何重塑宏观因子的风险溢价。【可行性】中。需跨国股票收益 + 各国 GDP + 外资持股/可投资度数据（如 MSCI 可投资度）。识别可用可投资度放开作为准自然实验。挑战是各国 GDP 数据质量与频率参差。

3. 危机期间 GDP 新闻因子与流动性因子的「争夺」。

【经济故事】2008、2020 这样的窗口里，横截面收益既被宏观增长预期主导，也被流动性枯竭主导。一个有意思的问题是：在极端时段，HML/SMB 让出的解释力，到底流向了「GDP 新闻」还是「流动性」？这能帮我们分辨「价值溢价」在危机里到底是基本面故事还是流动性故事。【可行性】高。数据现成（高频流动性指标 + 本文因子），识别用滚动窗口或状态依赖的 GMM。结论对「价值溢价的本质」之争有直接含义。

4. 用更高频/更及时的「增长新闻」替代季度 GDP。

【经济故事】季度 GDP 既滞后又会被修订，是本文方法论上最大的牺牲。若用 nowcasting 或月度活动指标构造「增长新闻」，模仿组合的信噪比可能改善，从而更干净地检验 HML/SMB 的「被取代」是否更彻底。【可行性】高。月度宏观活动指数已成熟，识别框架完全沿用本文，唯一新增的是新闻构造方式。属于「换一个更好的尺子重做一遍经典」的稳健性升级。

8 我的判断

这篇论文的贡献不在于「又发明了一个因子」，而在于它换了个方向发问：与其继续往模型里加腿，不如回头问一句——已经在用的那两条腿，到底站在什么经济地基上？ 把不可观测的「未来 GDP 增长新闻」做成可交易的模仿组合，再用一步 GMM 把生成因子的标准误老老实实补回来，这套手艺干净利落；而「GDP 因子在场时 HML/SMB 的增量解释力消失」这个结论，给 Fama-French 因子提供了一个少有的、具体的宏观解读。

但识别上有两处我会盯着不放。其一是前面提到的基础资产共享问题：GDP 因子和 HML/SMB 用了同一批股票组合，虽然方向不同，但「同源」难免让人担心结论被构造方式所偏好——这正是第 6 节稳健性检验承担的全部重量，它的说服力直接决定了全文的说服力。其二是季度小样本：12 个组合、180 个观测的 GMM，参数估计和 supLM 一类的稳定性检验，天然吃不饱数据；月度两步法虽能补上观测，却又回到了「两步」的世界。

我接下来最想看到的，是把这套逻辑搬到公司债和信用市场去——那里宏观增长风险的传导链条更短、DEF 在本文里又恰好最抢眼。如果「未来 GDP 增长的新闻」能在信用横截面上同样取代那些特征因子，那么本文「给因子找经济灵魂」的努力，就不只是股票市场里的一个巧合，而是一条更普遍的定价主线。

参考文献

Banz, R.W. (1981). The relationship between return and market value of common stocks. Journal of Financial Economics 9, 3–18.
Breeden, D.T., Gibbons, M.R., Litzenberger, R. (1989). Empirical tests of the consumption-oriented CAPM. Journal of Finance 44, 231–262.
Campbell, J.Y., Cochrane, J.H. (2000). Explaining the poor performance of consumption-based asset pricing models. Journal of Finance 55, 2863–2878.
Cochrane, J.H. (1996). A cross-sectional test of an investment-based asset pricing model. Journal of Political Economy 104, 572–621.
Cochrane, J.H. (2001). Asset Pricing. Princeton University Press, NJ.
Fama, E.F., French, K.R. (1992). The cross-section of expected stock returns. Journal of Finance 47, 427–465.
Fama, E.F., French, K.R. (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33, 3–56.
Hansen, L.P. (1982). Large sample properties of generalized methods of moments estimators. Econometrica 50, 1029–1054.
Hansen, L.P., Jagannathan, R. (1997). Assessing specification errors in stochastic discount factor models. Journal of Finance 52, 557–590.
Lamont, O. (2001). Economic tracking portfolios. Journal of Econometrics 105, 161–184.
Lettau, M., Ludvigson, S. (2000). Consumption, aggregate wealth and expected stock returns. Journal of Finance 56, 815–849.
Liew, J., Vassalou, M. (2000). Can book-to-market, size and momentum be risk factors that predict economic growth? Journal of Financial Economics 57, 221–245.
Merton, R. (1973). An intertemporal capital asset pricing model. Econometrica 41, 867–887.
Newey, W., West, K. (1987a). Hypothesis testing with efficient method of moments. International Economic Review 28, 777–787.
Sharpe, W.F. (1964). Capital asset pricing: a theory of market equilibrium under conditions of risk. Journal of Finance 19, 425–442.
Vassalou, M. (2003). News related to future GDP growth as a risk factor in equity returns. Journal of Financial Economics 68(1), 47–73.