被「学」出来的风险：当贴现率随着信念一起呼吸

[2024 JFE] Learning About the Consumption Risk Exposure of Firms

Yongjin Kim, Lars-Alexander Kuehn, Kai Li

Jun He June 01, 2024

资产定价贝叶斯学习投资基础模型结构估计

Note

本文读的是 Kim, Kuehn & Li (2024, Journal of Financial Economics)：作者把一个企业不知道自己「有多系统性」的设定塞进投资基础资产定价模型，让企业和同行一起用贝叶斯方式去「学」这个未知的风险暴露参数。结果是——贴现率会随着信念内生地起伏，从而压低投资与估值。他们在数据里检验这一连串预测，发现一个标准差的感知风险暴露上升，伴随投资下降 5.6%、托宾 Q 下降 4.6%、隐含资本成本上升 0.45%。而真正点睛的一步，是「向同行学习」。

1 一个老掉牙的失败，和一个被忽略的破绽

先说一个金融学里几乎人尽皆知的尴尬。

消费基础资产定价 (consumption-based CAPM, C-CAPM) 的逻辑干净得近乎优雅：一项资产之所以要给你风险溢价，是因为它的回报和总消费增长「同涨同跌」——当你已经过得不好（消费下滑）时，它偏偏也亏钱，这种雪上加霜才值得补偿。直觉无懈可击。可几十年的早期实证检验，却几乎都没能在数据里找到它（脚注里作者也只能援引 Lettau and Ludvigson (2001) 和 Hansen et al. (2008) 这少数几篇「找到了支持」的论文聊以自慰）。

于是大多数人把 C-CAPM 归进了「漂亮但不灵」的抽屉里。

但本文三位作者盯住了一个被几乎所有人默认、却从未被认真追问的前提：我们一直假设企业（和市场）"知道"自己对宏观风险的暴露有多大。 在标准模型里，那个把企业生产率和消费冲击绑在一起的弹性参数——记作 $b$——是一个已知常数。可现实里，有谁真的知道自己公司的生产率对总消费的敏感度是 1.5 还是 3.0？这不是一个能从财报上读出来的数字，它要从历史的共振里一点一点地猜。

接着，一个自然的问题就冒出来了：如果连企业自己都不确定 $b$ 是多少，只能边走边学，那会发生什么？

2 把「未知」写进模型：两个关键假设

作者对这个未知参数 $b$ 立了两条规矩，整篇文章都立在这两块基石上。

第一，$b$ 恒定但未知。 它不随时间变化，但没人观测得到。于是经济中的决策者只能通过贝叶斯更新 (Bayesian updating) 去学它——每多看到一年的数据，就把信念往真相挪一点。

第二，同行业的企业共享同一个 $b$。 同一个行业里的公司，对宏观风险的暴露是一样的；它们事后之所以看起来千差万别，只是因为各自踩到了不同的特异性 (idiosyncratic) 冲击。

第二条假设看似不起眼，却是整篇论文的火药。因为它意味着：你想搞清楚自己有多「系统性」，不该只盯着自己的历史，还该去看你同行的历史。 一家公司自己的生产率被特异性噪声搅得面目全非，单看自己，信噪比太低；可把整个行业的横截面摆在一起，那些独立的噪声会相互抵消，共同的那一份系统性暴露反而浮出水面。这就是后文反复强调的「向同行学习」(learning from peers)。

作者先把模型设定写清楚。总消费增长服从

$$ g_{c,t+1} = \mu + \sigma_c\,\eta_{t+1}, $$

其中 $\eta_{t+1}$ 是独立同分布的标准正态冲击。而企业 $i$ 的生产率增长，被那个未知的 $b$ 拴在同一个消费冲击 $\eta_{t+1}$ 上：

$$ g_{i,t+1} = \mu + b\,\sigma_c\,\eta_{t+1} + \sigma\,\varepsilon_{i,t+1}. $$

请注意这个写法的精巧之处：系统性的那一项 $b\,\sigma_c\,\eta_{t+1}$ 用的是和消费同一个 $\eta_{t+1}$，而 $\sigma\,\varepsilon_{i,t+1}$ 才是各家自己的命。$b$ 越大，生产率和消费的协方差越大，企业看起来就越「系统性」——在 C-CAPM 的世界里，这直接翻译成更高的风险溢价。

3 学习的机制：信念如何一步步被更新

这是本文的数学心脏，也是最值得一步步拆开看的地方。

决策者对 $b$ 抱有一个高斯先验，均值 $m_{b,0}$、标准差 $\sigma_{b,0}$。每一期，他们看到自己和同行的生产率、以及总消费增长，然后按贝叶斯法则修正信念。因为先验是高斯的、似然也是高斯的，后验始终保持正态，于是只需追踪它的均值 $m_{b,t}$ 和标准差 $\sigma_{b,t}$ 两个量。作者在附录里推出了一个漂亮的递归结构。

先看后验均值的更新。这是全文最核心的一个方程，值得把每一块拆开来读：

$$ m_{b,t} = \cssId{a1}{(1-\kappa_t \sigma_{b,t}^2)}\, \cssId{a2}{m_{b,t-1}} + \cssId{a3}{\kappa_t \sigma_{b,t}^2}\, \cssId{a4}{\hat{b}_t} $$

这个式子说的，其实是一句大白话：新信念 = 旧信念和新证据的加权平均。 而权重的奥妙全在 $\kappa_t \sigma_{b,t}^2$ 里。当你对参数越没把握（$\sigma_{b,t}$ 越大），就越愿意听新证据的；当新数据越「有信息量」（$\kappa_t$ 越大），也越该往证据那边挪。

那个信息量 $\kappa_t$ 长这样：

$$ \kappa_t = \frac{n_t\,\eta_t^2\,\sigma_c^2}{\sigma^2} \ge 0. $$

这里 $n_t$ 是本期能观测到的同行数量。看清楚——$n_t$ 在分子上。 这就是「向同行学习」的全部威力所在：同行越多，$\kappa_t$ 越大，每一期能榨出的信息越多，信念收敛得越快。一家孤零零的公司只能慢慢熬，而一个行业的横截面，能让大家在同一年里互相印证、迅速逼近真相。

至于本期证据 $\hat{b}_t$，它正是把行业内所有公司的生产率「去均值」之后，对消费冲击做的一个横截面回归估计：

$$ \hat{b}_t = \frac{\sigma_c\,\eta_t \sum_{i=1}^{n}(g_{i,t}-\mu)}{n_t\,\sigma_c^2\,\eta_t^2}. $$

而后验精度的递归更简洁，干脆就是精度的逐期累加：

$$ \frac{1}{\sigma_{b,t}^2} = \frac{1}{\sigma_{b,t-1}^2} + \kappa_t. $$

由于 $\kappa_t \ge 0$，精度只增不减——信念的方差单调收缩，时间足够长，大家终会把 $b$ 学到几乎完美。（这也是作者坦承的一个局限：因为 $b$ 被设为恒定，长期来看不确定性会消失；他们在第 5 节用一个时变的真实 $b$、配上卡尔曼滤波 (Kalman filter) 来检验，结论依旧成立。）

4 但真正关键的一步：信念怎么变成了贴现率

到这里，故事还只是统计。真正的反转，是把这套信念动态接到企业的真实决策上。

机制其实只有一句话，但需要慢慢品。当新信息到来、$m_{b,t}$ 上调，意味着「我感知到的、生产率与消费的协方差变高了」。在消费基础的定价核 (pricing kernel) 下，这个被抬高的协方差直接翻译成更高的风险溢价——哪怕真实的 $b$ 一动没动。更高的风险溢价就是更高的贴现率，而更高的贴现率会压低新投资项目的现值，于是企业减少投资、估值比率（托宾 Q）随之走低。

这就是本文反复要讲透的那个核心：不是真实风险在动，是被「学」出来的感知风险在动；它通过贴现率这个总闸，同步地拨动了投资与估值。 贴现率本就是资产定价的中枢（关于贴现率为何是这门学问的中心议题，可参见《贴现率：资产定价的中心议题》），而这篇论文给了它一个全新的、内生的驱动源——参数学习。

作者用 2006–2009 年信念变化与 2007–2010 年投资变化的行业截面来直观展示这件事。大衰退 (Great Recession) 期间消费骤降，逼出了信念的剧烈修正：那些感知风险暴露飙升的行业——邮轮、住宅建造、钢铁——投资显著塌缩；而感知风险下降的行业——高校、托育与养老、医院——反而加大了投资。一张图，把「学习如何重塑企业政策」讲得明明白白。

5 数据与检验：它真的能在现实里站住吗

光有故事不够。作者把模型预测拉到 1964–2021 年的 CRSP-Compustat 合并样本里硬碰硬地检验。

识别同行用了三套行业分类互为补充：SIC、NAICS，以及 Hoberg and Phillips (2016) 的文本相似度分类 TNIC。他们先确认了那条立模型的命脉假设——同行业的生产率确实「共振」：在各行业内部，第一主成分平均解释了 35.9% 的生产率方差。共同的那一份系统性，是真实存在的。

主回归的结果，强且符号正确：

投资率与托宾 Q 对后验均值风险暴露 $m_{b,t}$ 显著为负，达到 1% 显著性水平，且在控制了一众已知横截面变量后依然成立。
经济量级上：感知风险暴露每上升一个标准差，平均带来投资下降 5.6%、托宾 Q 下降 4.6%。
把贴现率换成两个代理变量——基于会计信息的隐含资本成本 (implied cost of capital, ICC，沿用 Hou et al. (2012) 的算法) 与已实现股票回报——同样得到正向关系：一个标准差的 $m_{b,t}$ 上升，对应年化 ICC 上升 0.45%、已实现回报上升 0.71%。

接着是全文我最欣赏的一组实验——直接拷问「向同行学习」到底重不重要。作者构造了三种替代的学习方式：(1) 只学自己的历史；(2) 学自己加上随机指派的「假同行」；(3) 只学行业同行、完全无视自己的历史。结果一针见血：前两种不含真实同行信息的方式，信念与企业变量之间的关系统统不显著；唯独第三种纯靠同行的信念，依然强力预测投资、估值与资本成本，几乎复刻了基准结果。

换句话说，信息的溢出是跨同行发生的，把同行从学习里抽掉，整个机制就熄火了。这一步，把「同行业共享 $b$」从一条方便的假设，坐实成了数据里看得见的事实。

6 结构估计：用八个矩去钉住六个参数

模型最终要用模拟矩方法 (simulated method of moments, SMM) 来量化，这一脉承自 Nikolov and Whited (2014) 与 Hennessy and Whited (2007)。生产函数是规模报酬递减的

$$ Y_{i,t} = X_{i,t}^{1-\alpha} K_{i,t}^{\alpha},\qquad 0<\alpha<1, $$

配上凸性资本调整成本和上文那套贝叶斯学习。作者要估的是六个参数（折旧率、资本份额、调整成本、特异性波动、风险暴露 $b$、定价核里的风险价格），用八个矩来识别：投资率、股票回报、托宾 Q、以及后验均值 $m_{b,t}$ 各自的均值与方差。

模型对这些矩的拟合相当漂亮：

投资率在模型与数据里都平均约 25%，标准差约 21%。
股票回报的波动，数据里是 58%，模型能给到 53%——靠的是 56% 的高折旧率、92% 的特异性波动，和一个 2.15 的调整成本参数（这意味着企业把大约 6.4% 的产出花在资本调整上）。大调整成本，正是「投资波动远小于股票回报波动」这道楔子的来源。
平均超额回报 10%，对应一个 2.35 的风险价格；平均托宾 Q 约 1.9，对应 0.75 的资本份额。

值得一提的是，相比忽略参数不确定性的既有文献（如 Nikolov and Whited (2014)），这个模型能内生地造出一个波动的托宾 Q——因为估值比率的时间变化，本质上反映的就是贴现率的时间变化，而学习恰恰为贴现率注入了波动。基准设定里每个行业取 5 家公司（贴近数据均值）；当同行增加到 10 家，回报与 Q 的波动都会下降，因为信号更多、学得更快。这条比较静态，本身就是「同行越多、学习越快」最干净的注脚。即便如此，本文模型对回报与 Q 波动的解释力，仍显著优于那些无视参数不确定性的前作。

Tip

一个容易被忽略却很关键的细节：作者在度量投资、托宾 Q 与生产率时，显式地把无形资本算了进去（沿用 Eisfeldt and Papanikolaou (2013) 与 Peters and Taylor (2017)）。在一个无形资产占比越来越高的时代，这一步让「生产率增长」的度量不至于系统性失真。

7 文献脉络

把这篇论文放回它生长的那条藤蔓上，会看得更清楚。

最早，投资基础资产定价 (investment-based asset pricing) 这一脉，从 Berk et al. (1999) 出发，经 Gomes et al. (2003)、Carlson et al. (2004)、Zhang (2005)、Kuehn and Schmid (2014) 一路推进，反复说明一件事：股票与债券回报里观察到的种种规律，都能从企业的最优投资政策里长出来。

另一条线，是参数学习 (parameter learning) 与资产定价。Pastor and Veronesi (2003)、Alti (2003) 研究的是对「生产率漂移/盈利能力」的学习；Collin-Dufresne et al. (2016) 在一般均衡里证明，对支配经济的参数的学习，会内生地造出那些原本看似谜团的资产定价规律。

第三条线，是消费现金流贝塔。Bansal et al. (2005)、Da (2009)、Boguth and Kuehn (2013) 揭示，横截面预期回报的离散，根源在于消费增长与证券现金流的协同。

本文的位置，恰好在这三条线的交汇处：它借用投资基础模型的骨架，把消费现金流贝塔重铸成一个贝叶斯学习出来的对象，再用一个其他人没怎么碰过的维度——横截面的同行学习——把信息溢出做实。这一点上，它和 Foucault and Fresard (2014)「企业从同行股价里学习」遥相呼应，但走的是另一条路：后者靠的是投资者的私有信息与相关需求，而本文不需要任何私有信息，纯靠「同行业共享风险暴露」这条新古典的逻辑，就把同行学习给理性化了。

评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：这和过去那些"现金流贝塔"（如 Da 2009）到底差在哪？

差在贝塔是怎么来的。过去的现金流贝塔是一个（大体）固定的、用历史回归估出来的暴露。本文的贝塔是信念——它会随着每一期新数据被贝叶斯更新，因而内生地随时间起伏，而且这份起伏靠的是行业横截面而非单家公司的时间序列。是「学出来的、会动的贝塔」。

Q：真实风险暴露明明没变，凭什么投资和估值会动？这不是无中生有吗？

动的不是真实风险，是感知风险。在消费定价核下，决策者相信的协方差变了，风险溢价（即贴现率）就跟着变，真实现金流贴现回来的现值自然变。这恰恰是本文最反直觉、也最有意思的地方：一个恒定的参数，照样能通过「学习」制造出贴现率与估值的时间变化。

Q："同行业共享同一个 b"这个假设，会不会太强？

它确实是核心假设，但作者没让它停在纸面上。一是直接证据：行业内第一主成分解释了 35.9% 的生产率方差，共性真实存在。二是那组三选一的学习实验：只有含真实同行的信念能预测企业变量，随机假同行和纯自学都失效——反过来佐证了「同行确实共享某种东西」。

Q：信念的方差单调收缩，岂不是说学久了不确定性就归零、机制就失效了？

在基准设定（$b$ 恒定）里确实如此，这是作者自己承认的局限。但第 5 节把真实 $b$ 改成一个 AR 过程、用卡尔曼滤波重估，聚焦于「系统性风险无条件均值」这个天然恒定的对象，主要结论依然成立。所以机制不靠「永远学不完」来续命。

Q：会不会其实是对"漂移/盈利能力"的学习在起作用，而不是对"风险暴露"的学习？

这是最该担心的混淆。作者专门扩展模型，让决策者同时学漂移和风险暴露。结果是：关于漂移的信念确实预测企业变量（和前人一致），但在控制了漂移学习之后，风险暴露信念依然是强预测变量。两条腿都站得住。

Q：这些回归会不会只是"虚假回归"（spurious regression）？

这是金融实证的老雷区（Ferson et al. (2003) 就警告过）。本文的一道防线是：回归系数并未被纳入 SMM 的估计目标，但结构模型却能定量地复现出投资、Q 对信念的负向响应、以及资本成本的正向响应——一个没拿这些系数去拟合的模型却能生成它们，比单纯一条显著的 t 值更难用「偶然」来解释。

(b) 几个可能的研究问题与提案

1. 把「学习出来的风险暴露」搬到公司债与信用利差上

【经济故事】本文的贴现率只作用在股权估值上。但如果一个行业被「学」得越来越系统性，它的违约风险溢价、信用利差是不是也该同步走阔？Kuehn and Schmid (2014) 本就是投资基础的公司债定价，把贝叶斯学习的 $m_{b,t}$ 接进去，可以检验感知风险暴露上升是否预测信用利差扩大。【可行性】中。数据齐备（TRACE + Compustat + 本文的信念估计可复刻），识别上要小心把「漂移学习」和「真实信用基本面」剥离干净，但思路自然、doable。

2. 外资持有人会改变一个行业的「被学习速度」吗

【经济故事】本文的信息量 $\kappa_t$ 由可观测同行数 $n_t$ 驱动。如果一个行业里有更多跨境的、信息处理更强的外资机构投资者，是否相当于增加了有效的「同行信号」、让信念收敛更快、贴现率反应更灵敏？【可行性】中偏低。需要 FactSet/13F 级别的持有人数据并构造行业层面的外资暴露，识别要靠指数纳入之类的外生冲击，挑战在于把「学习速度」与「资金流压力」区分开，但方向有意思。

3. 流动性是不是另一条"被学习的贴现率"通道

【经济故事】本文把感知风险暴露映射到贴现率。一个平行的问题是：当一个行业被感知为更系统性时，它的股票/债券流动性是否同步恶化（做市商也在「学」这份暴露）？这会给贴现率叠加一个流动性溢价的放大器。【可行性】中。可用 bid-ask spread、Amihud 非流动性等指标，配合本文信念变量做面板回归，识别难点在于流动性与风险暴露的内生同移，需要工具或事件冲击。

4. 大衰退之外：用每一次"消费骤变"做事件研究

【经济故事】作者用大衰退作为信念剧烈修正的窗口。能否系统化地把每一次总消费的大幅意外（如 2020 疫情）当作准自然实验，检验「感知风险暴露跳变 → 投资塌缩」的因果链是否稳健？【可行性】高。数据现成，事件定义清晰，是本文图 1 思路的自然推广，最容易上手。

我的判断

贡献。 这篇论文真正漂亮的地方，不在于又估了一个投资基础模型，而在于它给「C-CAPM 为什么失灵」提供了一个建设性的、可检验的重写：也许问题从来不是消费风险不重要，而是我们（和企业自己）根本不知道自己有多暴露，只能边走边学；而这份「学」本身，就会通过贴现率内生地搅动投资与估值。把消费现金流贝塔重铸为一个贝叶斯信念、再用「横截面同行学习」把信息溢出做实，这两步都很扎实。那组「三选一学习实验」尤其有说服力——它把一个本可以停留在假设层面的东西，逼到了数据面前。

对识别的担忧。 我最在意两点。其一，$m_{b,t}$ 本身是模型估出来的、依赖一整套参数与行业分类的构造物，它和真实风险基本面之间的边界，终究比一个外生工具要模糊；作者用「控制漂移学习」「随机假同行」等做了大量防守，但回归终究是相关性叙事，而非干净的因果。其二，行业分类的选择（SIC/NAICS/TNIC）对「谁是同行」至关重要，而文献（如 Kahle and Walking (1996)）早就指出分类口径会实质影响结果——三套分类的一致性是个安慰，但同行的「真实边界」仍是这套机制的阿喀琉斯之踵。

后续想看到什么。 我最想看的，是把这个机制推到信用市场和外资持有人那两个方向去——尤其是：如果一个行业的「被学习速度」真的取决于它的投资者构成，那么资产价格对宏观冲击的反应快慢，就不只是基本面的事，而是信息结构的事。这会把「学习」从一个估值故事，升级成一个关于市场为何有时反应过度、有时又麻木迟钝的更普遍的解释。

参考文献

Berk, J.B., Green, R.C., Naik, V. (1999). Optimal investment, growth options, and security returns. Journal of Finance 54, 1553–1607.
Bansal, R., Dittmar, R.F., Lundblad, C.T. (2005). Consumption, dividends, and the cross section of equity returns. Journal of Finance 60, 1639–1672.
Pastor, L., Veronesi, P. (2003). Stock valuation and learning about profitability. Journal of Finance 58, 1749–1789.
Da, Z. (2009). Cash flow, consumption risk, and the cross-section of stock returns. Journal of Finance 64, 923–956.
Boguth, O., Kuehn, L.A. (2013). Consumption volatility risk. Journal of Finance 68, 2589–2615.
Foucault, T., Fresard, L. (2014). Learning from peers' stock prices and corporate investment. Journal of Financial Economics 111, 554–577.
Kuehn, L.A., Schmid, L. (2014). Investment-based corporate bond pricing. Journal of Finance 69, 2741–2776.
Nikolov, B., Whited, T.M. (2014). Agency conflicts and cash: estimates from a dynamic model. Journal of Finance 69, 1883–1921.
Collin-Dufresne, P., Johannes, M., Lochstoer, L.A. (2016). Parameter learning in general equilibrium: the asset pricing implications. American Economic Review 106, 664–698.
Peters, R.H., Taylor, L.A. (2017). Intangible capital and the investment-q relation. Journal of Financial Economics 123, 251–272.
Lettau, M., Ludvigson, S. (2001). Resurrecting the (C)CAPM: a cross-sectional test when risk premia are time-varying. Journal of Political Economy 109, 1238–1287.