市场会涨还是会跌？别盯着波动率，去看股票们「有多齐心」

[2010 JFE] Average Correlation and Stock Market Returns

Jun He June 01, 2026

资产定价收益可预测性波动率 Roll 批判

Note

本文读的是 Pollet & Wilson (2010, Journal of Financial Economics)：股票市场的方差几乎可以分解成「平均方差 × 平均相关性」两块，而真正能预测下一季度市场超额收益的，不是大家盯了几十年的市场方差，也不是平均方差，而是股票之间的平均相关性——相关性越高，未来市场回报越高；平均方差则零、甚至负相关。

1 一个困扰了金融学三十年的「应该」

任何一个均衡金融理论的核心，都绕不开一句几乎像信条一样的话：风险越大，要求的回报越高。从总量的角度看，系统性风险一旦上升，厌恶风险的投资者就会索要更高的风险溢价，于是均衡预期收益必须上涨。把这句话写成方程，就是那个被无数论文反复检验的「方差-均值关系」(variance-in-mean relation)：

$$ r_{m,t+1} - r_{f,t+1} = b_0 + b_1 \mathrm{Var}_t[r_{m,t+1}] + \lambda x_t + e_{t+1} $$

理论说 $b_1 > 0$：市场的条件方差越大，下一期的超额收益应该越高。

听上去天经地义。可问题在于——数据偏偏不答应。

从 Campbell (1987)、French, Schwert, and Stambaugh (1987)，到 Glosten, Jagannathan, and Runkle (1993)，再到 Harvey (2001)，一大批顶尖的实证研究花了几十年想把这个「正的」方差-均值关系从数据里挖出来，结果却乏善可陈。French 等人用 GARCH 框架在月度数据里找到了正关系，但统计上只是勉强显著；而 Campbell (1987) 用 GMM 估计，找到的甚至是一个显著为负的线性关系。

这就尴尬了。一个理论上「应该成立」的关系，在数据里要么微弱、要么干脆反号。是理论错了，还是我们量错了东西？

Tip

这篇论文的全部魅力，就藏在「我们量错了东西」这个判断里。而要看清它错在哪，得先请出一位四十多年前就埋下伏笔的老朋友——Roll。

2 Roll 批判：你以为你在测「市场」，其实没有

1977 年，Roll 写下了那篇对 CAPM 实证检验的著名批判。它通常出现在 CAPM 的横截面检验语境里：真正的「总财富组合」(aggregate wealth portfolio) 是观测不到的，我们手里的股票指数只是它的一个子集，所以任何用股指代替市场组合的检验，检验的都不是 CAPM 本身。

Pollet 和 Wilson 的第一个洞见是：Roll 批判同样适用于时间序列上的方差-均值检验。

道理是这样的。如果可观测的资产组合（股票）恰好就是总财富，那么总风险就等于股市风险，股市方差直接可观测，方差-均值关系也就名正言顺。可一旦股票只是总财富的一部分，麻烦就来了——

大部分股市方差的变动，可能来自那些与总财富回报正交的成分（持有总风险不变）。

换句话说，股市方差里混进了大量「与真正的系统性风险无关」的噪音。当股市方差上升时，如果总风险其实没变，那它必然伴随着「股市与总财富其余部分协方差」的反向调整。于是，盯着一个被污染的股市方差去预测收益，自然会失灵。

接着，一个自然的问题是：既然方差被污染了，有没有什么量能更干净地透露出真正的总风险变化？

作者的答案是：股票之间的相关性。

逻辑非常优雅。总财富组合的回报，是绝大多数资产回报里的一个共同成分（平均而言与个股回报正相关）。当真正的总风险上升时，在其他条件不变的情况下，股价就会更倾向于一起动——也就是说，相关性上升揭示了总风险上升。如果股市风险溢价正向依赖于总风险，那么股票间的平均相关性就应该能预测未来的市场超额收益。

这就是全文要反复讲透的那一个核心。

3 一个被刻意简化的模型：把方差拆成两半

作者搭了一个极简但极有说服力的模型，把上面的直觉变成可检验的方程。我们一步步来看，因为每一步都恰好回答了「为什么是相关性、而不是方差」这个问题。

第一步：对数 CAPM 成立。 借用 Campbell and Viceira (2002) 的设定，资产回报条件联合对数正态，幂效用投资者的最优持仓给出（对资产 $i$，调整 Jensen 不等式后）：

$$ E_t[r_{i,t+1}] - r_{f,t+1} + \frac{\sigma^2_{i,t}}{2} \approx \gamma\, \sigma_{im,t} $$

也就是说，资产 $i$ 的预期超额（对数）收益，正比于它与真实市场组合 $m$ 回报的条件协方差 $\sigma_{im,t}$，$\gamma$ 是相对风险厌恶系数。

第二步：构造 $N$ 只对称股票。 设有 $N$ 只对称股票（$N$ 很大），每只股票的回报由一个共同的市场成分和一个特质成分组成。冲击中含一个方差为 $\theta_t \sigma^2_{z,t}$ 的共同股市成分 $e_{z,t+1}$，以及方差为 $(1-\theta_t)\sigma^2_{z,t}$ 的正交特质成分 $e_{i,t+1}$：

$$ R_{i,t+1} = \beta_t R_{m,t+1} + e_{z,t+1} + e_{i,t+1} $$

把个股加总，特质成分在大样本下被抹平，于是整个股市的回报可以写成：

$$ R_{s,t+1} = \beta_t R_{m,t+1} + e_{z,t+1} $$

第三步——也是最关键的一步：方差与协方差。 任意个股的方差、以及任意两股的协方差（在 $N$ 很大时即为股市方差）分别是：

$$ \sigma^2_t = \beta_t^2 \sigma^2_{m,t} + \sigma^2_{z,t}, \qquad \sigma^2_{s,t} \approx \rho_t\, \sigma^2_t = \beta_t^2 \sigma^2_{m,t} + \theta_t \sigma^2_{z,t} $$

请盯住这两行。左边的 $\sigma^2_t$ 是平均方差（单只股票的方差），右边的 $\sigma^2_{s,t} = \rho_t \sigma^2_t$ 是股市方差，$\rho_t$ 就是平均相关性。两者之差，恰恰是 $\sigma^2_{z,t}$ 里那块「与总风险正交、被 $(1-\theta_t)$ 加权」的特质性波动。

于是反转出现了。 整理上面两式，把股市风险溢价写出来，就得到模型的核心表达（式 6）：

$$ E_t[r_{s,t+1}] - r_{f,t+1} + \frac{\rho_t\sigma^2_t}{2} = \frac{\gamma}{\beta_t(1-\theta_t)}\,\rho_t\sigma^2_t \;-\; \frac{\gamma}{\beta_t(1-\theta_t)}\,\theta_t\sigma^2_t $$

这个式子在说：股市风险溢价线性地依赖于股市方差 $\rho_t\sigma^2_t$，再减去股市方差里那块与总风险无关的部分 $\theta_t\sigma^2_t$。

接下来对它在 $E[\rho_t]$ 与 $E[\sigma^2_t]$ 附近做线性近似（令 $\beta_t=\beta$、$\theta_t=\theta$ 为参数），就得到了真正能拿去跑回归的式 (7)：

$$ E_t[r_{s,t+1}] - r_{f,t+1} \approx \phi_0 + \cssId{a1}{\left(\frac{\gamma E[\sigma^2]}{\beta(1-\theta)} - \frac{E[\sigma^2]}{2}\right)} \cssId{a2}{\rho_t} + \cssId{a3}{\left(\frac{\gamma(E[\rho]-\theta)}{\beta(1-\theta)} - \frac{1}{2}\right)} \cssId{a4}{\sigma^2_t} $$

直觉是什么？只要 $E[\rho_t]$ 接近 $\theta$，平均相关性的系数为正，而平均方差的系数为负。因为已实现的股市收益里有很大一块与总财富回报无关——而平均方差正是股市方差里那块「无关噪音」的主力。这就一举解释了那个困扰了三十年的谜题：

Warning

股市方差之所以预测能力疲软，不是因为风险-收益关系不存在，而是因为股市方差 = 平均相关性 × 平均方差，其中平均相关性这块「有用信号」被平均方差这块「无关噪音」给稀释、污染了。把两块拆开，信号自然就显形了。

4 识别策略：怎么把这两块量出来

理论说股市方差近似等于「平均相关性 × 平均方差」，作者用一个干净的恒等式把它落地。把股市方差写成所有股票对的加权和并展开，可以证明（式 10）：

$$ \sigma^2_{s,t} = \sigma^2_t \sum_{j=1}^{N}\sum_{k=1}^{N} w_{j,t} w_{k,t}\, \rho_{jk,t} = \sigma^2_t\, \rho_t $$

也就是：股市方差 ≈ 价值加权的平均方差 × 价值加权的平均相关性。作者随后证明，这个近似几乎捕捉了股市方差全部的时间序列变动。

具体怎么估？每个季度 $t$，从 CRSP 中按市值取最大的 500 只股票，用季度内的日度收益直接算两个量：

$$ AV_t = \sum_{j=1}^{500} w_{j,t}\,\hat\sigma^2_{j,t}, \qquad AC_t = \sum_{j=1}^{500}\sum_{k\neq j} w_{j,t} w_{k,t}\, \hat\rho_{jk,t} $$

$AV_t$ 是平均方差，$AC_t$ 是平均相关性，权重都用季末市值。再用 CRSP 价值加权指数的日度收益估出股市方差 $\hat\sigma^2_{s,t}$，于是有验证性回归（式 14）：

$$ \hat\sigma^2_{s,t} = b_0 + b_1\,(AV_t \cdot AC_t) + u_t $$

注意作者很坦诚地说，$b_1$ 未必等于 1，因为 (i) $AC_t$ 里剔除了权重平方项，(ii) $AV_t$、$AC_t$ 都有测量误差，(iii) CRSP 指数与「500 大股票组合」在成分上有差异。但实证上这个乘积几乎吃掉了股市方差的全部时间序列变动——这正是「分解成立」的硬证据。

预测回归这边，被解释变量是 CRSP 价值加权组合的季度对数超额收益（也用 S&P 500 做稳健性，因为它较少受小盘股流动性污染），解释变量是 $AC_t$ 与 $AV_t$，并控制 cay（Lettau and Ludvigson, 2001）、pd（对数价格-股利比）、rf（三个月期 T-bill 对数收益）、GARCH(1,1) 条件方差等。

5 数据与那张会说话的相关系数矩阵

样本是 CRSP 全样本里按市值最大的 500 只交易所股票，1963Q1 到 2006Q4，季度频率，日度方差/协方差再乘以 63（一个季度的平均交易日数）以对齐到季度尺度。

几个关键数字值得记住。平均相关性 $AC$ 的均值是 0.237，标准差 0.093；平均方差 $AV$ 的均值是 2.217%，而股市方差的均值只有 0.482%——后者低得不奇怪，因为它已经被分散化「打薄」了。平均方差的波动是股市方差的三倍。$AC$ 与 $AV$ 之间是较弱的正相关，0.312。

但真正点睛的是相关系数矩阵里那一行：季度超额收益 $r^e_{CRSP}$ 与各变量的当期相关。

与平均相关性：−0.293
与平均方差：−0.275
与股市方差：−0.422
与 GARCH(1,1)：−0.302

注意这是同期相关，全是负的——这其实正是「波动率反馈」(volatility feedback) 的影子：相关性突然走高的当下，折现率上升、价格立刻下跌（已实现负收益）。可一旦把目光移到下一季度的预测上，平均相关性就翻成了正向预测变量。这个「同期为负、领先为正」的对照，是全文叙事的关键支点。

6 主要结果：相关性赢，方差出局

把模型的预言拿去对数据，结论干净得几乎不像实证文章：

股市方差 ≈ 平均相关性 × 平均方差 这个分解，几乎完整地捕捉了美国股市日度超额收益样本方差的全部变动。两块拼起来，就是整个市场方差。
这两块里，平均相关性强烈地正向预测未来的市场超额收益，而平均方差几乎没有任何可辨识的预测力。于是「股市方差预测能力弱」这件事被彻底说清了：它弱，是因为有用的相关性信号被无用的平均方差给污染了。
平均相关性的样本外 $R^2$ 超过 3%，因此通过了 Goyal and Welch (2008) 那道以严苛著称的样本外检验。（关于样本外可预测性这场旷日持久的争论，可参见《风险溢价，是「消失」了，还是「断」掉了？》。）
控制住平均相关性之后，平均方差与未来市场收益甚至呈负相关（虽不显著）。这一点上，本文与 Bali, Cakici, Yan, and Zhang (2005) 一致，而与 Goyal and Santa-Clara (2003) 相左——后者声称平均方差有正向预测力，但 Bali 等人指出，一旦剔除 Nasdaq、Amex 股票，或改用价值加权/中位数方差，这种预测力就消失了。

Note

顺带一提，本文还顺手解释了一个看似无关的现象——非对称相关性 (asymmetric correlation)：股市下跌时股票相关性更高（Longin and Solnik, 2001；Ang and Chen, 2002；Hong, Tu, and Zhou, 2007）。作者的解释是：相关性上升若源于总风险上升，折现率随之抬高，按 Campbell and Hentschel (1992) 的波动率反馈逻辑，当期会出现平均负收益。所以非对称相关性，其实是「总财富波动率」涨落引发的波动率反馈，而非股市波动率本身的变化。同样的机制还呼应了 Driessen, Maenhout, and Vilkov (2009) 的发现——为什么期权市场里相关性风险被定价、个股波动率风险却不被定价。

这种「把市场层面的某个高阶矩，拆成横截面上的某种平均量，再用它预测大盘」的思路，近年并不孤单。一个直系的近亲，是用全体股票收益的横截面偏度去预测市场方向（见《市场的下一步，藏在一万只股票的「歪斜」里》）；而本文挑战的「市场组合其实只是一小撮巨头」这一 Roll 式命题，也可与《两种市场收益的故事》对照着读。

7 文献脉络

把这条线索捋直，故事其实很清楚。

源头是 Merton (1973) 的跨期 CAPM——它给「风险越大、回报越高」的方差-均值关系提供了理论根基。可就在四年后，Roll (1977) 抛出了那记重锤：真正的市场组合观测不到，所有用股指代替它的检验都站不住脚。

接着，是一整代人前赴后继地想在数据里坐实那个正向的方差-均值关系：French, Schwert, and Stambaugh (1987) 用 GARCH 找到了勉强显著的正关系，Campbell (1987) 却找到了负关系，Glosten, Jagannathan, and Runkle (1993) 进一步发现条件方差与收益的关系敏感而脆弱。证据越积越多，结论却越来越模糊。

然后，争论的焦点转向了「特质波动率/平均方差到底有没有用」：Goyal and Santa-Clara (2003) 说平均方差能预测大盘，Bali, Cakici, Yan, and Zhang (2005) 紧接着说这结论经不起样本和加权方式的推敲，Ghysels, Santa-Clara, and Valkanov (2005) 又用 MIDAS 宣称「风险-收益权衡终究是存在的」。

但真正关键的一步，是 Pollet and Wilson (2010) 把 Roll 批判搬进了时间序列：既然股市方差是被污染的代理变量，那就别再纠结它整体上是正是负，而是把它拆开——平均相关性才是透露真实总风险的那扇窗，平均方差不过是稀释信号的噪音。这条线索从此有了一个清晰的落点。

8 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：平均相关性和平均方差，到底哪个才是「股市波动率」？

都不是、又都是。股市方差 $\approx \rho_t \times \sigma^2_t$，是两者的乘积。平均方差 $\sigma^2_t$ 量的是单只股票自己抖得多厉害（含大量特质噪音），平均相关性 $\rho_t$ 量的是股票们「有多齐心」。本文的全部主张就是：只有后者干净地反映总风险，所以只有它能预测收益。

Q：相关性预测收益，会不会只是「相关性高的时候恰好市场刚跌完、于是反弹」这种机械的均值回归？

作者对此是有防御的。同期相关性与收益是负的（−0.293），但领先一期的预测系数是正的，而且控制了 cay、pd、rf、GARCH 等已知预测变量后依然站得住，样本外 $R^2$ 还超过 3%。这说明它不是简单的当期反弹，而是携带了关于未来风险溢价的信息。

Q：为什么用「最大的 500 只股票」而不是全市场？

一是计算所有股票对的相关性在大 $N$ 下不现实，500 只足以逼近；二是大盘股较少受小盘股流动性、买卖价差污染（这也是作者额外用 S&P 500 做稳健性的理由）。Brown and Kapadia (2007) 还指出，等权平均方差会被「新上市公司比例」带偏，所以本文坚持用价值加权，规避了这个陷阱。

Q：这和「特质波动率能不能预测收益」那场 Goyal–Santa-Clara 之争是什么关系？

本文站在 Bali 等人一边：Goyal and Santa-Clara (2003) 看到的平均方差预测力，主要是 $AV$ 里混入了 $AC$ 的成分（因为股市方差是两者乘积）。一旦把相关性单拎出来控制住，平均方差自己的预测力就归零甚至转负。所以那场争论，本质上是没有把两块拆开。

Q：模型假设股票「对称」，现实里股票千差万别，结论还成立吗？

对称只是为了把代数写干净、把直觉讲透。真正落地的恒等式（式 10）并不要求对称——它对任意权重、任意相关性结构都成立，作者还明说「结论不依赖于计算 $\sigma^2_t$ 所用的加权方案」。模型的对称假设负责讲故事，分解恒等式负责扛实证。

Q：既然相关性这么管用，为什么 GARCH 这类条件方差模型抓不到它？

因为 GARCH 建模的是股市方差本身，而股市方差被平均方差主导、被特质噪音污染。哪怕你把股市方差预测得再准（论文还指出，传统估计量预测已实现股市方差的 $R^2$ 反而比 MIDAS 更高），只要这个被预测的对象本身信号含量低，对收益的预测就无济于事。

(b) 几个可能的研究问题与提案

公司债市场的「平均相关性」能否预测信用利差？
【经济故事】股票里相关性揭示总风险，债券同理：当违约风险的共同成分上升，发行人信用利差会更「齐步走」。若平均相关性领先于信用利差或债券超额收益，机制与本文同源。
【可行性】中。所需数据：TRACE 日度成交价构造债券收益、按发行人/评级算两两相关。难点在于公司债日内成交稀疏、价格离散，相关性估计噪音大；需借助流动性较好的大发行人子样本，识别上偏关联性证据而非干净因果。
外资持有人份额是否系统性地抬高了一国股市的平均相关性？
【经济故事】外资在风险冲击下常同步进出（共同的全球折现率冲击），若外资份额高的市场平均相关性更易被全球因子推动，则本文的「相关性揭示总风险」可以拆出一条「全球 vs 本地」的维度。
【可行性】中。数据：跨国持股（如 FactSet/EPFR）+ 各国指数成分日度收益。识别可借助指数纳入等准外生的可投资度变化做差分；挑战是把全球共同冲击与本地总风险分离开。
平均相关性的预测力，是否集中在「中介/做市商资本紧张」的时段？
【经济故事】若相关性上升反映的是总风险，而总风险又与中介约束相关，那么相关性的预测系数应在中介杠杆紧张时更陡。这能把本文与中介资产定价缝在一起。
【可行性】高。数据现成：本文的 $AC_t$ 序列 + 既有的中介资本比率指标，做交互项回归即可。属于增量、可直接上手的实证延伸。
把平均相关性做成实时（intraday/高频）信号，看它对短期市场反转的领先性。
【经济故事】本文是季度频率，但波动率反馈是即时的。若用高频日内相关性构造信号，或许能更早捕捉折现率冲击。
【可行性】中高。数据：TAQ 高频成交。难点是高频相关性的微观结构噪音（异步交易、价差），需用合适的高频协方差估计量（如 realized correlation 的去噪版本）。

9 参考文献

这篇论文最漂亮的地方，是把一个看似纯实证的老谜题（方差为何预测不了收益），用一个三行就能写完的分解恒等式 $\sigma^2_{s,t}=\rho_t\sigma^2_t$ 给彻底说穿了——信号和噪音原本就被乘在一起，难怪谁也单独看不清。贡献是双重的：既给出了一个稳健、能过样本外检验的新预测变量（平均相关性），又用 Roll 批判统一解释了为什么市场方差、平均方差都不行，还顺带收编了非对称相关性和相关性风险定价两个旁支现象。

对识别的担忧主要有三点：其一，预测回归天然有 Stambaugh (1999) 式的小样本偏误，持续性强的预测变量（$AC$ 一阶自相关 0.579）会让系数有限样本里偏置，论文若对此的处理不够充分，正向预测力的统计强度要打个折扣；其二，500 大股票的选择虽规避了流动性污染，但也意味着结论是对「大盘相关性」而非全市场而言；其三，模型把 $\beta$、$\theta$ 当常数做线性近似，而这两个参数本身很可能随状态变化（衰退期 $\theta$ 是否更高？），这会反过来影响系数符号的稳健性。

后续我最想看到的，是把这个「相关性揭示总风险」的框架，从美股搬到公司债与外资持有两个我更关心的场域：在信用市场里，平均相关性会不会比信用利差的波动率更早预警违约潮？在跨国市场里，外资份额是不是平均相关性被全球因子主导的「放大器」？这两条都既有干净的经济故事，又有可得的数据，值得一试。

Campbell, J.Y., 1987. Stock returns and the term structure. Journal of Financial Economics 18(2), 373–399.
Campbell, J.Y., Hentschel, L., 1992. No news is good news: An asymmetric model of changing volatility in stock returns. Journal of Financial Economics 31(3), 281–318.
Campbell, J.Y., Viceira, L.M., 2002. Strategic Asset Allocation. Oxford University Press.
Bali, T.G., Cakici, N., Yan, X., Zhang, Z., 2005. Does idiosyncratic risk really matter? Journal of Finance 60(2), 905–929.
Driessen, J., Maenhout, P.J., Vilkov, G., 2009. The price of correlation risk: Evidence from equity options. Journal of Finance 64(3), 1377–1406.
French, K.R., Schwert, G.W., Stambaugh, R.F., 1987. Expected stock returns and volatility. Journal of Financial Economics 19(1), 3–29.
Ghysels, E., Santa-Clara, P., Valkanov, R., 2005. There is a risk-return trade-off after all. Journal of Financial Economics 76(3), 509–548.
Glosten, L.R., Jagannathan, R., Runkle, D.E., 1993. On the relation between the expected value and the volatility of the nominal excess return on stocks. Journal of Finance 48(5), 1779–1801.
Goyal, A., Santa-Clara, P., 2003. Idiosyncratic risk matters! Journal of Finance 58(3), 975–1007.
Goyal, A., Welch, I., 2008. A comprehensive look at the empirical performance of equity premium prediction. Review of Financial Studies 21(4), 1455–1508.
Merton, R.C., 1973. An intertemporal capital asset pricing model. Econometrica 41(5), 867–887.
Pollet, J.M., Wilson, M., 2010. Average correlation and stock market returns. Journal of Financial Economics 96(3), 364–380.
Roll, R., 1977. A critique of the asset pricing theory's tests. Journal of Financial Economics 4(2), 129–176.
Stambaugh, R.F., 1999. Predictive regressions. Journal of Financial Economics 54(3), 375–421.