强邻、弱邻，和你站的位置：被「折叠」起来的同行效应

[2026 JFE] Dual Peer Effects and Cross-stock Predictability

Doron Avramov, Shuyi Ge, Shaoran Li, Oliver Linton

Jun He May 31, 2026

资产定价横截面预测同行效应机器学习

Note

本文读的是 Avramov, Ge, Li & Linton (2026, Journal of Financial Economics)：作者把一家公司的每一个特征都拆成「同行群体的均值」和「公司相对同行的偏离」两束，再用 ridge 回归把它们压成一个 同行指数（Peer Index, PI）。这个指数预测未来收益与盈余惊喜，而且——这是全文最硬的一击——把它放进横截面回归后，动量、行业动量等四个老牌异象统统变得不显著，PI 自己却扛着 t = 5.71 屹立不倒。更妙的是，它捕捉的并不是「公司自己的可预测性」，因为连梯度提升树、随机森林、神经网络都拿不走它的信息。

1 一个被「折叠」起来的限制条件

横截面资产定价研究了几十年，主线一直没怎么变：用一家公司自己的特征，去预测它自己未来的收益。账面市值比、动量、盈利能力——我们把它们塞进 Fama–MacBeth 回归，看哪个系数还活着。这套范式如此根深蒂固，以至于我们几乎忘了问一个更朴素的问题：一家公司未来的收益，真的只跟它自己的财务报表有关吗？

显然不是。公司不是孤岛，它生活在一张由同行、上下游、共同分析师织成的网里。一个自然的想法是：别人的特征，能不能预测我的收益？这就是近年被 Kelly et al. (2023) 系统化的跨股票可预测性（cross-stock predictability）。潜力很大，但一直没被充分挖掘。

本文的切入点极其精巧，精巧到几乎让人拍案。先看那个最熟悉不过的回归——用滞后收益 r_{i,t} 预测未来收益 r_{i,t+1}：

$$ r_{i,t+1} = x_{s,i,t}\,\beta + \epsilon_{i,t+1}. $$

接着，一个自然的动作是：把任意一个特征 x_{s,i,t}，按「同行群体 g_i」拆成两块——一块是剔除自己之后的同行均值（leave-one-out peer average），一块是公司相对同行的偏离（within-peer deviation）：

$$ z_{s,i,t} \equiv \frac{1}{|g_i|}\sum_{j\in g_i} x_{s,j,t}, \qquad \tilde{x}_{s,i,t} \equiv x_{s,i,t} - z_{s,i,t}. $$

代回原回归，就得到：

$$ r_{i,t+1} = z_{s,i,t}\,\beta + \tilde{x}_{s,i,t}\,\beta + \epsilon_{i,t+1}. $$

请盯住这个式子看三秒钟。它本身没有引入任何新信息——它只是把 x 拆成两半再拼回去。但它揭穿了一件我们一直默认、却从未质疑的事：标准的「公司自己」回归，强行把同行均值的系数和组内偏离的系数绑成了同一个 β。

可凭什么它们要相等？想想看：一个月的过去收益，行业均值那一块带着正号（这就是行业动量），而组内偏离那一块带着负号（这就是行业内、跨股票的短期反转）。同一个 β 怎么可能同时装下一正一负两种力量？于是真正关键的一步出现了——松开这个限制，让两束各走各的系数。作者把这称为 双重效应（dual effects）。

2 把同行效应拆成两束：识别策略

松开限制只是直觉，能不能站得住要靠数据说话。作者把上面的单特征写法推广到全部 S = 130 个特征的多元版本，这就是全文的中心方程：

$$ r_{i,t+1} = \cssId{a1}{\boldsymbol{z}_{i,t}'\,\boldsymbol{\beta}_{z}} + \cssId{a2}{\tilde{\boldsymbol{x}}_{i,t}'\,\boldsymbol{\beta}_{\tilde{x}}} + \cssId{a3}{\epsilon_{i,t+1}} $$

有了它，「两束系数是否相等」就成了一个干净的统计假设：$H_0:\ \boldsymbol{\beta}_z = \boldsymbol{\beta}_{\tilde{x}}$。

然后，作者用 2 位数 SIC 行业作为同行集合，对这 130 个特征做 F 检验。结果是 F = 29.91，在 1% 水平上把「两束相等」摁死。不止整体——把 130 个特征拆进 13 个类别（Accruals、Momentum、Quality、Value……）逐组再检验，每一组的 F 统计量都落在 7.75 到 270.70 之间，无一例外地拒绝相等。

这就是「双重效应」最朴素也最有力的证据：把特征拆成「同行均值」和「组内偏离」两束，确实挖出了公司自己信号里看不到的、系统性的跨股票结构。问题只剩一个：130 个特征 × 2 束 = 260 个预测变量，维度太高、信噪比太低，直接跑回归会过拟合到没法看。怎么办？

3 同行指数是怎么炼成的

答案是收缩。作者用 ridge 回归——在「弱信号、强噪声」的高维环境里，ridge 早就被证明是把许多微弱信号攒成一个有用预测的利器（这一点，可参见《压缩横截面：因子动物园的尽头，不是更少的因子，而是更聪明的收缩》）。

具体做法是扩张窗口（expanding window）+ 每月 3 折交叉验证选惩罚系数，把 260 个变量的拟合值压成一个数：这就是 同行指数（Peer Index, PI）。它本质上是一个「样本外、无前视偏差」的一步向前预期收益——这种造法早被 Haugen & Baker (1996) 叫作「projected return」、被 Huang et al. (2019) 叫作「fundamental implied return」。

有意思的是 PI 的成分构成。它和任何单个特征的相关系数都不高，最高的也不过 0.217（对应 mispricing_perf）——说明 PI 的预测力来自广度，而不是被某一个明星特征绑架。系数最大的变量里，既有「Low Risk」类的零交易天数，也有动量类的同行均值过去 1 个月收益（ret_1_0，正是行业动量），还有 Quality、Value、Profitability 的一票成员。换句话说，PI 是把一张网里的弱信号，编织成了一根结实的绳。

4 PI 能预测什么

接下来是检验真章的时刻。把 PI 放进市值加权的横截面回归（这是 Hou et al. (2020)、Green et al. (2017) 力推的现代标准，专治微盘股放大效应），会发生什么？

答案相当戏剧化：四个老牌的「过去收益 / 行业」类异象——统统变得不显著，而 PI 自己扛着 t = 5.71 纹丝不动。它的预测力还经得起折腾：剔除微盘股、只看近年样本、区分市场收缩与扩张状态，都活得很好。

而且 PI 的射程不止于短期。在三年的长视野上，PI 的斜率系数（×100）等于 8.16，t = 2.57——长期预测力依然显著。

组合检验同样硬气。市值加权的「最高五分位减最低五分位」组合，月度超额收益 0.89%，t = 6.05；在 Fama–French 五因子上再加动量与反转，得到七因子 alpha 0.68%，t = 5.45。把持有期拉到 12 个月，市值加权多空组合的年化七因子 alpha 高达 2.23%，t = 8.67。即便祭出一个「全家桶」14 因子模型，PI 因子（PIF）仍保有 0.87% 的 alpha（t = 2.46）——意味着把 PIF 加进来，能实打实地抬高切点组合的夏普比率。

那它会不会只是几只 Quality / Value / Momentum 的 ETF 换了个马甲？作者直接拿 iShares 的质量、价值、动量因子 ETF 去回归 PI 多空组合，结果如表 15：即使控制住这三个 ETF，PI 仍留有 0.70% 的 alpha（t = 2.51），而它在动量 ETF 上的载荷几乎为零（0.08）。

Table 15

5 这真的是「跨股票」信息吗？——和机器学习的正面对决

到这里，一个尖锐的质疑会冒出来：灵活的机器学习方法，原则上只用公司自己的特征就能逼近你那套「均值 + 偏离」的分解。会不会你折腾半天，捕捉的其实只是普通的「公司自己」可预测性，根本没什么跨股票的玄机？

这是全文最关键的一道防线，作者用四招来守。

第一，经济结构本身就是价值。PI 把回报生成过程拆成「同行均值」和「组内偏离」两个可解释的通道；而通用的 ML 是在没有经济指引的情况下盲搜统计规律——没有理由指望它能自动复原出同行群体的结构，或把公司归进经济上自洽的同行集合。

第二，也是最直接的：把 Gu et al. (2020) 的三种非线性方法——梯度提升树、随机森林、神经网络——的预期收益预测当控制变量丢进 Fama–MacBeth 回归，PI 依旧稳健。样本外看，加上 PI 能改善拟合、压低预测误差的标准差。如图 2 所示，PI 不仅自己有正的样本外 R²，加进去之后还能进一步降低均方预测误差——这正是「ML 拿不走 PI 信息」的可视化证据。

Figure 2: Realized out-of-sample PI-based portfolio average return, Sharpe ratio, PI-based model out-of-sample 𝑅2, and mean squared prediction error

第三，PI 还能预测未来的盈余惊喜（earnings surprises），短期和长期都行，而且是在控制了 ML 收益预测之后——连专业分析师似乎都漏看了这部分信息。第四，作者的线性 ridge 其实是个保守的下界：一个把特征做多项式变换的非线性版 PI，还能在线性 PI 之上带来增量解释力（呼应 Didisheim et al. (2024)）。也就是说，更花哨的非线性估计只会让结论更强，本文报的是 PI 预测力的地板而非天花板。

（关于「把机器学习从黑箱变玻璃箱」这条线，可参见《把机器学习的黑箱拆成玻璃箱：公司债收益率能被「看懂」地预测吗？》。）

6 价格是怎么「慢慢」吸收同行信息的

横截面赚钱只是表象，作者想知道背后的价格形成机制。于是他们换上时间序列的镜头：借 Kogan & Papanikolaou (2013, 2014) 的「冲击—响应」逻辑，把 Montiel Olea & Plagborg-Møller (2021) 新近的滞后增广局部投影（lag-augmented local projection, LA-LP）搬过来，估计股票收益对 PI 一次创新的脉冲响应。

结果干净得让人安心：PI 上升 10 个百分位，下个月收益立刻抬升约 0.4%，然后在随后几个月里逐渐衰减，却始终没有反转。如图 3，冲击当期价格朝正确方向移动，调整被摊在好几个月里慢慢完成，而且不存在事后的「翻烧饼」。

Figure 3: Lag-Augmented Local Projection (LA-LP)

这正是「缓慢扩散（slow diffusion）」该有的样子：市场对同行信息反应不足（underreaction），价格慢慢爬向正确位置，但不是先冲过头再回调的过度反应。横截面的盈利性，和时间序列的慢扩散，在同一条「反应不足」的逻辑上对齐了。

7 不是风险，也不是情绪

要把「反应不足」这个解释钉死，得先排除两个竞争对手。

风险补偿？高 PI 股票并不更重地暴露在标准因子上，也没有异常高的下行风险，更没把收益集中在某些特定的商业周期状态里。而且收益差能持续三年而不反转——这和「暂时性过度反应终将回吐」的故事很难调和。

情绪？作者用 RavenPack 新闻构造了股票层面和行业层面的情绪指数。如表 16，即便同时控制住这两个情绪变量，PI 的斜率仍是 0.53（t = 3.10，三颗星），而两个情绪变量自己都不显著。在高、低情绪子样本里 PI 也都活着。注意力和情绪渠道，解释不了 PI。

8 当同行网络不再对称：alpha 藏在反对称的角落里

最后一步是把舞台从行业拓宽到两张非对称网络——共同分析师覆盖（Ali & Hirshleifer, 2020）和上下游客户—供应商关系（Cohen & Frazzini, 2008）。这里冒出两个发现。

其一，把这些网络的变量加进基准回归后，PI 仍然显著——本文记录的跨股票可预测性，并不只是通过分析师或供应链传导的动量。其二，借 Kelly et al. (2023) 的「对称—反对称分解」，把非对称的位置矩阵拆成对称（beta 样、像因子暴露）和反对称（alpha 样、纯择时）两部分，作者发现：反对称的同行均值这一束——刻画的是因子中性、有方向的跨股票择时——成了预测力的关键来源。

于是反转出现了：当网络对称（如行业）时，跨股票可预测性主要落在 beta 样的对称部分；可一旦网络变得有向（供应链、共同分析师），alpha 样的反对称部分就接管了主导权，与「信息沿经济链条定向流动」的图景严丝合缝。

9 文献脉络

这条线的源头，是把「行业」当作信息载体的朴素直觉。早在 Goodman & Peavy (1983) 就用行业相对市盈率预测收益；Moskowitz & Grinblatt (1999) 把行业动量摆上台面，追问「动量到底是不是行业现象」；Hou (2007) 进一步刻画了行业内信息扩散造成的领先—滞后效应。

真正把「别人的特征预测我的收益」做实的，是 Cohen & Frazzini (2008)——经济链条（客户—供应商）带来可预测的收益；此后 Cohen & Lou (2012)、Hoberg & Phillips (2018)、Lee et al. (2019)、Müller (2019)、Parsons et al. (2020)、Ali & Hirshleifer (2020) 沿着不同的「链」把跨股票预测铺开。与此同时，机器学习的浪潮——Gu et al. (2020) 的实证资产定价、再到 Kelly et al. (2023) 系统化的跨资产信号交互——给了我们处理高维弱信号的工具。

本文恰好坐在这两股潮流的交汇处：它不满足于「用同行的过去收益」这种窄渠道，而是把全部 130 个特征都做「均值 + 偏离」的双重分解，再用 ridge 收缩成一个能扛过现代严苛标准（市值加权、微盘股处理、t ≈ 3 门槛、长视野、因子张成）的指数。在「异象普遍衰减」（Chordia et al., 2014）、「因子动物园人人喊打」（Harvey et al., 2016；Green et al., 2017）的当下，PI 还能在全样本和近样本里双双过关——这本身就是它最大的底气。（关于「因子动物园」从何而来，可参见《弱替代：因子动物园是从哪里冒出来的？》；关于 Cochrane (2011) 呼吁的多元检验，可参见《贴现率：资产定价的中心议题》。）

10 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：把 x 拆成「均值 + 偏离」明明没增加任何信息，凭什么能多预测出东西？

关键不在「信息」而在「限制」。拆分本身确实是恒等变换，但标准回归隐含地把两束的系数绑成相等。一旦数据说它们不该相等（F = 29.91），松开这个错误约束就等于让模型用对了已有信息——预测力的提升来自纠正一个误设，而非凭空造信息。

Q：PI 会不会就是动量、行业动量换了个名字？

不太像。把 PI 放进市值加权横截面回归后，四个过去收益 / 行业类异象反而变得不显著，PI 自己 t = 5.71；它在动量 ETF 上的载荷只有 0.08；而且它还能预测盈余惊喜——动量解释不了基本面被低估这件事。

Q：和机器学习比，这套线性 ridge 是不是太「土」了？

作者把这当成卖点而非短板。线性 ridge 是个保守下界：连 GBRT、随机森林、神经网络的预测都拿不走 PI 的信息，而一个非线性版 PI 还能在它之上加分。也就是说，更强的模型只会让结论更硬。

Q：脉冲响应「衰减但不反转」，为什么就一定是反应不足，而不是别的？

因为过度反应的典型特征是「先冲过头、再回调」，会出现反转；而这里价格在冲击当期就朝正确方向走、之后只是把调整摊薄到几个月、始终不回吐。叠加上「不是风险补偿、不是情绪」的排除，反应不足是最自洽的解释。

Q：对称网络下反对称通道「机械地缺席」，这会不会让行业结果有偏？

不会有偏，只是把信息压进了对称（beta 样）通道。行业矩阵按构造对称，所以反对称部分天然为零；这恰恰解释了为什么 alpha 样的反对称择时只在供应链、共同分析师这类有向网络里才浮现。

Q：把 130 个特征压成一个 PI，会不会丢掉了哪束更重要的信息？

有代价，但作者用 13 组分项 F 检验（7.75–270.70）说明每一类特征的「均值 ≠ 偏离」都成立，降维不是把信号抹平；而 PI 与单个特征相关性最高才 0.217，说明它靠的是广度而非单点。

(b) 几个可能的研究问题与提案

1. 公司债市场的「双重同行效应」 - 【经济故事】债券价格对信用基本面的反应远比股票迟钝，同行（同行业、同评级、共同主承销商）的基本面变化很可能更慢地渗进一只债券的利差。把「均值 + 偏离」分解搬到信用利差预测上，或许能挖出比股票更强的反应不足。 - 【可行性】中。数据上 TRACE（成交）+ Mergent FISD（发行特征）+ Compustat 基本面可拼出面板；识别上可复用本文的 ridge-PI 构造与 LA-LP 脉冲响应。难点是债券交易稀疏、利差测度噪声大，同行集合的定义（按发行人行业还是按债券特征）需要小心。

2. 外资持有人作为一条「同行链」 - 【经济故事】被同一批外资机构共同持有的公司，可能因为这些投资者的组合再平衡而产生定向的跨股票溢出——这是一条「持有人网络」而非「产品市场网络」。它对反应不足的贡献，会不会在外资占比高的时段更强？ - 【可行性】中。13F（机构持仓）能构造共同持有人网络，FactSet / Refinitiv 可标注外资身份；识别上可纳入本文的对称—反对称分解，看溢出是否落在反对称（定向）通道。挑战是 13F 季频、且只覆盖管理人层面，外资细分需要额外匹配。

3. 流动性冲击沿同行网络的扩散 - 【经济故事】本文记录的是「信息」缓慢扩散；一个对称的问题是「流动性冲击」是否也沿同行网络传导——一只股票的流动性枯竭，会不会先压低同行均值、再慢慢传到组内偏离？ - 【可行性】中高。用 Amihud (2002) 非流动性或买卖价差构造同行均值与偏离，套用同一套 LA-LP 框架估计脉冲响应即可，数据现成。难点是把「信息渠道」和「流动性渠道」干净地分开。

4. 非线性 PI 到底多了什么 - 【经济故事】作者只用多项式变换浅尝了非线性，并报告有增量。一个值得追的问题是：这部分增量是来自「同行均值之间的交互」还是「偏离的非线性」？厘清它能告诉我们反应不足究竟发生在「群体强弱」还是「个体位置」上。 - 【可行性】高。在现有数据和代码基础上，把神经网络的可解释性工具（如积分梯度）用在 PI 构造的输入上即可，纯属增量分析。

参考文献

Ali, U., Hirshleifer, D. (2020). Shared analyst coverage: Unifying momentum spillover effects. Journal of Financial Economics 136, 649–675.
Amihud, Y. (2002). Illiquidity and stock returns: cross-section and time-series effects. Journal of Financial Markets 5, 31–56.
Carhart, M.M. (1997). On persistence in mutual fund performance. Journal of Finance 52, 57–82.
Chordia, T., Subrahmanyam, A., Tong, Q. (2014). Have capital market anomalies attenuated in the recent era of high liquidity and trading activity? Journal of Accounting and Economics 58, 41–58.
Cochrane, J.H. (2011). Presidential address: Discount rates. Journal of Finance 66, 1047–1108.
Cohen, L., Frazzini, A. (2008). Economic links and predictable returns. Journal of Finance 63, 1977–2011.
Cohen, L., Lou, D. (2012). Complicated firms. Journal of Financial Economics 104, 383–400.
Daniel, K., Hirshleifer, D., Sun, L. (2020). Short- and long-horizon behavioral factors. Review of Financial Studies 33, 1673–1736.
Didisheim, A., Ke, S.B., Kelly, B.T., Malamud, S. (2024). APT or AIPT? The surprising dominance of large factor models. NBER Technical Report.
Fama, E.F., French, K.R. (2015). A five-factor asset pricing model. Journal of Financial Economics 116, 1–22.
Goodman, D.A., Peavy, J.W. (1983). Industry relative price-earnings ratios as indicators of investment returns. Financial Analysts Journal 39, 60–66.
Green, J., Hand, J.R., Zhang, X.F. (2017). The characteristics that provide independent information about average US monthly stock returns. Review of Financial Studies 30, 4389–4436.
Gu, S., Kelly, B., Xiu, D. (2020). Empirical asset pricing via machine learning. Review of Financial Studies 33, 2223–2273.
Harvey, C.R., Liu, Y., Zhu, H. (2016). …And the cross-section of expected returns. Review of Financial Studies 29, 5–68.
Haugen, R.A., Baker, N.L. (1996). Commonality in the determinants of expected stock returns. Journal of Financial Economics 41, 401–439.
Hoberg, G., Phillips, G.M. (2018). Text-based industry momentum. Journal of Financial and Quantitative Analysis 53, 2355–2388.
Hou, K. (2007). Industry information diffusion and the lead–lag effect in stock returns. Review of Financial Studies 20, 1113–1138.
Hou, K., Xue, C., Zhang, L. (2020). Replicating anomalies. Review of Financial Studies 33, 2019–2133.
Huang, D., Zhang, H., Zhou, G. (2019). Twin momentum: Fundamental trends matter. (Working paper / FIR construction.)
Jensen, T.I., Kelly, B.T., Pedersen, L.H. (2023). Is there a replication crisis in finance? (Comprehensive characteristics dataset.)
Kelly, B.T., et al. (2023). Cross-stock predictability and signal interactions.
Kogan, L., Papanikolaou, D. (2013). Firm characteristics and stock returns: The role of investment-specific shocks. Review of Financial Studies 26, 2718–2759.
Kogan, L., Papanikolaou, D. (2014). Growth opportunities, technology shocks, and asset prices. Journal of Finance 69, 675–718.
Lee, C.M., Sun, S.T., Wang, R., Zhang, R. (2019). Technological links and predictable returns. Journal of Financial Economics 132, 76–96.
Montiel Olea, J.L., Plagborg-Møller, M. (2021). Local projection inference is simpler and more robust than you think. Econometrica 89, 1789–1823.
Moskowitz, T.J., Grinblatt, M. (1999). Do industries explain momentum? Journal of Finance 54, 1249–1290.
Müller, S. (2019). Economic links and cross-predictability of stock returns: Evidence from characteristic-based styles. Review of Finance 23, 363–395.
Parsons, C.A., Sabbatucci, R., Titman, S. (2020). Geographic lead-lag effects. Review of Financial Studies 33, 4721–4770.

我的判断是这样：这篇论文的真正贡献，不在于又发现了一个能赚钱的信号，而在于它点破了一个我们集体忽视了几十年的误设——标准横截面回归把「同行均值」和「组内偏离」强行绑成同一个系数。一旦松开，跨股票结构就自己浮出水面，而且能扛住现代最苛刻的检验标准。这是方法论上很漂亮、也很「便宜」的一击（不需要新数据，只需要一个分解）。

对识别的担忧也有两点。其一，同行集合用 2 位数 SIC 定义，行业边界本身是个测度选择，结果对「同行怎么划」的敏感性值得更系统地拷问——虽然作者用供应链和共同分析师做了稳健性，但对称网络下反对称通道机械缺席，意味着行业结果只看到了硬币的一面。其二，「反应不足」是通过排除法（非风险、非情绪）+ 脉冲响应形状推出来的，缺一个能直接验证「投资者确实没看同行信息」的微观证据——比如分析师预测、资金流向层面的直接检验。

后续我最想看到的，是把这套「双重同行效应」搬到公司债与信用市场：那里的反应不足只会更严重，同行链条（评级、行业、主承销商）也更清晰，很可能是这个框架下一块更肥的田。