分析师到底该信「自己」几分?——一道把「私心」和「自负」分开的算术

[2006 RFS] Analysts’ Weighting of Private and Public Information
Note

本文读的是 Chen & Jiang (2006, Review of Financial Studies):用一个回归法和一个概率法去量分析师在预测公司盈余时,到底给「自己的私有信息」压了多大的权重。结论是——平均而言他们过度加权了私有信息;而且当预测比市场共识更乐观时加权更狠,更悲观时反而压低甚至低估。最关键的一步,是作者构造了一个只依赖信息精度、与加权策略无关的能力度量,用它把「为私利而夸大」和「因自负而夸大」这两种解释干净地分开。答案是:私心的成分,比自负更大。

1 引言:一个被「混在一起」的老问题

卖方分析师(sell-side analyst)的预测「不靠谱」,几乎是金融学里被研究得最多的事实之一。他们的盈余预测系统性地偏乐观,准确度也时常不如一个简单的时间序列模型。于是文献热闹了几十年:有人说这是行为偏差——分析师过度自信、对自己覆盖的公司抱有乐观先验;也有人说这是激励使然——为了讨好管理层、为了拉到投行业务、为了显得「有本事」从而带来交易佣金。

但这里有一个一直没被解开的死结。

我们能观察到的,是预测的「性质」(properties):它有多偏、有多准。可问题在于——预测的性质,是信息精度和分析师行为两件事共同决定的。一个用了完美贝叶斯权重的分析师,如果他的信息本来就糙,预测照样可以很不准;而一个胡乱加权的分析师,只要私有信息足够精,预测反而可能更准。换句话说,光看「偏」和「准」,你根本说不清这个人到底是信息差还是行为差,更别说去区分「他是故意的,还是不自觉的」。

所以 Chen 和 Jiang 决定换一个角度:不去看预测的性质,而去直接量分析师的加权行为(weighting behavior)——他在「自己的私有信息」和「市场已知的公共信息」之间,到底是怎么分配信任的。

Tip

这篇文章在我看来真正的漂亮之处,不是它发现了「过度加权」(那并不新鲜),而是它造出了一把与加权策略正交的能力尺子,从而第一次能在大样本里把「激励」和「认知偏差」掰开。这才是全文的「核心」,下面我们会反复回到它。

2 一个最小的贝叶斯模型

要谈「过度加权」,得先有「正确加权」是什么的基准。作者搭了一个极简的模型。

令公司的真实盈余为 \(z\),不失一般性地假设它服从一个零均值的弥散正态分布。分析师手里有两类信息:一类是大家都看得见的公共信息(public information),用一个充分统计量 \(c\) 概括,称作市场共识(consensus);另一类是只有他自己有的私有信息(private information),记作 \(y\)。两者都是对 \(z\) 的带噪观测:

$$c = z + \varepsilon_c, \qquad \varepsilon_c \sim N\!\left(0, \tfrac{1}{p_c}\right)$$

$$y = z + \varepsilon_y, \qquad \varepsilon_y \sim N\!\left(0, \tfrac{1}{p_y}\right)$$

这里 \(p_c\)、\(p_y\) 分别是公共信息和私有信号的精度(precision,方差的倒数)。由贝叶斯法则,分析师对 \(z\) 的最优估计是两者的加权平均:

$$E[z \mid y, c] = h\,y + (1-h)\,c, \qquad h \equiv \frac{p_y}{p_c + p_y} \in [0,1]$$

这个 \(h\) 就是有效权重(efficient/Bayesian weight)。它有一个非常干净的含义:\(h\) 完全由私有信号相对公共信息的精度决定。一个能力强(私有信息更精)的分析师,\(h\) 天生就更大。

可现实里分析师未必用 \(h\)。设他实际采用的预测策略是

$$f = k\,y + (1-k)\,c$$

其中 \(k\) 是他真正压在私有信号上的权重。于是作者给出了核心定义:若 \(k > h\),称该分析师过度加权(overweight)私有信息;若 \(k < h\),则加权不足(underweight)。注意度量是 \(k/h\)(实际权重除以有效权重),而不是 \(k-h\)——这一点后面会变得很重要。

3 识别策略:怎么在「看不见 y」的情况下测出 k 和 h 的关系

难点来了。研究者能看到分析师的预测 \(f\)、能算出共识 \(c\),但看不见他的私有信号 \(y\)、看不见精度 \(h\)、更看不见他压的权重 \(k\)。怎么办?

作者的洞见是:预测误差和「预测偏离共识的幅度」之间的关系,会泄露加权信息

首先,定义预测误差 \(FE = f - z\),以及预测对共识的偏离 \(Dev = f - c\)。如果分析师高效加权(\(k=h\)),那么他的预测误差不应该能被 \(Dev\) 预测——因为 \(Dev\) 里的信息他已经最优地用掉了。但如果他过度加权,\(Dev\) 就会系统性地预示 \(FE\)。把这层关系写出来:

$$ E(FE \mid y, c) = \cssId{a1}{\frac{k-h}{k}} \cdot \cssId{a2}{(f-c)} \equiv \cssId{a3}{\beta_0} \cdot Dev $$

于是第一个方法——回归法(regression-based method)——就有了。直接跑

$$FE = \delta + \beta_0 \cdot Dev + \varepsilon$$

估计出的 \(\hat\beta_0\) 依概率收敛到 \(1 - h/k\)。\(\hat\beta_0 > 0\) 说明平均而言过度加权,\(\hat\beta_0 < 0\) 说明加权不足。简洁得近乎优雅。

接着,一个自然的问题是:回归法对异常值和测量误差很敏感,而分析师数据恰恰以「脏」著称。于是作者引入了第二个、也是文献里第一次出现的方法——概率法(probability-based method)。它的思路更朴素:如果分析师高效加权,那么他的预测「冲过头」(与 \(Dev\) 同号地错)和「没够着」应该各占一半。于是定义

$$\pi = \Pr\big(\mathrm{sign}(FE) = \mathrm{sign}(Dev)\big)$$

在高效加权的原假设下 \(\pi = 0.5\);\(\pi > 0.5\) 意味着过度加权。这个统计量的好处是每一对 \(\{FE, Dev\}\) 的贡献相等,与幅度无关,因此对离群值极其稳健。

这两个方法分别捕捉了误加权的平均幅度(\(\beta_0\))和中位倾向(\(\pi\)),而两者给出一致的结论,正是作者信心的来源。作者用命题 1 严格证明了二者与高效加权的等价关系。

Warning

这里有个容易被忽略的陷阱,也是本文的另一处刀锋。以往文献喜欢用「预测离共识有多远」(forecast distance)来代理分析师的大胆羊群倾向。但作者推导出 $$E(f-c)^2 = k^2\,E(y-c)^2 = k^2\!\left(\tfrac{1}{p_y}+\tfrac{1}{p_c}\right) = \left(\tfrac{k}{h}\right)^2 \tfrac{h}{p_c}$$ ——离共识的距离同时取决于能力(藏在 \(h\) 里)和策略(藏在 \(k/h\) 里)。所以一个高能力却保守加权的人,可能比一个低能力却激进加权的人离共识更近。用「距离」来度量羊群,是把两件事搅在了一起。

4 真正关键的一步:一把与策略无关的能力尺子

到这里我们能测出「平均过度加权」了。但这还不够——作者真正想回答的是为什么

有两个竞争假说。激励假说(incentive hypothesis)说:分析师其实知道自己几斤几两,他故意夸大私有信息的新闻含量,要么是为了向市场发出「我有本事」的信号,要么是为了制造交易、赚取佣金 [Prendergast & Stole (1996)、Ehrbeck & Waldmann (1996)]。过度自信假说(overconfidence hypothesis)则说:分析师并不清楚自己的真实能力,在一连串好运之后因为归因偏差而高估了自己 [Griffin & Tversky (1992)、Gervais & Odean (2001)]。

问题是,这两个假说都预测「过度加权」。怎么分?

作者给出的识别钥匙,是一个只依赖信息精度、与加权策略无关的能力度量。具体地,他们把分析师的能力定义为:他的预测若被加进共识、能把共识推向真实盈余的方向的频率(即正文里的 Ability(Dir)Ability(Beat))。论文证明了一个关键性质——这个度量只取决于私有信号的相对精度 \(h\),而不取决于他条件于能力之上选择的加权策略 \(k\)

这一点为什么要命?因为标准的能力度量(绝对或相对预测准确度)做不到这一点——它们被策略「污染」了。而有了这把干净的尺子,两个假说就给出了可区分的预言:

5 数据与主要结果

样本来自 Zacks 的分析师季度盈余预测,并配以 COMPUSTATCRSPSDC(承销关系)以及手工整理的《机构投资者》All-American 评级。样本期 1985–2001(最后一笔预测在 2001 年 3 月,恰在 Reg FD 生效之前),并按惯例剔除均价低于 $5、市值低于 $100 million 的公司。最终共 1,367,599 条预测,覆盖 3195 家公司、5306 位分析师、51,200 个「分析师—公司」配对。

先看一张不带任何结构假设的图。图 1 用核回归画出 \(FE = f(Dev)\),结果是一个清晰的 「V」形:\(Dev\) 为正时 \(FE\) 随之上升,\(Dev\) 为负时 \(FE\) 随之下降。Ellison & Ellison (2000) 的设定检验在 5% 水平上不拒绝每一段的线性,却在 1% 水平上拒绝整体的线性(即存在拐点)。这个 V 形本身就在讲故事——分析师在共识两侧的加权行为是不对称的。

而把不对称量化出来,就是本文最有味道的发现:

如表 2 所示,横截面回归里能力与过度加权之间那个交互项系数显著为负(在 1% 水平上),这正是「低能力者反而更激进地过度加权」的直接证据。

Table 2: shows that (cid:5)^(cid:4) is negative and significant at the 1% level in

Table 2: shows that (cid:5)^(cid:4) is negative and significant at the 1% level in

把这些拼起来,箭头都指向同一个方向:误加权的程度随其收益升高、随其成本降低而系统性变化。而过度自信假说预言的是「分析师意识不到自己在误加权,因而误加权与成本收益无关」——数据并不支持它。于是反转出现了:长期以来被归咎于「行为偏差」的分析师乐观,至少有相当一部分是算计出来的

这与本博客此前评述过的两篇 IPO 分析师文章遥相呼应——承销关系如何把分析师的「彩虹屁」变成一笔暗账(可参见《为什么「贵」的承销方式反而赢了?》《上市之后,分析师的「彩虹屁」到底值不值钱?》)。本文则把这条「IB 激励」的逻辑,从 IPO 场景推广到了日常盈余预测的加权行为上。

6 文献脉络

这条研究线,是「分析师预测为什么不理性」这个大问题里的一支。

最早的源头分两支。行为一支由 Griffin & Tversky (1992) 关于过度自信的认知心理学奠基,后被 Gervais & Odean (2001) 用「学习中产生过度自信」的模型形式化;激励一支则来自 Prendergast & Stole (1996) 的声誉博弈——年轻人鲁莽、老手保守——以及 Ehrbeck & Waldmann (1996) 对「代理 vs 行为」的直接对照。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

与此并行的,是关于乐观来源的争论:McNichols & O'Brien (1997) 用自选择和乐观先验解释覆盖偏差,而 Francis & Philbrick (1993)、Lim (2001) 则强调「讨好管理层」的激励。再往后,Zitzewitz (2001a) 第一次在大样本里测出了「夸大」,但他没有进一步区分这种夸大究竟来自策略还是自负——这恰恰是本文站立的位置。本文还顺手把乐观加权与几个看似无关的结论缝合了起来:它为「共识对过往信息究竟是过度还是反应不足」的矛盾提供了调和(早期 DeBondt & Thaler 1990 与 Abarbanell & Bernard 1992 各执一词),也呼应了 Hong & Stein (1999)「坏消息传得慢」的判断,还与 Welch (2000) 关于分析师在推荐上羊群的发现互补。

7 评论与延伸(Q&A + 研究方向)

Q:「过度加权私有信息」和「预测偏乐观」是一回事吗?

不是,这恰是本文要分清的。乐观偏差是关于预测水平(level)偏高;而过度加权是关于分析师对私有信号压了多大权重。乐观加权是二者的结合:在好消息那一侧过度加权、坏消息那一侧加权不足。作者明确论证了乐观加权「可与单纯的乐观偏差相区分」。

Q:能力为什么是「与策略正交」的,这个性质可信吗?

这是全文识别的命门。作者证明,用「预测若加进共识能否把共识推向真值」来度量能力,其期望只依赖私有信号的相对精度 \(h\),而不依赖分析师在给定能力之上选择的 \(k\)。直觉是:能否把共识往真值方向拉,取决于你的信号含多少真信息(精度),而不取决于你事后怎么吆喝它(权重)。相比之下,绝对/相对准确度都被策略污染,所以不满足这个要求。

Q:发现「低能力者反而更过度加权」,不是和直觉反着来吗?

表面反直觉,实则是激励假说的自然推论,也是对既有文献的一记重拳。以往用「离共识的距离」度量羊群,得出「低能力、缺经验者爱抱团」。但本文的能力尺子显示:低能力者其实在反羊群(过度加权私有信息),高能力者反而加权不足。原因正是第 3 节那条 \(E(f-c)^2\) 公式——距离同时被能力和策略决定,用它度量羊群是错的。

Q:投行关联(IB)会不会只是「关联分析师本来就乐观」,而非「为承销而乐观」?

作者用的是未来承销关系(雇主在预测日前后五年内成为该公司主承销或联席承销)作为收益的代理。配合成本侧的代理(职业早期、临近发布日),多个维度一致指向「收益高/成本低时误加权更甚」,这比单看 IB 的横截面相关更难用「天生乐观」来解释。当然,IB 关系本身可能与公司特征相关,这是残留的担忧。

Q:样本止于 Reg FD 之前,结论还适用今天吗?

这是个真实的外部效度问题。Reg FD(2000 年生效)限制了选择性信息披露,理论上会压缩分析师私有信息的精度 \(h\),从而改变加权的成本收益。本文样本恰好基本落在 Reg FD 之前,所以它刻画的是一个「私有信息更值钱」的旧世界。Reg FD 之后是否依旧过度加权,是个值得重做的问题。

Q:概率法真的比回归法「更好」吗,还是只是稳健?

它不是更优,而是互补。回归法度量平均幅度、概率法度量中位倾向;后者对离群值和测量误差稳健,前者能直接给出 \(1-h/k\) 的结构含义。作者反复强调,正是两法结论一致,才让人相信结果不是数据不规则造成的伪相关。


(b) 几个可能的研究问题与提案

  1. Reg FD 前后的加权行为断点
  2. 【经济故事】Reg FD 削弱了选择性披露,等价于压低私有信号精度 \(h\)。若加权是激励驱动的,成本收益结构变了,过度加权的程度也该随之移动;若纯是自负,则不该有系统变化。这是对本文核心论断的一次「外生冲击」检验。
  3. 【可行性】。I/B/E/S 或 Zacks 预测数据跨越 2000 年,可直接套用本文的 \(\beta_0\) 与 \(\pi\) 估计,做事件窗口的前后对比,甚至用受 FD 影响程度不同的公司做双重差分 (difference-in-differences, DiD)。

  4. 把加权框架搬到公司债分析师 / 评级机构

  5. 【经济故事】信用分析师和评级机构同样在「私有尽调」和「市场价格(CDS、债券利差)」之间加权。其激励结构(发行人付费)与股票分析师不同,乐观加权的方向与强度可能截然不同。
  6. 【可行性】。需要债券分析师的预测面板(较稀疏)或评级行动数据,以利差/CDS 隐含的违约预期作为「共识」。识别上可借本文的能力尺子,但债券事件较少、噪声更大,样本量是瓶颈。

  7. 外资持有人结构与分析师加权

  8. 【经济故事】当一家公司的边际投资者是信息劣势的外资时,分析师「夸大私有信息以发信号/拉佣金」的收益可能更高。可检验外资持股比例与该公司分析师过度加权程度的关系。
  9. 【可行性】。需要分国别的机构持股数据(如 FactSet/13F 之外的跨境持股)匹配分析师预测。识别担忧是外资持股的内生性,需用指数纳入等外生变动做工具。

  10. 「乐观加权」与高分歧—低收益异象的微观对接

  11. 【经济故事】本文指出,分析师在有利消息时更偏离共识,因此高预测分歧可能对应被夸大的好消息、从而对应过高的当前价格——这正是 Diether, Malloy & Scherbina (2001) 高分歧低收益之谜的一个机制候选。
  12. 【可行性】。可在分歧度排序的组合里,进一步用本文的 \(\pi\) 统计量度量「分歧中有多少来自乐观加权」,看它是否解释了未来低收益的横截面。数据与方法都现成。

参考文献