注意力是共同的,情绪是私人的——同一只股票,三个平台在说两件事

Note

本文读的是 Cookson, Lu, Mullins & Niessner (2024, Journal of Financial Economics):作者把 Twitter、StockTwits、Seeking Alpha 三大投资者社交平台放在一起对账,发现一个被以往「单平台」研究忽略的事实——大家在同一天关注哪些公司高度一致(注意力的第一主成分能解释 67% 的变动),但对同一只股票的情绪却各说各话(情绪的第一主成分只解释 39%,仅比纯粹各自为政的 33% 高出一丁点)。更妙的是,这两个信号对次日收益的预测方向正好相反:情绪预测正收益,注意力预测负收益。

1 一个被「单平台」掩盖的裂缝

先讲一个做实证的人都遇到过的尴尬。

过去十年,研究投资者社交媒体的论文像雨后春笋般冒出来:有人用 StockTwits 量「分歧」,有人用 Twitter 抓央行政策的市场反应,有人用 Seeking Alpha 检验「群众的智慧」。可是你把这些文章摞在一起读,会发现一件怪事——它们的结论常常对不上。同样是问「散户的关注到底是聪明钱还是噪声」,在一个平台上得到的答案,换个平台可能就反了过来。

为什么?最省事的解释是:这些论文用的自然语言处理算法 (natural language processing, NLP) 不一样,所以情绪打分的口径不同,结论自然漂移。可这只是技术细节。真正的问题更根本——这些平台,本来就不是一回事

传播学里有一句老话,麦克卢汉 (McLuhan, 1975) 说「媒介即讯息」:一种沟通媒介的特征,会同时塑造它承载的内容和它产生的影响。Seeking Alpha 是长篇深度文章、有编辑把关;Twitter 限 280 字、但可以串成长帖;StockTwits 不能串帖,却从 2019 年起把字数上限提到了 1000,而且专做投资。用户也天差地别:Seeking Alpha 的作者是精挑细选的,Twitter 和 StockTwits 谁注册都能发。

于是一个自然的问题是:如果这三个平台从用户到设计都不一样,那它们生产的「社交信号」到底是同一种东西,还是三种东西? 这正是本文要回答的核心。作者给这个信号起了个统一的名字——the social signal——然后做了一件以往没人做过的事:把三个平台的数据,按「公司—日」对齐,逐日对账。

2 把信号拆成两半:注意力与情绪

要对账,先得把模糊的「社交信号」拆成可度量的两个维度。本文的第一步,就是把它一分为二:注意力 (attention)情绪 (sentiment)

情绪好理解:一条帖子是看多还是看空。StockTwits 让用户自己给帖子打「bullish/bearish」标签,也用一套叫 MarketLex 的专有算法给每条帖子打 −1 到 +1 的分;Seeking Alpha 和 Twitter 的情绪则分别来自 Ravenpack 的事件情绪分 (Event Sentiment Score, ESS) 和 Social Market Analytics (SMA)。把一只公司 \(i\) 在 \(t-1\) 日收盘到 \(t\) 日收盘之间所有帖子的情绪求平均,就得到了「公司—日」级别的 \(\mathit{Sentiment}_{i,t}\)。

注意力则是「这一天有多少人在谈这家公司」。作者用一个很干净的相对份额来度量:

$$ \mathit{Attention}_{i,t} = \frac{\mathit{Messages}_{i,t}}{\sum_i \mathit{Messages}_{i,t}} $$

分子是公司 \(i\) 当天的帖子数,分母是该平台当天所有公司的帖子总数——也就是说,注意力衡量的是一家公司在当天「话题版面」里占的比重。

数据上,作者取了 2012–2021 这十年,锁定在 StockTwits 上单公司讨论最多的 1,500 家公司,并要求每个「公司—日」至少有 10 条 StockTwits 单公司帖。和 Ravenpack 的传统新闻、CRSP 的收益数据合并后,最终样本约 815,000 个公司—日观测。光 StockTwits 一家,原始数据就有 150 million 条帖、来自 800,000 多个用户。

有了这两把尺子,接着就可以问最关键的那个问题了。

3 反转出现:注意力高度共同,情绪却各说各话

作者对注意力和情绪分别做主成分分析 (principal component analysis, PCA)——把三个平台的信号丢进去,看第一主成分 (PC1) 能解释多少共同变动。

结果干净得近乎刺眼:

Tip

这就是全文的「金句」:人们在不同平台上关注同一批公司,却对同一只股票抱着彼此无关的看法。 注意力是共同的,情绪是私人的。

但实证人不会就此罢手。一个老练的读者立刻会反驳:会不会这只是 NLP 算法不同造成的假象?三个平台用了三套打分器,情绪对不上很正常啊。

作者的回应非常漂亮——他们退回到 StockTwits 平台内部,把用户分成影响者 (influencers)、专业者 (professionals)、新手 (novices) 等几类,在同一个平台、同一套算法下重做 PCA。如果情绪的低相关真是算法造成的,那么在算法完全相同的平台内部,不同用户群之间的情绪应该高度一致才对。

可结果还是老样子:用户类型之间,注意力的 PC1 高达 84%,情绪却依旧弱相关。算法被钉死了,差异依然在——这说明,就算把所有平台特征和 NLP 都统一,仅仅因为用户人群不同,情绪信号也注定对不上。 关注是社会性的趋同行为,看法则深植于各自的人群。

作者还顺手剔除了另一个内生性嫌疑:会不会这些共同成分其实是新闻、公司公告、股价驱动的?他们先把每个平台的注意力和情绪对传统新闻、8-K、盈余公告、滞后收益、波动率以及公司固定效应做回归,取残差之后再做 PCA(即「条件 PCA」)。结果与无条件 PCA 几乎一模一样——社交媒体里的共同信号,是独立于传统媒体的另一层信息。

值得一提的还有公司规模这条暗线:StockTwits 三分之二的热门公司是小盘股,而 Twitter 和 Seeking Alpha 更偏大盘。按规模分箱重做条件 PCA 后,无论大小盘,注意力都比情绪更「共同」;但大盘股在注意力和情绪上的共同性都比小盘股更强。这意味着,一个基于情绪的结论能不能跨平台推广,可能取决于小盘股在其中的分量有多重——这对解释文献里「结论打架」的现象,是一记直接的回应。

4 真正关键的一步:两个信号,方向相反

如果说前面是「描述」,那么本文最有冲击力的一步,是把这两个共同成分拿去预测次日异常收益

作者把次日异常收益对情绪 PC1、注意力 PC1 回归,并控制传统媒体新闻、公司公告、滞后收益与波动率、以及 Google 搜索量 (Da et al., 2011)。结论是一对漂亮的镜像:

为什么方向会反?作者把收益拉长到 20 天来看,机制就浮出水面了。更正面的情绪,伴随更高的当日和 \(t+1\) 日收益,而且之后 20 天没有反转——这像是情绪里真的含有「关于基本面的信息」。而更高的注意力,同样伴随更高的当日收益,但随后 10 到 20 天出现部分反转——这更像是高关注日里的一次过度反应 (over-reaction),事后被慢慢、部分地修正回去。

再往里挖一层:净散户买入 (net retail buying) 同时与当日的情绪和注意力正相关,但这种正相关只持续一到两天。把这几块拼起来,那对「相反的预测」就讲通了——情绪的正向可预测性来自它承载的信息,注意力的负向可预测性来自一次过度反应的渐进回吐。

(社交媒体把散户的关注和买入捆在一起、并能在短时间里掀起巨浪这件事,本博客此前评述 Cookson 等人的另一篇工作时也谈到过,参见《四天,一条推特,挤垮一家银行》。散户「去哪里、关注什么」本身有强烈的栖息地特征,可参见《散户的栖息地》。)

在三个平台里,StockTwits 的信号与共同成分对得最齐、对次日收益的解释力最好(尤其在注意力上)。这本身就说明:平台不是可以互换的容器。

5 用两个事件,把「为什么不同」钉死

到这里,本文其实已经可以收尾了。但作者还想回答一个更难的问题:平台之间的差异,究竟来自平台设计,还是来自用户人群? 他们找了两个近乎天然实验的事件,把这两条路径分别钉死。

事件一:字数上限的改变(识别「平台设计」)。 2019 年 5 月 8 日,StockTwits 把单条消息上限从 140 字提到 1,000 字。作者发现,改版之后,StockTwits 的情绪对次日收益的预测力变强了;而且这个效果完全由变长的消息驱动——短消息和注意力的信息含量都没变。进一步看,专业用户的消息本就更有信息量,改版后他们写得更长,这就给出了一个干净的机制。与此同时,没受这次改版影响的 Twitter 和 Seeking Alpha,信号信息量纹丝不动。一个平台内部「让用户能更充分表达」的设计改动,确实改变了它生产的信息——这正是传播学预言的事。

事件二:GameStop(识别「用户人群」)。 2020 年,免佣交易和居家令叠加,美国散户经纪账户激增,StockTwits 涌入大量新用户。2021 年 1 月 GME 逼空之后,作者发现所有平台情绪的信息量都显著恶化:收益对情绪的敏感度下降了。但关键在于——这个下降集中在新用户(2020 年后加入)的消息上,而 2020 年前就在的老用户,其信号信息量在 2021 年 1 月后没有变化

Warning

把两个事件并排看,会得到一个微妙的双重结论:字数上限事件支持「社交媒体不可互换」(平台特征确实重要);可 GME 事件又表明,一个足够大的冲击会从一个平台外溢到所有平台。平台既各有其个性,又共享一个生态。

这两块证据合起来,正好坐实了第 3 节那个 PCA 结论的两条腿:差异既来自平台设计(字数上限),也来自用户人群(新手涌入)。

6 文献脉络

把这篇文章放回它生长的那条河流里,会看得更清楚。

最早的源头,是把「文本」变成「信号」的努力。Antweiler & Frank (2004) 问「网上股票留言板的喧哗,到底是不是噪声」;Tetlock (2007) 则把媒体的情绪量化,证明它能预测股市。接着,注意力这条线独立成型——Da, Engelberg & Gao (2011) 用 Google 搜索量「In search of attention」,给散户注意力找到了一把直接的尺子;Barber & Odean (2008) 更早就指出,被关注的股票会被散户买入。情绪与注意力,从此成了两条平行但很少交汇的支流。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

到了社交媒体时代,研究开始扎进具体平台:Chen et al. (2014) 证明 Seeking Alpha 的荐股是有信息的;Cookson & Niessner (2020) 用 StockTwits 把投资者的「分歧」拆开看。但正如本文反复强调的,这些工作几乎都只盯着一个平台。Pedersen (2022) 的「Game on」把社交网络与市场的关系提到了理论高度,Bradley et al. (2024) 则发现 Reddit WallStreetBets 的「尽职调查」在 GME 之后变得不再有信息。本文站在这条脉络的交汇处——它既不是又一个「单平台」研究,也不是纯理论,而是第一次把三大平台对齐、把注意力与情绪同时拆开,量化它们的异同,并用平台设计与用户人群两条机制去解释这些异同。

7 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:情绪 PC1 解释了 39%,听起来不低,凭什么说「情绪是私人的」?

关键不在 39% 本身,而在它的参照系。如果三个平台的情绪纯属各自独立的噪声,PC1 在数学上也会「碰巧」吃掉约 33% 的方差。39% 只比这个基准高 6 个百分点,意味着真正的「共同情绪」少得可怜。而注意力的 67% 远远甩开了同样的基准——对比之下,「情绪几乎是各说各话」的判断才站得住。

Q:会不会三个平台情绪对不上,只是因为 NLP 算法不同?

作者用一个平台内的检验把这条路堵死了:在 StockTwits 内部、用同一套算法比较不同用户群,注意力 PC1 仍高达 84%,情绪仍弱相关。算法完全相同,差异照旧存在——所以差异不可能全由 NLP 造成,用户人群本身就足以制造情绪分歧。

Q:情绪和注意力的收益预测方向相反,这不矛盾吗?

不矛盾,因为它们捕捉的是两种东西。情绪含有关于基本面的信息,所以预测次日正收益且 20 天内不反转;注意力更像是引发了一次过度反应,当日推高价格,随后 10–20 天部分反转,于是「预测」次日负收益。文献早就提示「不同类型的注意力有不同的收益含义」(Ben-Rephael et al., 2017; Barber et al., 2022),本文把情绪与注意力放在一起,让这个对比格外清晰。

Q:GME 之后情绪信息量下降,是市场变了,还是人变了?

是「人」变了。下降集中在 2020 年后加入的新用户身上,而 2020 年前的老用户信号信息量没变。这说明不是整个市场结构突变,而是新进入者稀释了信号。这与 Bradley et al. (2024) 在 WallStreetBets 上的发现相互印证。

Q:样本只取 StockTwits 上讨论最多的 1,500 家公司,会不会有选择偏误?

有代价,但作者权衡得当:这 1,500 家虽只占全部 9,000 多家的一小部分,却涵盖了约 80% 的 StockTwits 消息量(从 150 million 降到 120 million)。要在「公司—日」层面稳定度量社交信号,必须有足够的帖量,否则注意力和情绪都噪声极大。代价是结论更偏向「被热议」的公司,对冷门小盘股的外推要谨慎。

Q:那条「大盘股共同性更强」的发现,对既有文献意味着什么?

它给「文献打架」提供了一个朴素的解释。既然 StockTwits 偏小盘、另外两家偏大盘,而共同性又随规模上升,那么一个基于某平台情绪得出的结论,能否推广,就取决于小盘股在其中的分量。换平台≈换了规模分布,结论自然可能漂移。

(b) 几个可能的研究问题与提案

1. 把「社交信号」搬到公司债/信用市场

【经济故事】股票有 StockTwits、Seeking Alpha,债券呢?信用市场以机构为主、散户稀薄,社交媒体上关于发债企业的情绪与注意力,是否同样「注意力共同、情绪私人」?若情绪含基本面信息,它应当先于信用利差变动而非次日股价。 【可行性】中。难点在于把 StockTwits 的 cashtag(针对股票)映射到发行人层面的债券,并与 TRACE 的利差数据对齐;识别上可借用本文的条件 PCA 框架,控制评级行动与新闻。数据可得但匹配工作量大。

2. 注意力—流动性的反向通道

【经济故事】本文显示高注意力日伴随过度反应与随后反转。一个自然推论是:注意力激增会暂时改变流动性供给——做市商面对散户的相关订单流,可能拉宽价差。能否用本文的注意力 PC1 去预测次日的买卖价差与深度变化? 【可行性】高。注意力 PC1 数据作者已公开,配合 TAQ 或 Boehmer et al. (2021) 的散户订单流指标即可检验;识别上可用本文的两个事件(字数上限、GME)作为外生冲击做事件研究。

3. 外资持有人与「跨语言」的社交信号

【经济故事】本文三个平台都是英语世界的。对在美上市、却有大量海外关注的公司(如中概股),非英语社交平台上的情绪与注意力是否构成又一个「独立的私人成分」?外资持有比例高的公司,其海外社交情绪是否更能预测收益? 【可行性】中到低。需要抓取多语言平台数据并做跨语言情绪打分,工程量大;识别上可用外资持股比例(如 13F、FactSet)做横截面切割。结论有趣但数据获取是真瓶颈,需诚实承认 doable 但成本高。

4. 字数上限实验的可推广性

【经济故事】StockTwits 2019 年放宽字数,让专业用户写更长、更有信息的帖子。其他平台若也调整表达约束(如 Twitter 从 140 到 280、再到长推),是否同样提升情绪信息量?这是检验「媒介即讯息」的天然系列实验。 【可行性】高。多个平台的字数政策变更日期是公开的,可叠成多事件 DiD;唯一要小心的是同期是否有算法或用户结构的并行变化,需要安慰剂检验。

8 我的判断

这篇文章最大的贡献,是把一个一直被「单平台」研究结构性地藏起来的事实摆上了台面:投资者社交媒体不是一个同质的「散户情绪」黑箱,而是注意力高度趋同、情绪却高度异质的拼图,且两者携带方向相反的收益信息。仅凭「注意力 PC1=67%、情绪 PC1=39%(基准 33%)」这一组对照,加上「同平台内用户间」的稳健性检验,就足以让人重新审视过去十年大量基于单一平台的情绪研究——这是一种「把别人结论的边界画出来」的贡献,价值不在于推翻谁,而在于解释了为什么大家会打架。两个市场事件(字数上限、GME)的引入,又把「平台设计 vs 用户人群」这对机制拆得相当干净,殊为难得。

对识别,我有两点保留。其一,收益预测的回归终究是相关性而非因果:情绪 PC1 与注意力 PC1 都是从残差中提取的统计构造,它们与次日收益的关系,仍可能被某个未被控制的、与社交活动同步的基本面冲击驱动——作者用条件 PCA 剥掉了新闻与公告,但「居家令期间散户行为的整体漂移」这类慢变量,未必能被固定效应完全吸收。其二,GME 事件虽是绝佳的外生冲击,但「新用户稀释信号」与「市场制度(如做市、限制交易)在同期变化」难以彻底分离,作者用「老用户不变」做对照已是上策,但仍是间接证据。

后续我最想看到三件事:一是把这套「注意力—情绪」分解搬到信用市场,看债券投资者的社交信号是否同样劈成两半;二是把注意力 PC1 直接对流动性指标回归,验证「过度反应—反转」是否走的是做市商风险预算这条道;三是一个更长的样本——本文止于 2021 年,而 GME 之后散户生态仍在剧变,再加三年数据,或许能看清「信号被稀释」究竟是一次性事件,还是结构性的新常态。

参考文献