把卖空看成一次「投票」:钱投得准不准,藏着市场下个月的方向

[2022 JFE] Short Selling Efficiency
Note

本文读的是 Chen, Da & Huang (2022, JFE):作者提出一个叫「卖空效率」(short selling efficiency, SSE) 的月度指标——把每只股票的异常卖空对它的「高估分数」做横截面回归,那条斜率就是 SSE。它显著、稳健、且样本内外都能负向预测整个股市的未来收益(月度系数 −0.61t = −3.50)。换句话说:当卖空者把子弹打在了「对的股票」上,市场的错误定价正在被纠正,未来的市场收益也就被提前透支了。

1 引言:卖空者赌对了,然后呢?

先讲一个大家都同意的事实:卖空(short selling)是有信息的。从 Boehmer, Jones & Zhang (2008) 到 Engelberg, Reed & Ringgenberg (2012),一长串横截面研究反复确认——被卖空多的股票,未来跌得多。卖空者,至少在平均意义上,是聪明钱。

接着,一个自然的问题是:既然卖空在横截面上能预测个股,那它在时间序列上、对整个市场呢?Rapach, Ringgenberg & Zhou (2016) 给了一个漂亮的答案——把所有股票的卖空加总成一个「卖空水平」(short selling level, SSL),它能负向预测股权溢价,作者甚至断言它「大概是迄今发现的最强的股权溢价预测变量」。

故事似乎到这儿就该结束了。但本文作者停下来,问了一个看似吹毛求疵、实则要害的问题:

Tip

同样是「市场上总共卖空了 1000 万股」,这 1000 万股,是被精准地砸在了最被高估的那批股票上,还是均匀地、甚至错误地撒在了一堆本就便宜的股票上?总量一样,后果能一样吗?

这正是全文的「核心张力」:总量(SSL)只告诉你卖空者有多想做空,却没告诉你他们做空得有多准。 而真正能纠正错误定价、进而预示市场下一步走向的,恰恰是后者——卖空者把钱投得准不准。本文把这件「准不准」的事,做成了一个可度量、可预测的时间序列变量。

2 一个朴素却关键的想法:卖空,要看「卖在哪」

怎么度量「准不准」?作者的做法朴素得近乎优雅。每个月 t,把所有股票拉到一张横截面上,做一个回归:被解释变量是异常卖空 (abnormal short interest, ASI),解释变量是错误定价分数 (mispricing score, MISP)。

$$ \text{ASI}_{i,t} = \cssId{a1}{a_t} + \cssId{a2}{b_t}\,\cssId{a3}{\text{MISP}_{i,t}} + e_{i,t} $$

这里每一块都值得拆开看。

异常卖空 ASI:仿照 Chen et al. (2019),先把每只股票当月卖空股数除以流通股数,得到卖空比例,再减去它过去 12 个月的均值——目的是剥掉个股层面的趋势,留下「本月相对异常」的那一部分。

错误定价 MISP:直接搬来 Stambaugh, Yu & Yuan (2015) 的综合指标——用 11 个经典异象(财务困境、净股票发行、应计、动量、毛利率、资产增长……)合成的百分位排名,1 到 100,越高越被高估。本文把它去均值并重标度,于是它在每个横截面上均匀分布在 −0.5(最被低估)到 0.5(最被高估)之间。

现在看那条回归。截距 a_t 是异常卖空的横截面均值——它就是 SSL,「市场总共做空了多少」。而斜率 b_t,因为 MISP 已经去了均值,本质上等于「砸在高估股票上的卖空 减去 砸在低估股票上的卖空」。斜率越大,说明卖空越是对准了该做空的标的。这条斜率,就是 SSE。

把这个回归每个月重做一遍,斜率序列 {b_t} 就成了一个时间序列——一个关于「这个月卖空者打得准不准」的月度温度计。

Note

一句话:SSE 是「卖空的方向感」,SSL 是「卖空的力气」。 力气大不代表方向准;而能纠正错误定价、预示市场掉头的,是方向。

3 反转:为什么「方向」比「力气」更干净?

到这里你可能会想:SSE 不就是 SSL 的一个变体吗?它俩相关系数 0.60,听上去像同一件事的两种说法。

真正关键的一步,是作者点出 SSE 有一个 SSL 天生没有的优点——它能抵消噪声

现实里,并非所有卖空都是冲着「这只股票被高估了」去的。有人做空只是为了对冲手里的可转债、期权或 ETF 头寸;有人做空是因为可借股票的供给变了。把这些「与高估无关」的卖空一股脑当成看空信号,会给 SSL 注入正向噪声,污染它作为「总体高估」代理变量的纯度。

而 SSE 妙就妙在:只要这些噪声与错误定价分数不相关,它们就会在高估股票和低估股票上「同样地」出现——于是在那条斜率回归里,正负相抵,被干净地约掉了。SSL 约不掉,SSE 能约掉。这是个概念上的差别,作者也用一个附录里的简化模型把它讲圆了。

实证上,作者还顺手验了一刀:SSE 与「机构持股」(卖空供给侧的代理)的相关性,比 SSL 低;而且即便在横截面里控制了机构持股,SSE 对市场收益的预测力依然显著。这说明 SSE 抓住的,不是「能借到多少券」这种供给故事,而是真正投向高估的那部分卖空资本

(关于「聪明钱到底在不在卖空里、又把异象收益推动了多少」,可参见《买卖双方各执一词:当 193 个异象告诉你「谁是聪明钱」》《异象收益究竟是谁推动的?》。)

4 识别策略与数据

这是一篇收益可预测性的论文,识别靠的是预测回归而非自然实验,所以要害在「数据干净、稳健性扎实」。

数据。 卖空数据来自 Compustat Short Interest File,覆盖 NYSE/AMEX/NASDAQ 的月度卖空(NASDAQ 2003 年前的数据直接从交易所补齐)。错误定价用 Stambaugh et al. (2015) 的 11 异象综合指标。样本期 1974 年 1 月到 2017 年 12 月。基准分析剔除微小市值股与价格低于 5 美元的股票;卖空取每月月中的快照,以确保它落在投资者形成「下月预期」时的信息集里。

预测对象。 月度的市值加权市场超额收益(减去一个月期 T-bill)。

两个处理细节。 其一,自 1970 年代起卖空整体在上升(对冲基金崛起,如今约 80% 的卖空由对冲基金完成),所以 SSE 和 SSL 都有趋势——作者仿照 Rapach et al. (2016) 去趋势并标准化(不去趋势结论也不变)。其二,SSE 一阶自相关 0.84,SSL 为 0.91,都相当持久——这一点在评判长期回归的 时要格外当心(后面会展开)。

表 1 是全景:SSE 与 SSL 标准差都被标准化到 100,但它俩并不重合;与一众经典预测变量(情绪 SENT、市盈率 PE、信用利差 CS、期限利差 TS……)的相关性也都不高,预示着 SSE 携带的是独立信息

Table 1

Table 1

5 主要结果:投得越准,市场越快见顶

核心结果。 把未来市场超额收益对当月 SSE 做回归:

负号正是故事的全部。SSE 高,意味着卖空者这个月精准地把资本砸在了高估股票上——而高 SSE 之所以出现,是因为市场整体偏贵、被高估的股票更多、聪明的卖空者于是更使劲地对准它们(呼应 Hanson & Sunderam, 2014 的直觉)。两股力量叠加,推高了 ASI 与 MISP 的协方差,也就是 SSE。所以高 SSE 既是「今天市场偏贵」的信号,也预示「明天市场收益偏低」。

更妙的是时间结构:预测力在短期最强,随期限拉长而衰减。这恰恰符合「高效卖空 = 活跃套利 = 快速纠错」的逻辑——错误定价被抓住后,纠正得很快,市场也很快把未来收益兑现掉。

它没有被 SSL 吃掉。 同时放进 SSL 和一众其他预测变量后,SSE 依旧显著——它装的不是「卖空力气」,是「卖空准度」。样本外检验(Campbell & Thompson, 2008;Goyal & Welch, 2008 的范式)也确认 SSE 击败了「历史均值」这个出了名难超越的基准,且对加上经济约束(限定股权溢价的符号与取值)后依然稳健。作者还做了一长串稳健性:换一种 SSE 算法、换去趋势方式、纳入微小市值股、控制其他卖空驱动因素、剔除金融危机、bootstrap……结论不动。

Warning

12 个月那个 8.49% 看着很大,但别被吓到——SSE 自相关高达 0.84,叠加重叠样本,长期预测回归的 t 值天然会被夸大。这不是本文独有的毛病,是整条文献的通病(关于这道小样本陷阱,详见《用更多的数据,买来更大的偏差》)。月度那个 −3.50t 值要可信得多。

6 一个意外的彩蛋:SSE 与 CAPM 何时「灵验」

如果 SSE 真的标记了「套利在活跃、错误定价在被纠正」,那它应该和市场有效性挂上钩。作者于是把 SSE 和资本资产定价模型 (CAPM) 的表现对照起来看,得到全文最漂亮的一张图。

做法是:按市场 beta 把股票分成十组,画出「平均收益对 beta」的证券市场线 (security market line, SML)。结果——

Figure 3: SSE and the security market line. In this graph, we plot the average returns of stock portfolios against the CAPM beta (i.e., the security m

Figure 3: SSE and the security market line. In this graph, we plot the average returns of stock portfolios against the CAPM beta (i.e., the security m

这个反转初看反直觉,细想却顺理成章:高 SSE 意味着此刻错误定价正盛、套利者正忙着纠错,市场尚未「干净」,所以 beta 与收益脱节;而低 SSE 之后,纠错已基本完成,市场回到 CAPM 描述的有效状态,beta 才重新「定价」。这与近年「CAPM 只在特定时点灵验」的发现一脉相承——宏观公告日(Savor & Wilson, 2014)、低情绪期(Antoniou et al., 2016)、低保证金要求时(Jylha, 2018)。本文给这份清单添了新的一条:低 SSE 之后

(关于 CAPM 的 beta 异象为何「看天吃饭」,可对照《波动率之谜,藏在 beta 异象的「时机」里》《时变的 beta,被低估了二十年的风险》。)

此外,预测力在衰退期、高波动期、低公开信息期最强——这与 Kacperczyk, Van Nieuwerburgh & Veldkamp (2016) 的论点合拍:当总体风险冲击更剧烈、公开信息更稀缺时,信息处理(也就是卖空者的「找高估」本领)最值钱。

7 文献脉络

这条线的源头,是 Miller (1977) 那个古老的洞见——当存在卖空约束、又有意见分歧时,价格会被乐观者绑架、偏向高估。于是「卖空 = 纠正高估的力量」成了整条文献的母题。

接着是横截面的黄金年代:Nagel (2005)、Boehmer, Jones & Zhang (2008)、Engelberg, Reed & Ringgenberg (2012),一篇篇坐实了「被卖空多的股票、被卖空者盯上的股票,未来收益更差」——卖空者是有信息的。Hanson & Sunderam (2014) 更进一步,从卖空利益里读出了套利资本的多寡与「成长与极限」。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

横截面讲透了,时间序列才刚开始。Stambaugh, Yu & Yuan (2015) 用 11 个异象造出了那把「错误定价的尺子」MISP;Rapach, Ringgenberg & Zhou (2016) 则把卖空加总,证明「总量」能预测股权溢价。本文站在这两块基石上,做了一件前人没做的事:把卖空的「数量」与「位置」合在一起,第一次把「卖空的处置(disposition)」与整个市场的价格走向连了起来。它既是 Rapach et al. (2016) 的延伸,又是对它的修正——总量重要,但总量去了哪里,更重要。

8 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:SSE 不就是 SSL 加了个权重吗,凭什么说它「不同」?

关键在去均值。MISP 去均值后,SSE 等于「高估股票上的卖空 − 低估股票上的卖空」,于是与错误定价无关的对冲性/供给性卖空噪声在两端相抵、被约掉;SSL 是横截面均值,约不掉这些噪声。两者相关 0.60 但并不重合,控制了 SSL 后 SSE 仍显著。

Q:负号会不会只是「市场贵→未来收益低」的老套故事,跟卖空没关系?

部分是,但不全是。高 SSE 确实标记了「今天偏贵」,可它同时携带了 SSL 与一众估值/宏观预测变量装不下的增量信息(控制后仍显著、样本外胜过历史均值)。它多出来的那块,是「套利者此刻有多活跃、纠错有多快」——这从「短期预测力最强、SML 反转」两个独立证据上能看出来。

Q:R² = 8.49% 是不是好得不真实?

对长期、重叠、强自相关(AR1=0.84)的预测回归,t 系统性偏高,是文献公认的小样本陷阱。该数字别单独信,要看它和月度 −3.50、以及样本外检验、bootstrap 是否一致——本文这几样都做了,算扎实。

Q:卖空者「打得准」,会不会只是因为他们借得到券(供给好)?

作者专门排查过:SSE 与机构持股(卖空供给侧代理)的相关性低于 SSL,且控制机构持股后 SSE 仍显著。这说明 SSE 抓的是「投向高估的卖空资本」,而非「能借到多少券」。

Q:为什么低 SSE 之后 CAPM 反而灵验,这不矛盾吗?

不矛盾。高 SSE = 错误定价正盛、套利者正在场内拔河,市场未达有效,beta 与收益脱节;低 SSE = 纠错已基本完成,市场回到有效,beta 重新被定价、SML 上斜(斜率 0.89, t=11.09)。SSE 低,恰恰是「市场已经被打扫干净」的信号。

Q:MISP 用的是滞后异象,会不会有前视偏误?

基本没有。11 个异象里除了「财务困境」可能用到当月信息,其余 10 个都用月前信息构造;卖空取月中快照,所以 SSE 主要反映卖空者错误定价的反应。作者也用滞后一期 MISP 重算过,结论不变(因 MISP 个股层面高度持久)。

(b) 几个可能的研究问题与提案

1. 把 SSE 搬到公司债/信用市场。 【经济故事】公司债同样有「错误定价 + 做空摩擦」,而信用市场的卖空(或 CDS 买入)更稀缺、更受约束。一个「信用市场版 SSE」——把异常 CDS 净买入对债券错误定价分数做横截面回归——也许能预测信用利差的总体走向。 【可行性】中。需 Markit CDS、TRACE 债券价格、以及一套债券层面的错误定价度量(这步最难,需自建)。识别同属预测回归,干净度受限于错误定价代理的质量。

2. 外资持有人会让 SSE 变「钝」吗? 【经济故事】若某些股票的边际投资者是受约束、慢反应的外资被动持有人,套利者纠错会更慢,SSE 对未来收益的预测期限可能被拉长。 【可行性】中。需 13F + Factset/EPFR 的外资持股,按外资持股比例做条件分组的预测回归。识别靠横截面异质性,doable,但外资持股的内生性需小心。

3. SSE 与流动性供给的交互。 【经济故事】卖空者纠错的速度,应取决于做市与流动性供给是否充裕;流动性枯竭时,高 SSE 也许「投得准却纠不动」,预测期限被拉长。 【可行性】高。流动性指标现成(Amihud、价差),把 SSE 与流动性状态交乘进预测回归即可。纯时间序列,最容易落地。

4. 把 SSE 拆成「真套利」与「对冲性噪声」。 【经济故事】本文论证噪声被约掉了,但若能直接把卖空按动机(套利 vs. 可转债/期权对冲)分离,就能验证「只有套利那部分驱动了预测力」这一机制。 【可行性】低到中。识别动机需可转债持仓、期权未平仓等辅助数据来「剥离对冲性卖空」,数据拼接难,但机制检验价值高。

我的判断

贡献。 本文最漂亮的地方,是一个「显而易见却被所有人略过」的想法:卖空不该只数多少,还要看打在哪。把数量与位置压进一条横截面回归的斜率,既继承了 Rapach et al. (2016),又用「噪声相抵」给出了一个概念上更干净的指标。SML 反转那张图,更是把一个抽象的预测变量,落到了「市场何时有效」这个最根本的问题上——这是全文的画龙点睛。

对识别的担忧。 说到底这仍是预测回归,所有此类工作的老问题它都逃不掉:强自相关下长期 被夸大、样本期内可能有结构性变化、44 年里卖空制度(如 2008 禁空令)几经更迭。月度结果可信,长期的我会打个折。SSE 与 SSL 0.60 的相关也提醒我们,二者的「增量」虽显著,但边际信息量有限。

后续想看。 我最想看到两件事:一是把 SSE 推到信用市场和外资持有人的场景里去,检验「投得准」的逻辑在更分割、更受约束的市场是否更强、预测期限是否更长;二是用更细的卖空动机数据,直接把「真套利」从「对冲性噪声」里剥出来,给本文那个「噪声被约掉」的核心机制做一次硬碰硬的检验。若这两步都成立,SSE 就不只是又一个预测变量,而是一把丈量「套利活跃度」的通用尺子。

(关于收益可预测性为何始终是资产定价的中心议题,仍推荐回到那篇纲领性的《贴现率:资产定价的中心议题》。)

参考文献