动量到底是谁干的?——把成交单拆成大小两摞来看

[2006 RFS] A Trade-Based Analysis of Momentum
Note

本文读的是 Hvidkjaer (2006, Review of Financial Studies):作者用 1983–2002 年全部 NYSE/AMEX 股票的逐笔成交数据,把每一笔交易按金额拆成「小单」和「大单」,去看在 Jegadeesh-Titman 动量组合里到底是谁在买、谁在卖。结论是——小单(散户)对过去的收益反应极其迟钝,先是「该卖不卖」的初始反应不足,再慢慢演变成一年后的强烈抛压;而大单(机构)几乎看不到这种迟钝,更像是早早就在顺势而为。更关键的是,形成期的小单失衡能显著预测未来的动量收益,说明散户的反应不足,确实是动量效应的一部分推手

1 引言:一个被问了三十年的"为什么"

Jegadeesh 和 Titman (1993) 留给金融学一个挥之不去的事实:买入过去半年到一年的赢家、卖空同期的输家,能在接下来的几个月里持续赚钱。这个 动量效应 (momentum effect) 顽固到让人不安——它扛过了样本外检验,在非美国市场上也成立,在原始样本期之后依然存在。它不像一个统计噪声,更像是市场效率假说身上的一道裂缝。

于是一个根本性的问题被反复追问:这种收益的延续,到底是从哪里来的?

学界给出了两条路。一条是行为金融的解释:天真的投资者带着有偏的预期入场,要么对消息反应不足、要么过度自信,价格因此慢慢地、而不是一步到位地调整。另一条是理性的解释:动量不过是预期收益在横截面上的差异,跟时间序列上的可预测性无关(Conrad and Kaul, 1998)。

两条路争了很多年,但争论的对象一直是收益——大家盯着 portfolio 的回报曲线,反复地切片、调整、归因。本文作者却换了个角度,问了一个朴素得近乎"笨"的问题:

如果动量真是某种行为偏差造成的,那这种偏差总得通过有人真金白银地买、有人真金白银地卖才能反映到价格上吧?那我们为什么不直接去看,赢家和输家的成交单里,到底是谁在动手?

这就是这篇文章的全部出发点。Shleifer (2000) 有一句话被作者反复引用:认知偏差和资产价格之间的链条,就是投资者的买卖行为本身。既然如此,与其在收益里绕圈子,不如直接走到交易这一层,看看成交的指纹是否和某个行为假说对得上。

(关于"异象收益究竟是被谁推动的"这个更一般的问题,可参见《异象收益究竟是谁推动的?——把每一个百分点拆给「投资者」和「动机」》。)

2 第一步:把"谁在买卖"看清楚

要看清交易,先得解决两个技术问题。

其一,每一笔交易既是买、又是卖,怎么定方向? 市场微观结构区分了主动方和被动方:主动交易者用市价单索取即时性,通常在报价中点之上成交(买)、之下成交(卖);被动方则通过做市或限价单提供即时性。价格主要随主动方的方向变动——无论她只是单纯消耗流动性,还是因为她可能掌握了私有信息(Kyle, 1985;Glosten and Milgrom, 1985;Easley and O'Hara, 1987)。所以交易失衡 (trade imbalance) 指的是主动交易者之间的失衡:主动卖多于主动买,就是卖压;反之就是买压。

具体怎么给每笔交易贴上"买"或"卖"的标签?数据本身(ISSM 和 TAQ)不告诉你这个,于是作者用了微观结构里的标准做法——Lee and Ready (1991) 算法:成交价在报价中点之上记为买、之下记为卖,正好落在中点上的就用"tick test",拿它和前一笔成交价比。

其二,怎么区分散户和机构? 这一步是全文的命门。作者没有机构/个人的身份标签,他用的是 Lee (1992) 的代理变量——按成交金额的大小来分。小单大概率来自个人投资者,大单大概率来自机构。这不是凭空假设:Lee and Radhakrishna (2000) 用 TORQ 数据验证了"用成交规模代理个人 vs. 机构"的有效性,并指出按公司规模来调整切分点能进一步提高准确率(小公司流动性差,机构在那里也只能拆成小单交易)。

于是作者按公司规模五分位、逐月校准出一套公司特定的金额切分点,大致是这样:

规模五分位 最小 2 3 4 最大
小单上限(美元) 3,400 4,800 7,300 10,300 16,400
大单下限(美元) 6,800 9,600 14,600 20,600 32,800

中间还故意留了一个"缓冲带"(介于上限和下限之间的中单),把模糊地带踢出去,好让小单和大单的对比更干净、更有功率。接下来全部分析都只看小单和大单这两摞。

3 怎么量"买卖压力":交易失衡指标

有了买卖标签和大小分类,接下来要把"买卖压力"压缩成一个数。对每只股票 \(i\)、每一天 \(t\)、每个规模组 \(g\in\{s,m,l\}\)(小、中、大),原始的交易失衡定义为净主动买入量相对买卖平均量的比例:

$$ \widetilde{\text{IMBAL}}_{git} = \frac{\cssId{a1}{\text{BUYVOL}_{git} - \text{SELLVOL}_{git}}}{\cssId{a2}{(\text{BUYVOL}_{git} + \text{SELLVOL}_{git})/2}} $$

(当 \(\max(\text{BUYVOL}_{git},\text{SELLVOL}_{git})=0\) 时取 0。)这个指标的好处是它只看方向、不看体量:分子是净方向,分母把规模抹平了,所以一只巨无霸和一只小盘股的失衡可以放在一起比。

但这里有个微妙之处:不同股票、即便没有任何错误定价,也可能天生有不同的"预期失衡"——比如大公司、S&P 500 成分股、流动性好的股票,本身就更容易被某一方主动买卖。作者想隔离的是动量带来的那部分失衡,所以他先把原始失衡对一堆特征做横截面回归,每天都跑一次:

$$ \widetilde{\text{IMBAL}}_{gi} = a_0 + a_1 \text{SIZE}_i + a_2 \text{BM}_i + a_3 \text{AMEX}_i + a_4 \text{SP500}_i + a_5 \hat{\sigma}_i + a_6 \text{SPREAD}_i + a_7 \hat{\gamma}(1)_i + a_8 \text{DIVYLD}_i + \sum_{j=1}^{18} \delta_j \text{SIC}_{ij} + \text{IMBAL}_{gi} $$

控制变量的选择都有讲究:规模、账面市值比、行业是收益的标准控制项;标准差 \(\hat{\sigma}_i\) 抓总风险;S&P 500 哑变量同时捕捉指数套利和投资者可见度(Merton, 1987 的"投资者识别");报价价差 \(\text{SPREAD}_i\) 和一阶自协方差 \(\hat{\gamma}(1)_i\) 作为流动性/非流动性的度量(Amihud and Mendelson, 1986 的流动性clientele效应);股息率 \(\text{DIVYLD}_i\) 则因为除息日附近的交易动机。回归残差 \(\text{IMBAL}_{gi}\) 就是"异常交易失衡"——剥掉了上述特征之后,仍然剩下的那部分买卖压力。

最后把组合 \(p\) 里所有股票的异常失衡取平均,得到组合层面的失衡:

$$ \text{IMBAL}_{gpt} = \frac{1}{n}\sum_{i\in p}\text{IMBAL}_{git} $$

到这里,工具备齐了。剩下的就是把这套"成交指纹"扫描仪,对准动量组合的形成期和持有期。

4 三种假说,三种"成交指纹"

在看数据之前,作者先做了一件很漂亮的事——把不同假说翻译成可观测的交易失衡形态(论文的 Table 1)。这一步是全文论证的脊梁:因为只有先把"如果……那么成交应该长这样"写清楚,后面的数据才能真正起到证伪的作用。

这三张"指纹卡"的妙处在于:它们在持有期的形态截然不同。反应不足要求一个慢慢出现、再慢慢反转的失衡;理性模型要求持有期没有失衡;动量交易要求一个早早出现、随后消失的失衡。于是只要把真实数据的失衡曲线画出来,就能看它和哪张卡片对得上。

5 主要结果:小单的"慢半拍"对上大单的"先知"

把扫描仪打开,最惊人的反差出现了:小单和大单,过的几乎是两种人生。

先看小单(散户)。在输家股票上,形成期的大部分时间里是买压——散户在过去半年里一直在逢低买这些已经在跌的股票;到形成日,这股买压变得非常强;可随后卖压才慢慢渗进来,并在差不多一年后达到顶峰。这正好踩中了"反应不足 + 延迟反应"那张指纹卡:先是该卖不卖(初始反应不足),再是迟到的、拖了一整年的抛售(延迟反应)。赢家这边也看得到延迟反应——形成日之后的六个月里,小单买压逐渐浮现。

再看大单(机构),画面完全反过来:输家在形成期里遭遇强烈的大单卖压,到形成日卖压骤然下降,之后一年里慢慢消失;赢家则是大体对称的买压。也就是说,大单几乎看不到反应不足或延迟反应的痕迹,相反,它的形态更像是知情交易——平均而言,大交易者在做(早期的)动量交易,早早地买赢家、卖输家。

这个"大单更像知情、小单更像迟钝"的结论,还能用一个完全独立的数据源交叉验证。作者拿季度的机构持股变动来对照,发现机构持股的变化和大单失衡正相关、和小单失衡负相关——这恰好说明大单确实更多反映机构、小单更多反映个人。如表 3 所示,在输家组合上,机构平均净卖出了约 1.8% 的流通股,方向与那股大单卖压完全一致。

Table 3: shows that institutions sold on average 1.8% of the shares out-

Table 3: shows that institutions sold on average 1.8% of the shares out-

到这里,作者已经把"谁在迟钝"这件事讲得很扎实了。但一个尖锐的问题立刻浮出来:散户的迟钝固然好看,可它真的推动了价格吗?还是说,这只是一群无关紧要的人在角落里慢吞吞地买卖、对收益毫无影响?

6 真正关键的一步:从"交易压力"到"价格压力"

这是全文最难、也最漂亮的一跳。

难点在于因果:延迟反应和动量收益是在持有期里同时发生的,你没法简单地说"因为延迟卖压、所以输家继续跌"——它们纠缠在一起。但作者抓住了一个突破口:输家在形成期就已经表现出的散户初始反应不足,是先于持有期的。如果这种初始的买卖压力真的会转化成价格压力,那它就应该能预测后面的收益。

于是他在动量组合内部,再按形成期的交易失衡二次排序,然后看随后的收益。结果很硬:

在输家里,形成期带着强烈小单卖压的那一组,显著跑赢带着强烈小单买压的那一组。用六个月形成期、六个月持有期(跳过形成日后的第一个月),两组经特征调整(按规模、账面市值比、行业)的收益之差是每月 0.48%,t 值 3.28

换句话说:散户越是在某只输家上"逢低买入"(买压),这只股票后面跌得越凶;散户越是在抛售(卖压),它后面反而越抗跌。散户的钱,像是站错了队——而这种站错队,恰恰喂养了动量。

更有意思的是,这个效应集中在高换手的股票里。高换手输家中,强小单卖压组比强小单买压组每月高出约 0.60%;高换手赢家里也有显著关系;而在低换手股票里,失衡和未来收益基本无关。

这把我们引向另一篇经典——Lee and Swaminathan (2000) 发现动量和换手率有交互作用,并提出换手率本身也携带了"投资者情绪偏向某只股票"的信息。本文的小单失衡,正是一个天然的散户情绪度量。两者放在一起,作者发现:低换手输家呈现形成期卖压、高换手输家呈现强买压——这与 Lee-Swaminathan"高换手输家比低换手输家表现更差"的发现严丝合缝。反过来按失衡先排序,又会看到换手率的预测力集中在有买压的股票里。两个情绪指标,互相印证。

(关于"散户追涨"这件事的跨国证据,可参见《股票涨了,他们为什么更想交易?——46 国市场里的一条「追涨」暗线》;关于"买卖双方谁是聪明钱",可参见《买卖双方各执一词:当 193 个异象告诉你「谁是聪明钱」》。)

7 一月的影子:税收驱动交易会不会是真凶?

读到这里,一个谨慎的读者会担心:会不会这一切其实只是税损抛售 (tax-loss selling) 的季节性把戏?Grinblatt and Moskowitz (2004) 早就指出动量和收益的季节性相连,暗示税收驱动的交易在影响收益。

作者直面了这个担忧。他确实在交易压力里看到了明显的税收季节性痕迹——输家在年末出现小单卖压、紧接着一月出现买压,这正是散户年底为抵税抛掉亏损股、年初再买回来的经典图景。

Table 4: show that January returns based on the K 1 strategy are

Table 4: show that January returns based on the K 1 strategy are

但关键在于:主结论并不是被季节性驱动的。输家身上"初始小单买压、延迟小单卖压"这条主线,是贯穿全年的,并不只在年末年初出现。换句话说,税收效应是叠加在上面的一层季节性噪声,把它剥掉之后,散户反应不足的故事依然站得住。这个区分做得很克制,也很重要——它把"动量 = 一月税损交易"这个偷懒的替代解释挡在了门外。

8 文献脉络

把这篇文章放回它生长的那条藤蔓上,会看得更清楚。

源头是 Jegadeesh and Titman (1993),它把动量钉成了一个无法回避的事实。随后,解释的战争分成两个阵营:一边是理性派,Conrad and Kaul (1998) 主张动量只是预期收益的横截面差异;另一边是行为派,Barberis, Shleifer, and Vishny (1998) 的保守型投资者对消息反应不足、Daniel, Hirshleifer, and Subrahmanyam (1998) 的过度自信、以及 Hong and Stein (1999) 的"信息在有限理性的人群里缓慢扩散",都在给"反应不足/延迟反应"提供微观机制。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

但这些理论争的都是收益。真正让本文与众不同的,是它接上了另一条更"接地气"的脉络:Lee (1992) 用盈余公告前后的小单买压,第一个让我们看见"散户的成交"可以被单独识别出来;Lee and Swaminathan (2000) 把换手率和动量缝在一起,提出成交量也是情绪的尺子。本文站在这两条线的交汇处——它不去争论收益该归因于谁,而是直接走到交易这一层,用大小单的成交指纹,给行为派提供了一份"交易级"的证据。最后,它还顺手处理了 Grinblatt and Moskowitz (2004) 提出的税收季节性,把它和主效应清晰地分开。

评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:用"成交金额大小"代理散户和机构,靠谱吗?这会不会从根上动摇结论?

这是全文最脆弱、也最被作者认真对待的一环。它的辩护来自 Lee and Radhakrishna (2000) 用 TORQ 数据做的直接验证,以及按公司规模调整切分点、留缓冲带的工程化处理。再加上季度机构持股变动这个独立数据源的交叉验证(大单与机构增持正相关、小单负相关),代理的方向性是可信的。但要承认:到了 2000 年代后期,机构越来越多地把大单拆成小单算法化执行,这个代理在更晚的样本里会越来越糊——所以本文的结论更稳的是 1983–2002 这段历史。

Q:形成期失衡能预测收益,这是"价格压力",还是只是"散户挑错了股票"的相关关系?

严格说,这仍是预测性证据,不是干净的因果。作者的巧思在于用"先于持有期的初始失衡"来打破同期纠缠,但失衡和未来收益之间,仍可能藏着某个未被控制的共同特征。论文已经用横截面回归剥掉了规模、BM、流动性、行业等一堆变量,能做的控制都做了;但"散户买压预示低收益"既可以解释成"散户的买盘压不住价、反映的是错误定价",也可以解释成"散户系统性地买入了某类将来表现更差的股票"。后者其实也是行为故事,只是机制不同。

Q:这跟"动量交易者推高了价格"是一回事吗?

不是,反而几乎相反。大单(机构)才像在做动量交易(早买赢家、早卖输家),但大单失衡对随后的收益几乎没有预测力。真正预测收益的是小单失衡,而且方向是"散户买压 → 后续更差"。所以本文的故事不是"动量交易者自我实现地推高了趋势",而是"散户的反应不足拖慢了价格调整"。

Q:为什么效应偏偏集中在高换手股票?

因为高换手本身可能就是散户情绪在某只股票上沸腾的信号(Lee and Swaminathan, 2000)。换手高、又有强买压的输家,等于"一群兴奋的散户在逢低抢一只其实还要继续跌的股票",这正是反应不足最浓的地方,所以可预测性也最强。低换手股票里没人那么激动,失衡也就不携带太多信息。

Q:理性派(Conrad-Kaul)的解释被彻底否掉了吗?

没有被"彻底"否掉,但被削弱了。理性的预期收益差异假说预测持有期不该有方向性失衡;而数据里清清楚楚地出现了"先买后卖"的事件时间反转,这是理性模型给不出的。所以本文的证据更偏向行为解释,至少说明动量里有一部分是散户行为驱动的——注意作者用词很克制,是"partly"。

Q:把中单(缓冲带)扔掉,会不会丢掉了信息、甚至制造了偏差?

缓冲带是为了提高识别功率(把模糊归属的交易踢出去,让大小单的对比更干净),这是方法上的取舍而非偏差来源。代价是损失了一部分样本,但作者还做了基于股数(<1000 股为小、≥2000 股为大)的替代分类,结果定性一致,说明结论对切分方式不敏感。

(b) 几个可能的研究问题与提案

1. 把"大小单"框架搬到公司债市场。 【经济故事】公司债是机构主导、散户极少的市场,但近年 ETF 和零售平台让散户敞口上升。如果把 TRACE 的逐笔成交按金额拆成大小单,能不能在信用利差的动量/反转里,复刻出"谁迟钝、谁知情"的图景?信用市场的反应不足可能比股票更强(流动性更差、信息扩散更慢)。 【可行性】中。TRACE 有逐笔成交和方向推断的成熟方法,规模切分点可借鉴本文思路;难点是债券没有连续报价、Lee-Ready 难直接用,需要用交易商-客户方向或 dealer markups 来定向。

2. 外资持有人是"大单知情"还是"小单迟钝"? 【经济故事】本文的大单≈机构、小单≈个人,但没区分本地 vs. 外资。外资常被指责是"追涨杀跌"的不稳定资金。把成交按"可能的外资来源"再切一刀,看外资的成交指纹更像知情的大单,还是迟钝的小单,能直接检验"外资是蝗虫"的说法。 【可行性】中偏低。逐笔数据里没有国籍标签,需要在有外资身份标识的市场(如韩国、中国台湾的交易所账户级数据)做。识别策略可借本文的事件时间失衡曲线。(与《外资真是「蝗虫」吗?》的问题互补。)

3. 算法化执行普及后,"成交金额"代理还活着吗? 【经济故事】本文样本止于 2002 年。此后机构普遍把大单切成小单算法下单,"小单 = 散户"的等式可能逐渐失效。一个直接的研究是:用 2003 年后带身份标签的数据(如某些交易所的账户级数据),逐年估计"小单中散户占比"的衰减曲线,给所有用 trade-size 代理的文献划一条"保质期"。 【可行性】高(若能拿到账户级数据)。这本身就是对一整类方法的体检,价值很高。

4. 把失衡曲线做成"情绪因子",检验它能否解释截面收益。 【经济故事】小单失衡是一个干净的散户情绪度量。能否把它构造成一个横截面情绪因子,看它对动量、反转、彩票型股票等"行为味"很重的异象有没有解释力? 【可行性】高。数据和方法本文都已铺好,主要是把单只股票的失衡聚合成因子并跑标准的截面定价。

我的判断

这篇文章的真正贡献,不在于又发现了一个能预测收益的变量,而在于它换了观察的层次——从争论"收益该归因于谁",下沉到"成交单里到底是谁在动手"。把行为假说翻译成可观测的事件时间失衡形态(Table 1 那一步),再用大小单的指纹去比对,这种"先写好证伪条件、再让数据说话"的做法,方法论上是极其干净的。它给行为派提供了一份难得的、交易级的直接证据:散户确实在反应不足,而且这种迟钝部分地喂养了动量。

我对识别的两点保留:其一,"大小单 = 个人/机构"这个代理是整栋楼的地基,地基的可靠性随算法交易兴起而衰减,所以结论的外推应当谨慎地限定在 1983–2002;其二,形成期失衡预测收益,仍是预测性而非因果性的证据,"散户买压压不住价"和"散户系统性地买了将来更差的股票"在数据上很难分开,而后者其实指向一个不同的行为机制。

我接下来最想看到的,是把这套框架放进信用市场和带身份标签的数据里:一方面用账户级数据直接验证 trade-size 代理到底还剩多少效力,另一方面看在散户极少、机构主导的债券市场里,"谁迟钝、谁知情"的故事会不会被改写。如果连机构主导的市场里都能找到反应不足的痕迹,那行为解释的版图就要再扩一圈。

参考文献