买在除息前,卖在除息后:一桩把「税」和「价差」搅在一起的把戏

[1990 JFE] Dividend Capture in NASDAQ Stocks
Note

本文读的是 Karpoff & Walkling (1990, Journal of Financial Economics):在 NASDAQ 股票上,除息日 (ex-dividend day) 的异常收益与买卖价差 (bid-ask spread) 显著正相关,这种相关性随股利收益率分位单调增强、在高收益率股票里最强、且只出现在除息日而非普通交易日——这说明「股利捕获」(dividend capture) 交易确实在左右一部分股票的除息日定价,除息日收益并不只是税率的影子。

1 引言:一笔几乎「白捡」的钱

先讲一个华尔街上一度公开的把戏。

一只股票马上要除息了,每股派 1 美元股利。你在除息前一天(cum-dividend,含息)买进,过几天在除息后(ex-dividend,除息)卖出。理论上,除息那一刻股价会大致下跌一个股利的金额,所以你「左手赚了股利、右手亏了股价」,一进一出应该不赚不赔。

可如果你是一家应税公司 (taxable corporation) 呢?故事就完全变了。按当时的美国税法,公司收到的股利里有 70%(1986 年前甚至是 85%)可以从应税收入中扣除——也就是说,同样一块钱,股利收入比资本利得「更值钱」。于是「买进收息、卖出认亏」对一家公司而言可能是净赚的。媒体当年把这件事报道得沸沸扬扬,称之为「华尔街最火的游戏」[Laderman (1985)]。

这就是 股利捕获 (dividend capture):买在除息前、卖在除息后,专程去「捕获」那一笔税收上更划算的股利。

接着,一个自然的问题是:如果真有人在大规模地玩这个把戏,它会在数据里留下什么痕迹?这正是 Karpoff 和 Walkling 想回答的。而他们给出的答案,巧妙地把两个看似无关的东西——买卖价差——拧在了一起。

2 除息日收益之谜:一个被「税」垄断了二十年的解释

要理解这篇论文的张力,得先知道它在跟谁较劲。

一个被反复证实的经验事实是:除息日的股价跌幅小于股利金额,换算成收益,除息日的平均异常收益是正的。为什么?自 Elton 和 Gruber (1970) 起,主流解释是 税收惩罚假说 (tax-penalty hypothesis):对长期投资者而言,股利按个人所得税率 \(t_{jp}\) 征税,资本利得按更低的 \(t_{jg}\) 征税,所以「少分一块股利、多留一块股价」对他更划算,于是均衡里股价跌得不到一个股利那么多。

把这件事写成方程。设长期的「投资者」(investor) 是边际卖方,他在除息前卖(含息价 \(p_{jb}\))与除息后卖(除息价 \(p_{ja}\)、并领到股利 \(d_j\))之间无差异,则税后收益相等:

$$p_{jb} - (p_{jb}-p_{jo})t_{jg} = p_{ja} - (p_{ja}-p_{jo})t_{jg} + d_j(1-t_{jp})$$

其中 \(p_{jo}\) 是原始买入价。定义观察到的除息日收益 \(r_j = (p_{ja}-p_{jb}+d_j)/p_{jb}\),整理上式(两边的 \((p_{jo})t_{jg}\) 抵消,提出 \((1-t_{jg})\)),就得到税收惩罚假说下的均衡收益:

$$R_{rj} = \frac{d_j}{p_{jb}}\cdot\frac{t_{jp}-t_{jg}}{1-t_{jg}}$$

只要 \(t_{jp} > t_{jg}\)(历史上对多数应税长期投资者确实如此),\(R_{rj}>0\)——除息日收益为正,且它反映的是边际投资者的税率

二十年里,这条逻辑几乎垄断了对除息日收益的讨论。但它有个尴尬:Hess (1982) 发现,即便是股利收益率相近的股票,隐含的「税率」也千差万别;税收无法独力解释除息日收益的全部横截面差异。缺的那块拼图是什么?

Karpoff 和 Walkling 的答案是:股利捕获交易。

2.1 把第二种交易者请进模型

现在引入第二类市场参与者——股利捕获交易者 (dividend-capture trader)。文献和媒体都指出,真正在玩这个把戏的,要么是应税公司,要么是证券交易商 (dealer)。

先看公司。一家边际税率为 \(t_c\)、只对 30% 股利收入纳税(即可扣除 70%)的公司,含息买进、除息卖出能不能赚钱,取决于一个不等式。它「买进收息再卖出」的税后所得,必须盖过它的双向交易成本与持有成本,否则无利可图:

$$p_{ja} + d_j(1-0.3t_c) - p_{jb} + (p_{jb}-p_{ja})t_c \ge 2x_{cj}(1-t_c)p_j + h_j$$

这里 \(x_{cj}\) 是公司单向交易成本占股价的比例,\(p_j=(p_{ja}+p_{jb})/2\),\(h_j\) 是持有(含对冲)成本。把它整理成对除息日收益 \(r_j\) 的上界,就是方程 (4):

$$r_j \le \frac{2x_{cj}p_j - 0.7\, d_j t_c}{p_{jb}(1-t_c)} + \frac{h_j}{p_{jb}} \equiv R_{cj}$$

Tip

留意 \(R_{cj}\) 的「风险」一面:正如 Heath 和 Jarrow (1988) 指出的,真实的除息价跌幅是不确定的,短期捕获是有风险的;尤其公司要享受 70% 扣除,必须持有至少 46 天,这段时间的对冲与裸头寸成本,全压在 \(h_j\) 里。

同样地,一个对股利和资本利得都按 \(t_d\) 征税的交易商,其无利可图条件给出更干净的上界,方程 (6):

$$r_j \le \frac{2x_{dj}p_j}{p_{jb}} \equiv R_{Dj}$$

不同于 \(R_{cj}\) 可能为负,\(R_{Dj}\) 只要交易有成本就恒正。

2.2 全文的「核心方程」

但真正关键的一步在于:把税收惩罚的长期投资者和两类股利捕获者放进同一个均衡。谁的约束最紧,谁就决定了除息日收益。于是有了这篇论文的核心方程 (7):

$$ r_j = \min(\cssId{a1}{R_{rj}},\; \cssId{a2}{R_{cj}},\; \cssId{a3}{R_{Dj}}) $$

这个 \(\min\) 把整篇论文的逻辑一口气讲完了。如果 \(\min(R_{rj},R_{cj},R_{Dj})=R_{rj}\),说明股利捕获太贵、根本不划算,除息日收益由税率说了算,回到老故事;可一旦 \(R_{rj} > \min(R_{cj},R_{Dj})\),股利捕获交易者就把除息日收益往下压到自己的成本线上。而方程 (4)、(6) 都告诉我们,\(R_{cj}\)、\(R_{Dj}\) 都随交易成本递增。

于是第一条可检验的含义浮出水面:

(含义一) 在满足 \(R_{rj} > \min(R_{cj}, R_{Dj})\) 的派息股里,除息日收益与交易成本正相关。

然后,再对 \(R_{cj}\) 关于股利 \(d_j\) 求导,可以证明:只要持有成本相对股利不太离谱,

$$\frac{h_j}{d_j} < 0.7\, t_c + (1-t_c)\,x_{cj}$$

(举例:\(t_c=0.34\)、\(x_{cj}=0.005\) 时,这个条件就是 \(h_j/d_j < 0.2413\)),高股利股票就更可能吸引股利捕获。于是第二条含义:

(含义二) 除息日收益与交易成本的横截面相关性,在高股利收益率组里比在低股利组里更强。

到这里,模型的活儿就干完了。剩下的,是怎么把它逼到数据面前。

3 识别策略:把「流动性」从「股利捕获」里减掉

这篇论文最该被细读的,是它的识别。因为「收益和交易成本正相关」这件事,并不是股利捕获的专利

一个强劲的对手叫 Amihud 和 Mendelson (1986):他们论证,流动性差的股票要给投资者更高的补偿,于是所有交易日上,收益都和买卖价差正相关——这是一种流动性溢价的「客户群效应」(clientele effect),跟除息、跟税收毫无关系。(关于价差与预期收益的这条经典关系,可参见《想买走一家公司千分之一的股票,得把价格推高百分之一》。)

那么怎么把股利捕获和这种「一般性的流动性溢价」分开?作者用了三招,沿用并改良自 Karpoff and Walkling (1988) 的四步法。

第一招:用「异常收益」而非原始收益。 先对每只股票每季度估一个单因子市场模型,

$$r_{jt} = \gamma_{0jq} + \gamma_{1jq}r_{mt} + v_{jt},\qquad t=-240,\dots,-41$$

再算除息日的异常收益(方程 9):

$$\varepsilon_{jq} = r_{j0} - \hat\gamma_{0jq} - \hat\gamma_{1jq}r_{m0}$$

关键在于:流动性对原始收益的任何「一般性」影响,平均而言会被市场模型的截距 \(\gamma_{0jq}\) 吸收掉。所以当我们再做横截面回归(方程 10),

$$\varepsilon_{jq} = a_q + b_q\, SPREAD_{jq} + u_{jq}$$

里头的 \(b_q\) 度量的,就是净掉一般流动性之后、买卖价差与除息日异常收益的相关。

第二招:把时间序列平均起来做检验。 把 \(n\) 个季度的 \(b_q\) 平均(方程 11):

$$\bar b = \frac{1}{n}\sum_{q=1}^{n} b_q$$

零假设 \(H_0:\ b=0\),备择 \(H_1:\ b>0\);检验统计量服从 \(t\) 分布。这种「先季度截面、再时序平均」的 Fama–MacBeth 式做法,绕开了同一天多只股票除息带来的横截面相关问题——因为每个 \(\hat b_q\) 是无偏的,其时序的均值和标准误也就是无偏的。作者还补了一个分布假设更弱的二项检验:零假设下应有一半的 \(\hat b_q\) 为正。

第三招,也是最漂亮的一招:做安慰剂。 如果是股利捕获在起作用,那么价差和收益的正相关应该只出现在除息日;如果是 Amihud–Mendelson 的一般流动性效应,那它在普通交易日也该出现。作者于是在一组非除息日上重做同样的回归——结果,相关性消失了。这一对照,几乎是把「流动性溢价」这个对手按在桌上单独称了一次重。

买卖价差本身用 CRSP 提供的收盘买卖报价,按 $-40$ 到 $-11$ 日的均值估计:

$$SPREAD_{jq} = \frac{1}{q_t}\sum_{t=-40}^{-11}\frac{2(A_{jqt}-B_{jqt})}{A_{jqt}+B_{jqt}}$$

4 数据:为什么非得是 NASDAQ?

这就引出一个看似技术、实则要害的选择:为什么用 NASDAQ,而不是更「高大上」的纽约证券交易所?

因为之前 Karpoff 和 Walkling (1988) 用 NYSE/AMEX 数据、Stickel (1991) 用优先股数据时,都被迫使用交易成本的弱代理,结果有的代理和除息日收益正相关、有的不相关,证据飘忽。而 CRSP 的 NASDAQ 磁带恰恰直接记录了交易成本里最关键的一块——买卖价差,覆盖大量证券、跨越很长时间。换句话说,作者是为了「检验功效 (power)」而专程来 NASDAQ 的。

样本上,从 1973 年 1 月到 1985 年 12 月,磁带上识别出 53,205 笔普通、应税、现金股利。经过一系列筛选(至少 60 个收益观测估市场模型、至少 20 天估价差、至少 5 天估股利收益率,剔除只派过一次股利的公司、剔除除息窗口内有拆股的样本),最终样本是 42,207 笔现金股利、2,056 家公司、49 个季度(1973 年 10 月至 1985 年 12 月)

Table 1

Table 1

由于 CRSP 报价口径在 1980 年 7 月从「所有做市商的中位数报价」改为「最优买卖报价 (inside quotes)」,作者把全样本拆成两个子期分别汇报:1973 年 10 月–1980 年 6 月,与 1980 年 7 月–1985 年 12 月。

5 主要结果:除息日的那一笔正收益,是有人在「捕获」

先看描述统计。全样本的除息日平均异常收益是 0.89%,在 1% 水平上显著异于零——长期以来在上市股票里观察到的「除息日正收益」,在 NASDAQ 上同样成立。这个均值从第一子期的 0.92% 略降到第二子期的 0.84%(两者之差的 \(t\) 值为 1.65),与 Eades, Hess and Kim (1984) 在上市股票里看到的长期下行趋势一致。更要紧的是:当样本按股利收益率分成五分位时,除息日收益随股利收益率单调上升

Table 2

Table 2

但描述统计只是开胃菜。真正的核心检验,是那个净掉一般流动性后的价差系数 \(\bar b\)。结论是斩钉截铁的三句话:

把三句话连起来:除息日那一笔正收益,至少在一部分股票(尤其高股利股票)上,是被股利捕获交易者的交易成本顶在那里的,而不是单纯的边际投资者税率。这就回到了方程 (7) 的 \(\min\):在这些股票上,约束最紧的不是 \(R_{rj}\),而是 \(R_{cj}\) 或 \(R_{Dj}\)。

它的几个延伸含义同样重要。其一,对这些股票,除息日收益反映的是边际交易者的交易成本,而非其税率——这直接动摇了「除息日收益只看税率」的旧论断。其二,作者论证:当除息日收益为正、又存在股利捕获时,除息日收益就受股利收入个人税待遇的影响,这与 Miller and Scholes (1982) 「除息日收益对税制变化无动于衷」的主张相左。其三,股利捕获能顺带解释一批旧异象:除息日附近成交量上升(尤其高股利股票,Lakonishok and Vermaelen (1986))、1984 年税改抬高捕获成本后高股利股票除息日收益变大(Grammatikos (1989))。

6 文献脉络:从「税率」到「交易成本」的一次重心转移

把这条线捋一遍,会看到一次清晰的重心转移。

最早,Elton and Gruber (1970) 与 Brennan (1970) 立起了税收惩罚/客户群的框架:除息日收益是边际投资者税率的镜子。Kalay (1982, 1984) 紧接着提出,短期套利者的存在会给除息日收益设上一道交易成本的上下界——这是把「成本」请进除息日故事的第一步。随后 Miller and Scholes (1982) 与 Lakonishok and Vermaelen (1983, 1986) 各执一端:前者坚持除息日收益对税制变化稳健,后者用成交量证据指向税收诱导的短期交易。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

与此同时,另一条看似无关的支流——Amihud and Mendelson (1986) 的流动性溢价——为「收益和价差正相关」提供了一个税收之外的解释。这恰恰成了本文必须正面回应的竞争假说。

本文 (Karpoff and Walkling, 1990) 站在 Kalay 的成本约束之上,把 \(R_{rj}\)、\(R_{cj}\)、\(R_{Dj}\) 统一进一个 \(\min\),又用 NASDAQ 的买卖价差数据和「除息日 vs. 非除息日」的对照设计,第一次给股利捕获找到了高功效且能排除流动性混淆的证据。它和作者自己的 Karpoff and Walkling (1988)、以及随后的 Stickel (1991) 一道,把除息日研究的重心从「税率」推向了「交易成本」。多年以后,当报价单位从八分之一美元缩到一美分,人们还会回到这条线上追问:那点除息日异象,究竟有多少是「成本」给的?(顺着这条线,可参见《「差一点」的除息日:把 tick 缩到一美分,异象为什么还在?》,以及关于个人税如何渗进股价的《个人税,悄悄定价了你的股票》。)

评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:买卖价差只是「交易成本」的一部分,用它当代理可靠吗?

作者承认这是个假设,但论证它不算苛刻。Stoll and Whaley (1983) 报告组合价差与佣金的相关高达 0.996;Stoll (1989) 指出价差里的存货成本与订单处理成本是其相对固定的比例。我们真正需要的只是「价差的横截面差异,是捕获者交易成本横截面差异的好代理」——这比要求价差等于真实成本弱得多。

Q:除息日收益和价差正相关,凭什么就是股利捕获,而不是 Amihud–Mendelson 的流动性溢价?

这正是识别的命门,也是论文最硬的一招。两种机制的可证伪差异在于:流动性溢价在所有交易日都该出现,股利捕获只在除息日出现。作者在非除息日的对照样本里重做回归,相关性消失——一般流动性解释因此被排除。

Q:为什么相关性在高股利股票里最强?这难道不是「机械的」?

不是机械的,而是模型的预测(含义二)。对 \(R_{cj}\) 关于股利求导可证:满足 \(h_j/d_j < 0.7t_c+(1-t_c)x_{cj}\) 时,股利越高、公司捕获的净收益越大,越可能吸引捕获者,于是高股利组里「价差—收益」关系更紧。是经济机制,不是恒等式。

Q:那除息日收益到底反映税率,还是交易成本?

看方程 (7) 的 \(\min\) 由谁决定。在捕获不划算的股票上(\(\min=R_{rj}\)),收益反映边际投资者税率,旧故事成立;在捕获活跃的股票上(\(\min=R_{cj}\) 或 \(R_{Dj}\)),收益被顶在捕获者的成本线上,反映的是交易成本。两者并存,而非互斥。

Q:样本停在 1985 年,会不会过时?

这是有意为之。1986 年税改让股利与资本利得名义税率拉平,1984 年税改又改了公司的持有期与扣除比例;日本寿险公司在 1980 年代末也一度成为边际短期交易者。把样本截在 1985 年底,正是为了让「公司与交易商捕获」这个机制保持干净、不被后续制度变化污染。

Q:除息日均值从 0.92% 降到 0.84%,是不是说捕获在减弱?

论文没有把这点强解读为捕获减弱——两子期之差的 \(t\) 值仅 1.65,且这种长期下行在上市股票里早有记录 (Eades, Hess and Kim, 1984)。更稳妥的读法是:报价口径变化(中位数报价→最优报价)本身就会影响测得的价差与收益,这也是作者分子期汇报的原因。

(b) 几个可能的研究问题与提案

1. 把同样的识别搬到公司债的「除息日」上。 【经济故事】公司债同样付息,且持有人以应税机构、交易商为主;若存在「票息捕获」,付息日附近的异常收益也应与债券的买卖价差/流动性正相关,并在高票息债里更强。 【可行性】中。TRACE 提供成交与价差,付息日已知;难点在于公司债成交稀疏、价差度量噪声大,需要用规模自适应的流动性度量。识别可照搬「付息日 vs. 非付息日」的对照设计。

2. 外资持有人是不是另一类「捕获者」? 【经济故事】不同国家对股利/资本利得的税收待遇不同(正文已提到 1980 年代末日本寿险公司的特殊动机)。跨境投资者可能在某些股票的除息日扮演边际交易者,把除息日收益顶到他们的(含汇率对冲的)成本线上。 【可行性】中。需要带国别的持仓/成交数据(如某些市场的外资板或托管层数据),识别上可比较外资持股高/低的股票在除息日的「价差—收益」斜率差异。

3. 报价单位与交易制度变迁下的「捕获带宽」。 【经济故事】方程 (4)、(6) 把收益上界直接写成交易成本的函数。十进制化、做市商竞争、电子化都压低了 \(x\),理论上应当压低除息日收益、并削弱其与价差的相关。 【可行性】高。十进制化、Reg NMS 等是干净的时间断点,CRSP/TAQ 数据齐备,可用双重差分 (difference-in-differences, DiD) 估制度变迁对「除息日价差系数」的影响。

4. 持有成本 \(h_j\) 的直接度量。 【经济故事】模型里 \(h_j\)(对冲与裸头寸成本)是个黑箱,却决定了谁会去捕获、条件 (8) 是否成立。若能用期权对冲成本、个股波动率、借券成本去逼近 \(h_j\),可以更结构化地检验捕获的边界。 【可行性】中。期权数据(如 OptionMetrics)与借券费率可得,但样本期要往后挪,机制可能已被制度变化改写——要诚实对待外部有效性。

参考文献