无风险的钱没人捡,因为捡钱的人手太短——并购套利里的「有限套利」

[2002 JFE] Limited Arbitrage in Mergers and Acquisitions
Note

本文读的是 Baker & Savaşoglu (2002, Journal of Financial Economics):一个分散化的并购套利(risk arbitrage)组合,在 1981–1996 年间每月能赚 0.6–0.9% 的超额收益;而这笔钱并非「免费午餐」,它恰恰来自套利本身的「有限」——完成风险越高、标的越大、套利资本越少,收益就越高。

1 引言:教科书里那笔捡不起来的钱

先讲一个所有人都听过、却几乎没人较真的故事。

一家公司宣布要被收购,开价比市价高出三成。按理说,从宣布的那一刻起,目标公司的股价就该「一步到位」地跳到反映收购条款的水平——这是有效市场最朴素的承诺:信息一旦公开,价格立刻吸收。可现实里偏偏不是。宣布之后,目标股价往往只涨到一个略低于收购价的位置,留下一道缝。这道缝,就是专业的「并购套利者」(risk arbitrageur,又译风险套利、merger arb)赖以为生的东西:买进目标公司股票,等着交易完成,吃掉这道差价。

问题来了。如果这真是「稳赚」的钱,为什么它一直留在那里、没被瞬间抹平?

这正是 Baker 和 Savaşoglu 这篇 2002 年 JFE 想回答的问题。他们的答案,用一句话概括,是 Shleifer 和 Vishny (1997) 那个著名的标签——有限套利 (limits of arbitrage):钱确实在那里,但能去捡它的人,手太短了。

Tip

注意一个术语陷阱:这里的「套利」并不是教科书里那种「无风险、无资本、稳赚」的套利。并购套利者面对的是实打实的完成风险 (completion risk)——交易可能告吹。所以它本质上是在「卖保险」,赚的是风险溢价,而不是无风险利润。

2 张力:到底是「免费午餐」,还是「风险补偿」?

文章真正有意思的地方,在于它把一个老问题逼到了墙角。

目标公司股价里那道缝,可以有两种完全相反的解读。

第一种解读:市场是无效的,这道缝是白送的钱,谁去捡谁赚。第二种解读:市场是有效的,这道缝只是对「交易可能失败」这一风险的公允定价,套利者赚的每一分钱都对应着他承担的风险。

过去的文献基本停在第一种解读上。Lakonishok 和 Vermaelen (1990) 研究回购要约、Larcker 和 Lys (1987)、Dukes 等 (1992)、Karolyi 和 Shannon (1999) 研究现金要约,全都发现了「异常利润」,而且数字大得惊人。但这些研究有个共同的软肋:它们大多是事件研究式地盯住单笔交易的收益,没把这些头寸组合起来、放到一个像样的资产定价框架里去问一句——扣掉系统性风险之后,还剩多少?

Baker 和 Savaşoglu 的第一步,就是把这个问题做干净。

3 第一步:先把「超额收益」量准

他们从 Securities Data Company(SDC)数据库里,捞出 1981–1996 年间所有目标和收购方都是上市公司、且目标公司在 CRSP 有记录的并购要约,经过层层筛选,最后得到 1,901 笔纯现金或纯股票交易(1,335 笔现金、566 笔股票),覆盖 1,556 家目标公司。

接着,他们把每一笔交易都做成一个「如果交易按原条款完成、就能拿到固定回报」的套利头寸,再把所有活跃头寸等权或市值加权地揉成一个组合,逐日计算收益、按月复利,得到 1981 年 1 月到 1996 年 12 月共 192 个月度组合收益。

对现金交易,头寸最简单——直接买目标股票,收益就是目标股票的收益:

$$r_{it} = r_{Tit}$$

股票交易则要复杂一层。收购方用固定数量 \(d\) 的自家股票来换目标公司每一股,所以套利者必须买一股目标、同时做空 \(d\) 股收购方,才能锁定一个「与收购方未来股价无关」的固定回报。这笔头寸的日收益有三块:目标股票的收益、做空收购方的收益、以及做空所得的无风险利息(论文假设套利者拿不到卖空所得,因此这一块被扣掉):

$$r_{it} = r_{Tit} - (r_{Ait} - r_{ft})\, d\, \frac{P_{Ait-1}}{P_{Tit-1}}$$

把每天的组合收益按月复利起来,就得到月度组合收益:

$$R = \left[\prod \left(1 + \sum_{i=\text{active}} w_{it}\, r_{it}\right)\right] - 1$$

然后拿这个组合去跟两把尺子比:资本资产定价模型 (CAPM) 和 Fama-French 三因子模型 (Fama and French, 1996)。

结果是:这个组合确实跑赢了两个基准,月度超额收益(截距项 alpha)落在 0.6–0.9% 这个区间。但请注意石川式的一个转折——它没那么「夸张」。比起早期那些事件研究里动辄翻倍的「异常利润」,这个量级要克制得多;甚至在某一个设定下,截距在 10% 的水平上都不显著。

这是个微妙的姿态:他们一只手确认了「钱是真的」,另一只手又把这笔钱的规模拉回了地面。和他们同期、独立完成的 Mitchell 和 Pulvino (2001) 用同样的组合方法,在 1963–1999 年的样本里得到约 1% 每月的毛收益,量级相近。

Note

把单笔交易揉成组合,意义不只是「平滑」。它让作者能够第一次严肃地回答:这笔收益里有多少是 beta、有多少是真正的 alpha?答案是——分散掉个别交易的风险之后,组合层面的系统性风险很低,所以这 0.6–0.9% 大体是「干净」的超额收益。

4 但真正关键的一步:为什么这笔钱捡不光?

确认了钱是真的,下一个、也是更要命的问题立刻冒出来:既然有钱,为什么没被套利者一拥而上、瞬间抹平?

这就要回到「有限套利」的两块基石上了。

第一块基石来自 Friedman (1953) 和 Fama (1965) 的经典论证:只要有无穷多个小投资者,每个人只在某个特异风险(idiosyncratic risk)上押一丁点儿,他们整体上就近似风险中性,会把价格推到期望收益处。可这个机制在并购里失灵了——让一个普通人不经金融中介、就把自家财富的一小撮投进一个分散化的目标股票组合,这事不现实。哪怕一点点固定交易成本,除以「个人财富的一个边际零头」,都会变成高得离谱的百分比成本。

第二块基石:当错误定价的证券有一个完美且定价正确的替代品时,哪怕只有少数套利者,也能无风险地把价格逼回基本面。这正是 Scholes (1972) 和 Shleifer (1986) 关于「需求曲线是否向下倾斜」之争的核心,Wurgler 和 Zhuravskaya (2001) 后来证明,一只股票被纳入 S&P 500 时受到的需求冲击,恰恰取决于它有没有好的替代品。可在并购里,交易完成的特异风险通常无法对冲——你找不到一个「完美替代品」来锁定这道缝。

两块基石一塌,结论就出来了:在并购市场,价格不是由无穷多个风险中性的小投资者决定的,而是由少数有限的、要承担风险的、还缺资本的套利者决定的。于是有了两条核心预测:

预测 1:并购套利的收益,取决于卖压 (selling pressure) 与完成风险。

预测 2:并购套利的收益,取决于套利者的资本。

到这里,故事的反转就完成了——那道缝不是市场的失误,而是有限套利的「均衡价格」。它既证明了 Friedman-Fama 式的无摩擦套利在这里不成立,又恰恰因为这种不成立,才让收益与「完成风险、卖压、资本」之间产生了可检验的横截面关系。(关于「无风险的钱为什么没人捡」这个母题,也可参见《无风险的钱没人捡,是因为捡它的人也会怕》《无风险的钱就在眼前,他们却宁愿再等等》。)

5 模型:把「卖压」写成一个价格折扣

文章用一个极简的两状态模型,把上面的直觉钉成了一道方程。值得一步步看,因为正是这道方程给了后面的实证检验「该回归什么」的指引。

设定。一笔并购要约只有两种结局:以概率 \(p\) 成功,目标股东拿到 \(1+\pi\)(其中 \(\pi\) 是收购溢价);以概率 \(1-p\) 失败,目标回到价值 \(1\)。同时假设有一批目标股东不想承担完成风险,要卖出总共 \(X\) 股(\(X\) 外生给定)。作者分三种情形给目标股票定价。

情形一:无穷多个无交易成本的小投资者。 每人只在这个特异赌局里押一点点,因此不要求任何风险补偿,价格等于目标股票的期望收益:

$$P_T = 1 + p\pi \tag{1}$$

这正是有效市场的「应然」价格。

情形二:小投资者面对交易成本。 固定成本 \(c\) 无法摊到无穷多人头上,必须由每个交易者各自承担,于是相对于其小头寸,\(c\) 可以很大:

$$P_T = 1 + p\pi - c \tag{2}$$

情形三:有限的 \(A\) 个套利者(无交易成本)。 假设套利者是均值-方差效用最大化者,绝对风险厌恶系数为 \(\gamma\)。因为人数有限,他们不得不承担完成风险;要让他们吃下 \(X\) 股,卖方就得给一个风险溢价——哪怕这是特异风险:

$$ P_T = \cssId{a1}{1 + p\pi} \;-\; \cssId{a2}{\frac{X}{A}}\,\cssId{a3}{\gamma}\, \cssId{a4}{p(1-p)\pi^2} $$

第二项就是为了补偿这 \(A\) 个套利者所承担的特异风险、而必须给出的价格折扣。由此,期望超额收益为 \(r/P_T\),其中

$$r \equiv \frac{X}{A}\,\gamma\, p(1-p)\pi^2$$

怎么读这道方程? 它一口气讲清了四件事:超额收益随卖压 \(X\) 上升、随溢价 \(\pi\) 上升、随风险厌恶 \(\gamma\) 上升、随套利者人数 \(A\) 下降;而它对成功概率 \(p\) 的依赖是非线性的——\(p(1-p)\) 在 \(p=0.5\) 时最大,意味着「最说不准成败」的交易,完成风险最高、要求的补偿也最大。

到底是情形二(成本决定)还是情形三(套利者风险决定)说了算?作者坦言这是个经验问题:如果 \(r < c\),价格由交易成本(2)式决定;反之由(3)式决定。如果是(3)式成立,那么收益就该和卖压、溢价、风险厌恶系数正相关,和套利者人数负相关——这恰好是后面要去数据里找的东西。

Warning

模型刻意留白了许多真实风险:条款被修订、半路杀出竞争者、交易拖延、做空被强制平仓。作者的处理是诚实的——能度量的(如修订频率、是否首发要约)就度量,度量不了的(如「延迟」的事前概率)就直说「因为没有好的代理变量,被迫从实证模型里略去」。

6 实证:把模型的三个旋钮,逐一拧给数据看

模型说收益由「完成风险、卖压、套利资本」三个旋钮决定。作者就一个个去数据里找证据。

旋钮一:完成风险。 完成风险由两部分构成:成功概率 \(p\) 向 0.5 靠拢、以及成败之间的支付差 \(\pi\) 变大。怎么估 \(p\)?作者用「并购结局对收购方态度(友好/敌意)的回归」来预测——和 Walkling (1985)、Schwert (2000) 一样,他们发现收购方态度是预测并购成败的最佳单一变量。而 \(\pi\) 的代理,则用宣布后按目标公司市值缩放的收购溢价。结果与预测 1 一致:超额收益随完成风险上升

旋钮二:卖压(用标的规模代理)。 宣布之后目标公司的规模,可以代理「目标股东抛售的美元金额」。结果同样支持:超额收益随标的规模上升——大交易意味着更大的卖压被压到有限的套利者头上,于是要更高的补偿。

旋钮三:套利资本。 这是最巧、也最弱的一块。作者用机构持仓数据来识别谁是套利者:并购套利意味着在宣布后建立目标公司多头,所以他们把「经常从零持仓跳到正持仓」的机构定义为套利者,再把这些机构每季度的总股票持仓加总,作为「套利资本」的度量。预测是:当这个资本下降时,随后的收益应该上升。数据方向上确实如此——但这第三个横截面结果,统计上不如前两个那么硬

这三块拼在一起,构成了一个相当完整的「有限套利」证据链:收益不是天上掉的,它系统性地随着模型里那几个旋钮变动。

7 文献脉络

把这条线索拉直来看,会更清楚这篇文章站在哪里。

最上游,是 Friedman (1953) 与 Fama (1965) 那套「无穷多小套利者 ⇒ 近似风险中性 ⇒ 价格 = 基本面」的乐观叙事。紧接着,Scholes (1972) 和 Shleifer (1986) 捅破了一个口子:如果没有完美替代品,股票的需求曲线可以向下倾斜,价格会被卖压推动。

真正的转折点是 Shleifer 和 Vishny (1997) 的「有限套利」——他们指出,套利者本身受代理与信息成本的约束,能筹到的资本是有限的;Merton 和 Perold (1993)、Froot 和 Stein (1998)、以及 Stein (1999) 进一步说明了资本约束的「流量成本」与「存量成本」从何而来。与此平行,DeLong 等 (1990) 的噪声交易者风险、Froot 和 Dabora (1999) 对 Royal Dutch/Shell「孪生股」长期背离的记录,都在反复敲打同一个钉子:套利远不是无风险的。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

在并购这个具体战场上,早期的事件研究(Lakonishok 和 Vermaelen, 1990;Larcker 和 Lys, 1987;Dukes 等, 1992)记录了「异常利润」却没解释它为何不被抹平。理论这边,Cornelli 和 Li (2001) 关注套利者作为「知情大股东」的主动角色,但不预测平均交易上的异常利润。Baker 和 Savaşoglu 的位置因此很清晰:他们聚焦边际套利者的收益,用组合方法把超额收益量准,再用一个极简的卖压模型,把这笔收益与完成风险、卖压、资本一一对应起来——这正是把 Shleifer-Vishny 的抽象框架,落到一个干净可测的市场上。几乎同时,Mitchell 和 Pulvino (2001) 用相同的组合思路给出了独立的、互相印证的证据。

8 评论与延伸(Q&A + 研究方向)

Q:这跟「教科书套利」到底差在哪?为什么还叫套利?

教科书套利是「两个完全相同的资产卖不同价」——无资本、无风险、稳赚。并购套利里,目标股票和「未来换到的收购方股票」只是相似而非相同,中间隔着一个会失败的交易(完成风险),而且建仓需要真金白银的资本。所以它本质是在卖保险、赚风险溢价。叫「套利」是行业习惯,作者特意点明了这层区别。

Q:0.6–0.9% 每月听着很高,是不是又一个「纸面富贵」?

作者自己就很克制。第一,这是扣掉 CAPM 和三因子 beta 后的 alpha,组合层面系统性风险很低;第二,他们承认在某个设定下截距 10% 都不显著;第三,模型刻意略去了交易拖延、强制平仓等真实成本。Mitchell 和 Pulvino (2001) 进一步显示,一旦给组合加上「单笔交易投资上限」并因此持有大量现金,毛收益会被砍掉约三分之二。所以这是真收益,但别当成随手可得的钱。

Q:用「会失败」的交易做空收购方,做空成本和强制平仓难道不致命吗?

这恰恰是模型的软肋之一,作者也坦承。股票交易里做空收购方面临卖空成本,以及在价格背离时被券商强制召回的风险——这些大体是特异风险,会在更一般的(3)式里被定价,却没法进入简化模型。这也是为什么他们同时报告了「只含现金交易」的组合做稳健性。

Q:把「从零跳到正持仓的机构」定义为套利者,会不会太粗糙?

会,而且作者也承认第三个结果统计上最弱。这个定义可能把一部分普通的事件驱动型机构、甚至偶发建仓误判进来,也可能漏掉用衍生品或不申报渠道操作的真套利者。「套利资本」的度量误差,很可能就是它显著性偏弱的原因。

Q:成功概率 \(p\) 用「收购方态度」来估,可靠吗?

这是文献里的标准做法,Walkling (1985) 和 Schwert (2000) 都发现态度(友好 vs. 敌意)是预测成败的最佳单一变量。但它毕竟是个粗糙的二元代理,真实的 \(p\) 还取决于反垄断、融资、监管等一堆因素。好在模型只需要 \(p\) 的「事前排序」大致正确,就能检验 \(p(1-p)\) 这个非线性形状。

Q:这篇对「市场是否有效」这个老争论,到底站哪边?

它给出的是一个调和式的答案:价格里那道缝既不是纯粹的无效(白送的钱),也不是纯粹的有效(无摩擦定价),而是「有限套利」下的均衡——市场在套利者能力的约束内是「有效」的,超额收益正是这种约束的影子价格。这比简单地喊「有效」或「无效」要深一层。


几个可能的研究问题与提案

1)把「套利资本」换成更干净的度量,重做预测 2。 【经济故事】预测 2(收益随套利资本下降而上升)是本文最弱的一环,瓶颈在「谁是套利者」的识别。如果能用并购套利对冲基金的实际 AUM、或专门的事件驱动基金资金流来度量资本,预测 2 也许能被检验得更硬。 【可行性】中。需要对冲基金数据库(如 HFR、Lipper TASS)按策略分类,识别 merger-arb / event-driven 基金的资金流;识别策略是把「资本冲击」当作准外生的供给变动。难点是基金分类噪声大、且资金流本身可能内生于收益。

2)把同一框架搬到公司债 / 信用市场的并购里。 【经济故事】并购同样冲击目标公司的债券(杠杆变化、控制权条款),而公司债市场的流动性更差、做市商资本约束更紧,「有限套利」的故事在这里可能更强。完成风险对债券的定价折扣,或许比股票更大。 【可行性】中。需要 TRACE 的公司债成交数据匹配 SDC 并购样本;识别上可沿用本文的「完成风险 × 卖压」分解,并额外利用债券流动性度量。挑战是公司债成交稀疏、价格噪声大。(这条线与《央行没买你的债,你却也跟着发了债》所代表的「资本结构与外部冲击」视角天然相邻。)

3)外资持有人是不是并购套利资本的「边际供给者」? 【经济故事】本文把套利资本当成一个总量。但如果跨境套利基金在某些时期撤出(如本国危机、资本管制收紧),目标股票的卖压补偿就该上升。外资作为边际套利者的进出,可能解释收益的时间序列波动。 【可行性】中偏低。需要按国别拆分的机构持仓(如 FactSet/13F 配合国别标识),并找到外资进出的外生冲击(如汇率危机、跨境税收变动)。识别干净与否,取决于能否找到只影响外资供给、不影响交易基本面的工具。

4)用「做空潜力」重新审视卖压渠道。 【经济故事】股票交易里套利者必须做空收购方,做空难度本身就是套利资本的约束之一。如果某些目标/收购方更难被做空,套利者要的补偿应更高。这把本文的「资本约束」具体化到了做空市场。 【可行性】高。可用券源数量、借券费率(如 Markit/IHS 的 securities lending 数据)匹配并购样本;识别上把借券成本当作套利摩擦的代理。相关思路可参考《想躲开套利者的「做空」,就用现金买下它》


我的判断。 这篇文章的贡献,不在于「发现并购套利能赚钱」——这早就有人说过;而在于它把一笔被反复观察、却语焉不详的「异常利润」,第一次放进了有限套利的均衡框架里,并用一个极简模型导出了三个可检验的横截面关系,再逐一对上了数据。它漂亮地示范了:当你既能把超额收益量准(组合方法),又能给它一个结构化的解释(卖压模型),「市场有没有效」这个口水仗就能被推进成一个可证伪的实证命题。

对识别,我有三点担忧。其一,「套利资本」的度量最弱,「从零跳到正持仓」的机构定义既可能混入噪声、又可能漏掉真套利者,这直接拖累了预测 2 的说服力。其二,完成概率与溢价的内生性——同一笔交易的 \(p\) 和 \(\pi\) 很可能由共同的基本面(行业景气、反垄断环境)驱动,回归里很难完全剥离。其三,模型把卖压 \(X\) 当外生,但卖压本身可能和完成风险相关(越可能失败、想跑的股东越多),这会让(3)式的几个旋钮纠缠在一起。

我接下来最想看到的,是把「套利资本」做成真正外生的供给冲击——无论是基金资金流、跨境资本管制,还是做空市场的券源约束——去干净地检验那条最弱的预测 2。如果资本渠道能被钉死,「有限套利」就从一个解释框架,升级成了一个有因果含义的市场摩擦理论。

参考文献