赢家做空,输家做多:一条简单到「不该」赚钱的套利规则

[2006 RFS] Pairs Trading: Performance of a Relative-Value Arbitrage Rule
Note

本文读的是 Gatev, Goetzmann & Rouwenhorst (2006, Review of Financial Studies):用 1962–2002 年的日度数据,他们把股票两两配对、在价差拉大时「做空赢家、做多输家」,这条朴素到近乎可笑的规则,给出了最高约 11% 的年化超额收益——而且它既不是简单的均值回归,也躲得过常见的风险因子。作者把这份利润读作市场为「维护一价定律」付给套利者的报酬。

1 一个「不该」成立的策略

先讲一个华尔街的老段子。

上世纪八十年代中期,摩根士丹利的 quant 主管 Nunzio Tartaglia 召集了一队物理学家、数学家和程序员,想用统计方法在股市里淘金。他们做的事情之一,是找出那些「价格历史上总是一起动」的股票对(pairs),然后写成纪律严明的过滤规则,交给自动交易系统执行——把交易员的「盘感」彻底踢出局。1987 年,这支团队据说替公司赚了 5000 万美元。

这套打法后来有了个名字,叫配对交易 (pairs trading),是如今对冲基金和投行口中统计套利 (statistical arbitrage) 的鼻祖之一。它的逻辑简单到让人起疑:

找两只历史上「一起走」的股票。当它们之间的价差拉开时,做空涨上去的那只、做多跌下来的那只。如果历史会重演,价格终将收敛,套利者就赚到了这一口。

问题来了。如果美国股市在任何时刻都是有效的,那么这么一条只看过去价格、外加一点逆向投资常识的规则,风险调整后的收益就不该是正的。它没有用到任何基本面,没有现金流折现,没有内幕消息——它凭什么能赚钱?

这就是这篇论文要回答的张力所在。三位作者(其中 Goetzmann 和 Rouwenhorst 来自耶鲁)没有去全策略空间里翻箱倒柜地搜「最赚钱的参数」,而是尽可能朴素地把实务界对配对交易的描述照搬过来,做了一次长达四十年的体检。

2 怎么配对,怎么交易

整个实现分成两段:12 个月的形成期 (formation period) 用来配对,接下来 6 个月的交易期 (trading period) 用来交易。这两个窗口长度从研究一开始就定死了,作者特意没去调它——这一点后面会很重要。

配对怎么找? 在每个形成期里,先剔除掉 CRSP 日度文件中那些「有任意一天没成交」的股票(这一步顺手筛掉了不流动的标的)。然后给每只股票算一条累计总收益指数 (cumulative total returns index)——注意是含股息再投资的「价格」。最后,为每只股票找一个搭档:在所有候选里,挑出那只让两条标准化价格序列的离差平方和最小的股票。

一句话:在标准化的「价格空间」里做最近邻匹配。作者说,这么做是因为它最贴近交易员自己的描述——他们要找的就是两只「一起动」的股票。

怎么交易? 配好对之后,盯住历史距离最小的 top 5、top 20,以及作为对照组的 101–120 号(排在前 100 之后的那 20 对)。交易规则同样朴素:

接着,一个自然的问题是:怎么算这条策略的收益?因为配对头寸在六个月里可能开开关关好几次,作者把每对的多空头寸每日盯市,日收益按价值加权复利。用论文的记号写出来就是:

$$ r_{P,t} = \frac{\sum_{i\in P} w_{i,t}\, r_{i,t}}{\sum_{i\in P} w_{i,t}} $$

$$ w_{i,t} = w_{i,t-1}\,(1+r_{i,t-1}) = (1+r_{i,1})\cdots(1+r_{i,t-1}) $$

由于多空各一美元,这些盈亏天然就有了超额收益的解读。论文进一步区分了两个口径:一是按「投入资本 (committed capital)」算——哪怕这对股票整个交易期都没开仓,分母里也照样占着一美元;二是按「实际动用资本 (fully invested)」算——只用真正开了仓的对数当分母。前者更保守,后者更接近对冲基金灵活调度资金时的真实回报。

3 这条规则到底为什么「应该」work——一价定律与协整

到这里你可能觉得,这不就是个技术分析的花活儿吗?但真正关键的一步,是作者把它接上了一套严肃的定价语言:相对定价与一价定律。

资产定价可以分「绝对」和「相对」两种。绝对定价 (absolute pricing) 从基本面(折现的未来现金流)给证券估值,误差大、难度高。相对定价 (relative pricing) 只说一件事:两个互为紧密替代品 (close substitutes) 的证券,应该卖一样的价钱——但它不告诉你这个价钱该是多少。换句话说,相对定价允许经济里存在泡沫,只要求「同样的东西卖同样的价」。这就是 一价定律 (Law of One Price, LOP),以及 Chen & Knez (1995) 放宽出来的「近似一价定律」。

这套语言的妙处在于:如果我们把「自然状态」定义成历史交易日构成的时间序列,那么「找两只价格一起动的股票」,就等价于「找两只历史状态价格几乎相同的证券」。配对交易于是变成了一次对美国股市一价定律的检验——而且检验的是最微观的市场:单只证券的市场。

更技术一点,作者借用了 Bossaerts (1988) 和 Engle & Granger (1987) 的协整 (cointegration) 框架。假设价格服从如下统计模型:

$$ p_{it} = \cssId{a1}{\sum_{l=1}^{k} \beta_{il}\, p_{lt}} + \cssId{a2}{e_{it}}, \quad \cssId{a3}{k < n} $$

这个式子的含义是:如果 n 远大于 k,就存在一些只含两个非零坐标的协整向量——也就是说,某两只股票的「价差」会被那个平稳的 \(e_{it}\) 主导,从而回归到零。配对交易要捕捉的,正是这种暂时偏离、然后收敛的弱冗余 (weakly redundant) 关系。

Tip

关键直觉:作者不需要假设市场无效。协整框架说的是,某些资产相对于其他资产的线性组合是「弱冗余」的,它们价格的任何偏离都预期是暂时的、会回归的。利润来自于这种暂时偏离——而维护这种「不偏离太久」的状态,本身就是市场效率的一部分。

(这种「两个紧密替代品之间做相对价值套利」的思路,在债与股之间也有它的影子——可参见《同一家公司,股票和它的「违约保单」,真的在同一条船上吗?》,那里检验的是同一家公司的股票与信用之间的一价定律。)

4 主要结果:11% 从哪里来

现在揭晓那个让人起疑的数字。

在「无限制」配对(搭档不必同行业)下,top 20 组合的全投入超额收益是每月 1.44%(t = 11.56),top 5 是每月 1.31%(t = 8.84)。换算成年化,最好的组合大约 11%。即便用更保守的「投入资本」口径,top 5 和 top 20 也有每月 0.78% 和 0.81%。无论哪个口径,这个超额收益在经济上和统计上都大得惊人。

如表 1 所示,组合层面还有个有意思的细节:配对越多,分散化收益越明显——组合标准差下降,且最差月份的亏损在收窄,而最好月份的收益却相对稳定。在 474 个月里,20 对的组合只有 71 个月是负收益,而 5 对的组合有 124 个月为负。

Table 1: summarizes the excess returns for the pairs portfolios that are

Table 1: summarizes the excess returns for the pairs portfolios that are

这里藏着一个绕不开的质疑:会不会是「买卖价差反弹 (bid-ask bounce)」在作怪? 当一只股票跌到 2 个标准差触发开仓,多半是因为它刚好成交在卖一价(bid)上;下一刻它弹回买一价(ask),价差「收敛」了,但这只是微观结构的幻觉,赚不到真钱。

作者的应对干净利落:等一天再开仓。把开仓推迟一个交易日(Panel B),top 20 的月收益从 1.44% 降到 0.895%(t = 9.29),top 5 降到 0.745%(t = 6.26)。收益确实掉了一截——说明买卖价差反弹贡献了一部分——但剩下的部分依旧又大又显著。这是这篇论文最关键的一道稳健性闸门:把最廉价的质疑先堵死。

5 不是均值回归,不是已知的风险

接着,一个更尖锐的问题是:配对交易的利润,会不会只是文献里早就记录过的反转(reversal)/ 均值回归换了个马甲?

毕竟,Lehmann (1990)、Jegadeesh (1990)、Conrad & Kaul (1989) 早就发现短期收益会反转——做空近期赢家、做多近期输家本身就能赚钱。配对交易看上去也是「买输家、卖赢家」。

但真正关键的区别在于:配对交易不是无脑买全市场的输家,它只在两只历史上高度协整的股票之间做多空。作者用自助法 (bootstrap) 构造了一个对照实验:随机给每只「触发开仓」的股票配一个搭档(而不是用最小距离匹配),看随机配对能赚多少。结果是,真实的配对收益显著高于这种随机配对下的「反转收益」——也就是说,利润里有一块是配对本身带来的,而不是单只股票的均值回归。

那会不会是常见的风险因子?作者把收益对市场、规模、价值、动量(Fama & French 1996、Carhart 1997 那套)以及一些低频的制度性因子(比如违约溢价、破产风险)都回归了一遍。结论是:这些因子解释不掉配对收益的主体。倒是浮现出一个未被识别的潜在共同因子 (latent risk factor)——它和配对交易的盈利在时间上相关,最近这些年相对「沉寂」。作者把这解读为:配对利润是市场付给套利者的、为维护一价定律而执行套利的报酬。

Note

表 2 给出了配对的成交统计与组合构成——比如平均每对在六个月里开仓几次、持仓多久、收敛比例多高。这些「微观体检」帮我们看清利润到底来自频繁的小收敛,还是少数大反转。

Table 2: summarizes the trading statistics and composition of the pairs

Table 2: summarizes the trading statistics and composition of the pairs

6 数据窥探?一份「天然」的样本外检验

读到这儿,做实证的人都会皱眉:用历史价格搜出来的过滤规则,数据窥探 (data snooping) 几乎是原罪。你总能在四十年的数据里找到一条「看起来很赚」的规则。

作者这里有一手别人学不来的牌。他们 1999 年就完成并传阅了工作论文初稿,用的是截止 1998 年的数据。等到正式发表(2006),中间这几年就成了一个天然的留出样本 (holdout sample)。他们刻意不改任何参数,把原模型直接套到 1999–2002 的新数据上——

结果:top 20 全投入组合 年化平均超额收益 10.4%,年标准差仅 3.8%,Newey-West 调整后的 t = 4.82。和样本内的长期结果高度一致。

这个真·样本外检验有两层含义:其一,原来的结果不是某段特定时期的偶然产物;其二,公开传播这套策略,居然没有把它的收益特征「套利掉」——尽管业界对它充满好奇。这一点本身就耐人寻味(关于「公开之后异象会不会消失」,可对照《异象的消退,是被「套利」吃掉了,还是基本面自己缩水了?》的讨论)。

Table 8: summarizes the profitability of pairs trading when we split the

Table 8: summarizes the profitability of pairs trading when we split the

7 利润是真的吗——交易成本、卖空与破产

光有超额收益还不够,得问:扣掉摩擦还剩多少?

把这些摩擦叠在一起,配对交易在整个样本期、以及那四年真样本外里,对「交易成本低、能卖空」的参与者仍然有利可图。这是个诚实的结论:它没有声称人人都能赚到 11%,而是说,对一价定律的「执法者」而言,存在一份期望中的套利利润。

(这份「利润即风险报酬」的味道,和固定收益套利里「在压路机前面捡硬币」的隐喻异曲同工——参见《捡硬币的人,真的站在压路机前面吗?》。)

8 文献脉络

把这篇论文放回它的来路,能看得更清楚。

最早的两条线在 1980 年代末交汇。一条是 Engle & Granger (1987) 把协整这个工具交给了计量经济学;另一条是 Bossaerts (1988) 发现美国股价存在共同的非平稳成分、在组合层面是协整的。这两块拼图,给「价差会回归」提供了统计学的地基。Bossaerts & Green (1989) 与 Jagannathan & Viswanathan (1988) 则在均衡资产定价里容纳了非平稳的共同因子。

另一条平行的线是短期可预测性:Conrad & Kaul (1989)、Lehmann (1990)、Jegadeesh (1990) 记录了短期反转,Jegadeesh & Titman (1993, 1995) 则把动量与反转、过度反应讲透。配对交易看似站在这条线上,但作者要论证的恰恰是「我们不一样」。

市场整合与套利的视角来自 Chen & Knez (1995):紧密整合的市场,应给相似支付以相近价格。Froot & Dabora (1999) 用「孪生股票 (twin stocks)」(同一现金流、不同市场挂牌)检验了市场分割——这几乎是配对交易的「实验室纯净版」。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

这篇论文的位置,就在这两条线的交点上:它用协整的语言把「相对价值套利」严格化,又用四十年的数据把它当成一价定律的实证检验,最后指向一个未被现有因子捕捉的潜在共同风险。

9 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:配对交易和「买输家卖赢家」的反转策略,本质区别到底在哪?

反转策略是在单只股票层面下注其历史收益会回归;配对交易是在两只协整股票的价差上下注。作者的自助法显示,把最小距离匹配换成随机匹配后收益大幅缩水——说明利润里有一块专属于「配对」,而非单股均值回归。前者赌的是个股,后者赌的是「两者之差」。

Q:那个 11% 会不会就是买卖价差反弹的幻觉?

这是最该担心的。作者用「延迟一天开仓」直接回应:top 20 月收益从 1.44% 降到 0.895%,确实掉了,但仍有 t = 9.29 的显著性。所以反弹贡献了一部分,但远不是全部。

Q:用日度价格做协整,统计上靠谱吗?会不会是「伪协整」?

作者自己点出了伪相关价格 (spuriously correlated prices) 的风险——在庞大的股票宇宙里,任意两只股票的线性组合「弱相依」几乎总能在样本内找到,但未必是真协整。这正是为什么样本外检验(1999–2002,t = 4.82)如此关键:伪协整通常活不过样本外。

Q:既然策略 1999 年就公开了,为什么没被套利掉?

论文给出的事实是没有——样本外收益与样本内一致。一种解读是,执行这条策略需要低交易成本 + 卖空能力,门槛把多数人挡在外面;另一种是它承担了一个潜在的共同风险因子,收益是这份风险的报酬,而非免费午餐。

Q:利润是来自多头还是空头?这有什么含义?

作者通过破产风险的不对称机制预测,利润应主要来自多头(那只「输家」若幸存,其特质破产风险被证伪带来收益),并把多空分开测来验证。若利润高度集中在多头,说明它和「困境股的幸存溢价」更像,而不是对称的价差收敛。

Q:这是否意味着市场无效?

不必然。作者明确说,协整框架下的结果与某些均衡定价模型相容(如 Bossaerts 1988 那类价格协整模型)。利润可以是「维护一价定律」的执法报酬——市场之所以「近似有效」,恰恰是因为有人靠做这件事赚钱。

(b) 几个可能的研究问题与提案

1. 把配对交易搬到公司债市场。 【经济故事】同一发行人的不同债券、或评级与久期相近的「孪生债」,在一价定律下应高度协整;信用市场摩擦更大、做市商库存约束更强,价差偏离可能更久、更可交易。【可行性】中。需要 TRACE 成交数据 + Mergent FISD 的债券特征做匹配;识别上要小心流动性差异本身造成的价差,可用「同一发行人两只债券」的设计来剥离信用风险(思路类似《同一个发行人的两只债券,戳破了「火线甩卖」的幻觉》)。

2. 那个「潜在共同因子」到底是什么? 【经济故事】作者发现配对利润和一个未识别的潜在因子相关,且近年沉寂。如果能把它对上套利资本的供给(对冲基金 AUM、券商资产负债表松紧、融资流动性),就能把「利润是套利者风险报酬」从隐喻变成可检验的命题。【可行性】中。需要对冲基金/Primary dealer 的资产负债表代理变量;识别可用融资冲击(如季末、监管比率收紧)做工具。

3. 外资持有人与跨市场配对。 【经济故事】Froot & Dabora 的孪生股票说明市场分割会撑开价差。若一只股票的边际持有人结构(尤其外资占比)发生外生变化,配对收敛速度是否随之改变?这能把「谁在执法一价定律」具体到投资者类型。【可行性】中偏低。需要跨国持股微观数据 + 可投资度(investability)变化作为外生冲击(思路可借鉴《外资真是「蝗虫」吗?》)。

4. 交易成本异质性下的「谁能赚」。 【经济故事】论文已指出利润偏向低成本、能卖空的参与者。用更细的成交成本数据,可以量化「在多高的成本下配对利润恰好归零」,从而刻画这条套利的「自然边界」。【可行性】高。需要机构成交成本数据(如 Keim & Madhavan 1997 那类)或现代的 transaction cost analysis 数据,做一个利润对成本的敏感度断点。

10 我的判断

这篇论文的贡献,不在于「发现了一条赚钱的策略」——华尔街早就在用——而在于它把一条业界土法,翻译成了对一价定律的严肃实证检验,并守住了实证研究里最难守的两道关:买卖价差反弹(延迟一天开仓)和数据窥探(一份近乎完美的真样本外)。在 2006 年,这是把「统计套利」搬进金融经济学殿堂的奠基性工作之一。

要说对识别的担忧,我有两点。其一,那个「潜在共同因子」终究是残差里的故事——它解释了收益的时间变化,却没有被独立测量出来;「利润是执法一价定律的报酬」是个漂亮的叙事,但严格说仍是事后归因。其二,破产风险不对称这条机制虽然被分开测了多空,却很难和「困境股幸存溢价」彻底切割——利润究竟是套利报酬,还是某种被错标价的尾部风险补偿,留了一个口子。

后续我最想看到的,是把这个潜在因子钉到一个可观测的套利资本约束上:当融资流动性收紧、套利者被迫去杠杆时,配对价差是否更宽、收敛是否更慢、事后利润是否更高?如果能做出来,「市场有效是被套利者用真金白银维护出来的」这句话,就不再只是一个优雅的结尾。

参考文献