赢家做空，输家做多：一条简单到「不该」赚钱的套利规则

[2006 RFS] Pairs Trading: Performance of a Relative-Value Arbitrage Rule

Evan Gatev, William N. Goetzmann, K. Geert Rouwenhorst

Jun He June 01, 2026

套利相对价值市场有效性统计套利

Note

本文读的是 Gatev, Goetzmann & Rouwenhorst (2006, Review of Financial Studies)：用 1962–2002 年的日度数据，他们把股票两两配对、在价差拉大时「做空赢家、做多输家」，这条朴素到近乎可笑的规则，给出了最高约 11% 的年化超额收益——而且它既不是简单的均值回归，也躲得过常见的风险因子。作者把这份利润读作市场为「维护一价定律」付给套利者的报酬。

1 一个「不该」成立的策略

先讲一个华尔街的老段子。

上世纪八十年代中期，摩根士丹利的 quant 主管 Nunzio Tartaglia 召集了一队物理学家、数学家和程序员，想用统计方法在股市里淘金。他们做的事情之一，是找出那些「价格历史上总是一起动」的股票对（pairs），然后写成纪律严明的过滤规则，交给自动交易系统执行——把交易员的「盘感」彻底踢出局。1987 年，这支团队据说替公司赚了 5000 万美元。

这套打法后来有了个名字，叫配对交易 (pairs trading)，是如今对冲基金和投行口中统计套利 (statistical arbitrage) 的鼻祖之一。它的逻辑简单到让人起疑：

找两只历史上「一起走」的股票。当它们之间的价差拉开时，做空涨上去的那只、做多跌下来的那只。如果历史会重演，价格终将收敛，套利者就赚到了这一口。

问题来了。如果美国股市在任何时刻都是有效的，那么这么一条只看过去价格、外加一点逆向投资常识的规则，风险调整后的收益就不该是正的。它没有用到任何基本面，没有现金流折现，没有内幕消息——它凭什么能赚钱？

这就是这篇论文要回答的张力所在。三位作者（其中 Goetzmann 和 Rouwenhorst 来自耶鲁）没有去全策略空间里翻箱倒柜地搜「最赚钱的参数」，而是尽可能朴素地把实务界对配对交易的描述照搬过来，做了一次长达四十年的体检。

2 怎么配对，怎么交易

整个实现分成两段：12 个月的形成期 (formation period) 用来配对，接下来 6 个月的交易期 (trading period) 用来交易。这两个窗口长度从研究一开始就定死了，作者特意没去调它——这一点后面会很重要。

配对怎么找？ 在每个形成期里，先剔除掉 CRSP 日度文件中那些「有任意一天没成交」的股票（这一步顺手筛掉了不流动的标的）。然后给每只股票算一条累计总收益指数 (cumulative total returns index)——注意是含股息再投资的「价格」。最后，为每只股票找一个搭档：在所有候选里，挑出那只让两条标准化价格序列的离差平方和最小的股票。

一句话：在标准化的「价格空间」里做最近邻匹配。作者说，这么做是因为它最贴近交易员自己的描述——他们要找的就是两只「一起动」的股票。

怎么交易？ 配好对之后，盯住历史距离最小的 top 5、top 20，以及作为对照组的 101–120 号（排在前 100 之后的那 20 对）。交易规则同样朴素：

当一对股票的价差拉开到超过 2 个历史标准差（标准差在形成期估计）时，开仓——做多便宜的、做空贵的，各一美元；
在价差下一次穿越（收敛）时平仓；
如果到交易期结束都没收敛，就在最后一天按市价了结。

接着，一个自然的问题是：怎么算这条策略的收益？因为配对头寸在六个月里可能开开关关好几次，作者把每对的多空头寸每日盯市，日收益按价值加权复利。用论文的记号写出来就是：

$$ r_{P,t} = \frac{\sum_{i\in P} w_{i,t}\, r_{i,t}}{\sum_{i\in P} w_{i,t}} $$

$$ w_{i,t} = w_{i,t-1}\,(1+r_{i,t-1}) = (1+r_{i,1})\cdots(1+r_{i,t-1}) $$

由于多空各一美元，这些盈亏天然就有了超额收益的解读。论文进一步区分了两个口径：一是按「投入资本 (committed capital)」算——哪怕这对股票整个交易期都没开仓，分母里也照样占着一美元；二是按「实际动用资本 (fully invested)」算——只用真正开了仓的对数当分母。前者更保守，后者更接近对冲基金灵活调度资金时的真实回报。

3 这条规则到底为什么「应该」work——一价定律与协整

到这里你可能觉得，这不就是个技术分析的花活儿吗？但真正关键的一步，是作者把它接上了一套严肃的定价语言：相对定价与一价定律。

资产定价可以分「绝对」和「相对」两种。绝对定价 (absolute pricing) 从基本面（折现的未来现金流）给证券估值，误差大、难度高。相对定价 (relative pricing) 只说一件事：两个互为紧密替代品 (close substitutes) 的证券，应该卖一样的价钱——但它不告诉你这个价钱该是多少。换句话说，相对定价允许经济里存在泡沫，只要求「同样的东西卖同样的价」。这就是 一价定律 (Law of One Price, LOP)，以及 Chen & Knez (1995) 放宽出来的「近似一价定律」。

这套语言的妙处在于：如果我们把「自然状态」定义成历史交易日构成的时间序列，那么「找两只价格一起动的股票」，就等价于「找两只历史状态价格几乎相同的证券」。配对交易于是变成了一次对美国股市一价定律的检验——而且检验的是最微观的市场：单只证券的市场。

更技术一点，作者借用了 Bossaerts (1988) 和 Engle & Granger (1987) 的协整 (cointegration) 框架。假设价格服从如下统计模型：

$$ p_{it} = \cssId{a1}{\sum_{l=1}^{k} \beta_{il}\, p_{lt}} + \cssId{a2}{e_{it}}, \quad \cssId{a3}{k < n} $$

这个式子的含义是：如果 n 远大于 k，就存在一些只含两个非零坐标的协整向量——也就是说，某两只股票的「价差」会被那个平稳的 $e_{it}$ 主导，从而回归到零。配对交易要捕捉的，正是这种暂时偏离、然后收敛的弱冗余 (weakly redundant) 关系。

Tip

关键直觉：作者不需要假设市场无效。协整框架说的是，某些资产相对于其他资产的线性组合是「弱冗余」的，它们价格的任何偏离都预期是暂时的、会回归的。利润来自于这种暂时偏离——而维护这种「不偏离太久」的状态，本身就是市场效率的一部分。

（这种「两个紧密替代品之间做相对价值套利」的思路，在债与股之间也有它的影子——可参见《同一家公司，股票和它的「违约保单」，真的在同一条船上吗？》，那里检验的是同一家公司的股票与信用之间的一价定律。）

4 主要结果：11% 从哪里来

现在揭晓那个让人起疑的数字。

在「无限制」配对（搭档不必同行业）下，top 20 组合的全投入超额收益是每月 1.44%（t = 11.56），top 5 是每月 1.31%（t = 8.84）。换算成年化，最好的组合大约 11%。即便用更保守的「投入资本」口径，top 5 和 top 20 也有每月 0.78% 和 0.81%。无论哪个口径，这个超额收益在经济上和统计上都大得惊人。

如表 1 所示，组合层面还有个有意思的细节：配对越多，分散化收益越明显——组合标准差下降，且最差月份的亏损在收窄，而最好月份的收益却相对稳定。在 474 个月里，20 对的组合只有 71 个月是负收益，而 5 对的组合有 124 个月为负。

Table 1: summarizes the excess returns for the pairs portfolios that are

这里藏着一个绕不开的质疑：会不会是「买卖价差反弹 (bid-ask bounce)」在作怪？ 当一只股票跌到 2 个标准差触发开仓，多半是因为它刚好成交在卖一价（bid）上；下一刻它弹回买一价（ask），价差「收敛」了，但这只是微观结构的幻觉，赚不到真钱。

作者的应对干净利落：等一天再开仓。把开仓推迟一个交易日（Panel B），top 20 的月收益从 1.44% 降到 0.895%（t = 9.29），top 5 降到 0.745%（t = 6.26）。收益确实掉了一截——说明买卖价差反弹贡献了一部分——但剩下的部分依旧又大又显著。这是这篇论文最关键的一道稳健性闸门：把最廉价的质疑先堵死。

5 不是均值回归，不是已知的风险

接着，一个更尖锐的问题是：配对交易的利润，会不会只是文献里早就记录过的反转（reversal）/ 均值回归换了个马甲？

毕竟，Lehmann (1990)、Jegadeesh (1990)、Conrad & Kaul (1989) 早就发现短期收益会反转——做空近期赢家、做多近期输家本身就能赚钱。配对交易看上去也是「买输家、卖赢家」。

但真正关键的区别在于：配对交易不是无脑买全市场的输家，它只在两只历史上高度协整的股票之间做多空。作者用自助法 (bootstrap) 构造了一个对照实验：随机给每只「触发开仓」的股票配一个搭档（而不是用最小距离匹配），看随机配对能赚多少。结果是，真实的配对收益显著高于这种随机配对下的「反转收益」——也就是说，利润里有一块是配对本身带来的，而不是单只股票的均值回归。

那会不会是常见的风险因子？作者把收益对市场、规模、价值、动量（Fama & French 1996、Carhart 1997 那套）以及一些低频的制度性因子（比如违约溢价、破产风险）都回归了一遍。结论是：这些因子解释不掉配对收益的主体。倒是浮现出一个未被识别的潜在共同因子 (latent risk factor)——它和配对交易的盈利在时间上相关，最近这些年相对「沉寂」。作者把这解读为：配对利润是市场付给套利者的、为维护一价定律而执行套利的报酬。

Note

表 2 给出了配对的成交统计与组合构成——比如平均每对在六个月里开仓几次、持仓多久、收敛比例多高。这些「微观体检」帮我们看清利润到底来自频繁的小收敛，还是少数大反转。

Table 2: summarizes the trading statistics and composition of the pairs

6 数据窥探？一份「天然」的样本外检验

读到这儿，做实证的人都会皱眉：用历史价格搜出来的过滤规则，数据窥探 (data snooping) 几乎是原罪。你总能在四十年的数据里找到一条「看起来很赚」的规则。

作者这里有一手别人学不来的牌。他们 1999 年就完成并传阅了工作论文初稿，用的是截止 1998 年的数据。等到正式发表（2006），中间这几年就成了一个天然的留出样本 (holdout sample)。他们刻意不改任何参数，把原模型直接套到 1999–2002 的新数据上——

结果：top 20 全投入组合 年化平均超额收益 10.4%，年标准差仅 3.8%，Newey-West 调整后的 t = 4.82。和样本内的长期结果高度一致。

这个真·样本外检验有两层含义：其一，原来的结果不是某段特定时期的偶然产物；其二，公开传播这套策略，居然没有把它的收益特征「套利掉」——尽管业界对它充满好奇。这一点本身就耐人寻味（关于「公开之后异象会不会消失」，可对照《异象的消退，是被「套利」吃掉了，还是基本面自己缩水了？》的讨论）。

Table 8: summarizes the profitability of pairs trading when we split the

7 利润是真的吗——交易成本、卖空与破产

光有超额收益还不够，得问：扣掉摩擦还剩多少？

交易成本：作者用了相对保守的成本估计，配对利润在合理假设下依然为正——但要承认，2 个标准差的开仓阈值「不总能覆盖成本」，所以这条策略偏向那些交易成本低、且有能力做空的市场参与者。
卖空成本：做空一半的腿要付借券费（这正是 D'Avolio 2002 那条文献关心的）。卖空和交易成本确实会侵蚀收益的量级，但侵蚀不掉它的存在。
破产风险与多空不对称：作者提出一个机制——配对的一头（空头）可能破产概率稳定或下降，另一头（多头，即「输家」）可能暂时破产概率上升；利润来自多头那只「劫后余生」的特质破产风险被证伪。如果是这样，利润应当主要来自多头一侧。作者把多空分开测，正是为了看这个不对称在不在。

把这些摩擦叠在一起，配对交易在整个样本期、以及那四年真样本外里，对「交易成本低、能卖空」的参与者仍然有利可图。这是个诚实的结论：它没有声称人人都能赚到 11%，而是说，对一价定律的「执法者」而言，存在一份期望中的套利利润。

（这份「利润即风险报酬」的味道，和固定收益套利里「在压路机前面捡硬币」的隐喻异曲同工——参见《捡硬币的人，真的站在压路机前面吗？》。）

8 文献脉络

把这篇论文放回它的来路，能看得更清楚。

最早的两条线在 1980 年代末交汇。一条是 Engle & Granger (1987) 把协整这个工具交给了计量经济学；另一条是 Bossaerts (1988) 发现美国股价存在共同的非平稳成分、在组合层面是协整的。这两块拼图，给「价差会回归」提供了统计学的地基。Bossaerts & Green (1989) 与 Jagannathan & Viswanathan (1988) 则在均衡资产定价里容纳了非平稳的共同因子。

另一条平行的线是短期可预测性：Conrad & Kaul (1989)、Lehmann (1990)、Jegadeesh (1990) 记录了短期反转，Jegadeesh & Titman (1993, 1995) 则把动量与反转、过度反应讲透。配对交易看似站在这条线上，但作者要论证的恰恰是「我们不一样」。

市场整合与套利的视角来自 Chen & Knez (1995)：紧密整合的市场，应给相似支付以相近价格。Froot & Dabora (1999) 用「孪生股票 (twin stocks)」（同一现金流、不同市场挂牌）检验了市场分割——这几乎是配对交易的「实验室纯净版」。

这篇论文的位置，就在这两条线的交点上：它用协整的语言把「相对价值套利」严格化，又用四十年的数据把它当成一价定律的实证检验，最后指向一个未被现有因子捕捉的潜在共同风险。

9 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：配对交易和「买输家卖赢家」的反转策略，本质区别到底在哪？

反转策略是在单只股票层面下注其历史收益会回归；配对交易是在两只协整股票的价差上下注。作者的自助法显示，把最小距离匹配换成随机匹配后收益大幅缩水——说明利润里有一块专属于「配对」，而非单股均值回归。前者赌的是个股，后者赌的是「两者之差」。

Q：那个 11% 会不会就是买卖价差反弹的幻觉？

这是最该担心的。作者用「延迟一天开仓」直接回应：top 20 月收益从 1.44% 降到 0.895%，确实掉了，但仍有 t = 9.29 的显著性。所以反弹贡献了一部分，但远不是全部。

Q：用日度价格做协整，统计上靠谱吗？会不会是「伪协整」？

作者自己点出了伪相关价格 (spuriously correlated prices) 的风险——在庞大的股票宇宙里，任意两只股票的线性组合「弱相依」几乎总能在样本内找到，但未必是真协整。这正是为什么样本外检验（1999–2002，t = 4.82）如此关键：伪协整通常活不过样本外。

Q：既然策略 1999 年就公开了，为什么没被套利掉？

论文给出的事实是没有——样本外收益与样本内一致。一种解读是，执行这条策略需要低交易成本 + 卖空能力，门槛把多数人挡在外面；另一种是它承担了一个潜在的共同风险因子，收益是这份风险的报酬，而非免费午餐。

Q：利润是来自多头还是空头？这有什么含义？

作者通过破产风险的不对称机制预测，利润应主要来自多头（那只「输家」若幸存，其特质破产风险被证伪带来收益），并把多空分开测来验证。若利润高度集中在多头，说明它和「困境股的幸存溢价」更像，而不是对称的价差收敛。

Q：这是否意味着市场无效？

不必然。作者明确说，协整框架下的结果与某些均衡定价模型相容（如 Bossaerts 1988 那类价格协整模型）。利润可以是「维护一价定律」的执法报酬——市场之所以「近似有效」，恰恰是因为有人靠做这件事赚钱。

(b) 几个可能的研究问题与提案

1. 把配对交易搬到公司债市场。 【经济故事】同一发行人的不同债券、或评级与久期相近的「孪生债」，在一价定律下应高度协整；信用市场摩擦更大、做市商库存约束更强，价差偏离可能更久、更可交易。【可行性】中。需要 TRACE 成交数据 + Mergent FISD 的债券特征做匹配；识别上要小心流动性差异本身造成的价差，可用「同一发行人两只债券」的设计来剥离信用风险（思路类似《同一个发行人的两只债券，戳破了「火线甩卖」的幻觉》）。

2. 那个「潜在共同因子」到底是什么？ 【经济故事】作者发现配对利润和一个未识别的潜在因子相关，且近年沉寂。如果能把它对上套利资本的供给（对冲基金 AUM、券商资产负债表松紧、融资流动性），就能把「利润是套利者风险报酬」从隐喻变成可检验的命题。【可行性】中。需要对冲基金/Primary dealer 的资产负债表代理变量；识别可用融资冲击（如季末、监管比率收紧）做工具。

3. 外资持有人与跨市场配对。 【经济故事】Froot & Dabora 的孪生股票说明市场分割会撑开价差。若一只股票的边际持有人结构（尤其外资占比）发生外生变化，配对收敛速度是否随之改变？这能把「谁在执法一价定律」具体到投资者类型。【可行性】中偏低。需要跨国持股微观数据 + 可投资度（investability）变化作为外生冲击（思路可借鉴《外资真是「蝗虫」吗？》）。

4. 交易成本异质性下的「谁能赚」。 【经济故事】论文已指出利润偏向低成本、能卖空的参与者。用更细的成交成本数据，可以量化「在多高的成本下配对利润恰好归零」，从而刻画这条套利的「自然边界」。【可行性】高。需要机构成交成本数据（如 Keim & Madhavan 1997 那类）或现代的 transaction cost analysis 数据，做一个利润对成本的敏感度断点。

10 我的判断

这篇论文的贡献，不在于「发现了一条赚钱的策略」——华尔街早就在用——而在于它把一条业界土法，翻译成了对一价定律的严肃实证检验，并守住了实证研究里最难守的两道关：买卖价差反弹（延迟一天开仓）和数据窥探（一份近乎完美的真样本外）。在 2006 年，这是把「统计套利」搬进金融经济学殿堂的奠基性工作之一。

要说对识别的担忧，我有两点。其一，那个「潜在共同因子」终究是残差里的故事——它解释了收益的时间变化，却没有被独立测量出来；「利润是执法一价定律的报酬」是个漂亮的叙事，但严格说仍是事后归因。其二，破产风险不对称这条机制虽然被分开测了多空，却很难和「困境股幸存溢价」彻底切割——利润究竟是套利报酬，还是某种被错标价的尾部风险补偿，留了一个口子。

后续我最想看到的，是把这个潜在因子钉到一个可观测的套利资本约束上：当融资流动性收紧、套利者被迫去杠杆时，配对价差是否更宽、收敛是否更慢、事后利润是否更高？如果能做出来，「市场有效是被套利者用真金白银维护出来的」这句话，就不再只是一个优雅的结尾。

参考文献

Bossaerts, P. (1988). Common Nonstationary Components of Asset Prices. Journal of Economic Dynamics and Control 12, 347–364.
Bossaerts, P., and R. Green (1989). A General Equilibrium Model of Changing Risk Premia: Theory and Evidence. Review of Financial Studies 2, 467–493.
Carhart, M. (1997). On Persistence in Mutual Fund Performance. Journal of Finance 52, 57–82.
Chen, Z., and P. Knez (1995). Measurement of Market Integration and Arbitrage. Review of Financial Studies 8, 287–325.
Conrad, J., and G. Kaul (1989). Mean Reversion in Short-horizon Expected Returns. Review of Financial Studies 2, 225–240.
D'Avolio, G. (2002). The Market for Borrowing Stock. Journal of Financial Economics 66, 271–306.
Engle, R., and C. Granger (1987). Co-integration and Error Correction: Representation, Estimation and Testing. Econometrica 55, 251–276.
Fama, E., and K. French (1996). Multifactor Explanations of Asset Pricing Anomalies. Journal of Finance 51, 131–155.
Froot, K., and E. Dabora (1999). How are Stock Prices Affected by the Location of Trade? Journal of Financial Economics 53, 189–216.
Gatev, E., W. N. Goetzmann, and K. G. Rouwenhorst (2006). Pairs Trading: Performance of a Relative-Value Arbitrage Rule. Review of Financial Studies 19(3), 797–827.
Jegadeesh, N. (1990). Evidence of Predictable Behavior of Security Returns. Journal of Finance 45, 881–898.
Jegadeesh, N., and S. Titman (1993). Returns to Buying Winners and Selling Losers: Implications for Stock Market Efficiency. Journal of Finance 48, 65–91.
Jegadeesh, N., and S. Titman (1995). Overreaction, Delayed Reaction, and Contrarian Profits. Review of Financial Studies 8, 973–993.
Lehmann, B. (1990). Fads, Martingales and Market Efficiency. Quarterly Journal of Economics 105, 1–28.