最后一笔交易，落在了谁手里？——机构订单在「另类市场」省下的那几十个基点

[2003 JFE] Institutional Trading and Alternative Trading Systems

Jennifer Conrad, Kevin M. Johnson, Sunil Wahal

Jun He June 02, 2026

市场微观结构机构交易执行成本流动性

Note

本文读的是 Conrad, Johnson & Wahal (2003, Journal of Financial Economics)：他们拿到一份覆盖 797,068 笔机构订单、2.15 百万笔成交、约 $1.6 万亿交易额的专有数据，第一次把机构投资者在交叉系统 (crossing systems) 与 电子通讯网络 (electronic communication networks, ECNs) 上的成交单独拎出来核账，发现——在控制了订单与证券特征、甚至控制了选择交易场所的内生性之后——这些「另类交易系统 (alternative trading systems)」上的已实现执行成本，普遍比传统券商低；而 1997 年的订单处理规则与最小报价单位 (tick size) 改革，又把 ECN 的成本优势削掉了一截。

1 一个看不见的市场

先说一个让人有点不舒服的事实。

当一家共同基金决定买进一千万股某只股票时，真正困难的从来不是「按哪个键」，而是怎样把这笔单子塞进市场而不把价格自己顶上去。买的人一多，价格就涨；等你买完，账面上已经先亏了一截。这部分「因为我自己在交易而付出的代价」，学界叫它市场冲击 (market impact)，是机构执行成本里最大、也最难量的一块。

过去几十年，研究者衡量这种成本，靠的都是公开数据——TAQ 这样的成交与报价库，告诉你每一笔成交的价、量、时间。可问题在于：到了 1990 年代后期，越来越多的机构订单，根本就不在这些公开数据里成交了。它们溜进了一类专有的、电子化的、彼此看不见对方名字的交易场所。

这就是本文的张力所在。论文开篇给了一个数字：到 2000 年，当时在运营的九家 ECN，已经占了 Nasdaq 证券美元成交额的近 40%（SEC, 2000）；而最有名的交叉系统 POSIT，1988 到 1999 年间成交量的复合年增长率超过 45%，到 1999 年单年成交了 65 亿股。一个体量如此庞大的市场，却因为「数据是专有的」，在学术上几乎是一片黑箱。

Note

所谓「另类」，对照的是传统的券商系统。一笔机构单子，要么交给券商（broker）去人肉撮合、甚至动用自有资本，要么扔进交叉系统等着被匿名配对，要么挂到 ECN 上和别的机构、做市商、交易所专家匿名议价。三种方式，对「即时性 (immediacy)」「匿名性」「价格发现」的取舍完全不同。

于是一个最朴素的问题浮出来：这些新场所，到底是更便宜，还是只是看起来更便宜？

2 三种「卖法」，与一个基准

要回答这个问题，先得把机构是怎么交易的讲清楚。本文的第一个贡献，恰恰是分类——它把一笔订单（order）和构成这笔订单的若干笔成交（trade）拆开来看。

一笔订单，如果它所有的成交都落在同一类场所，叫单机制订单 (single mechanism order)；如果横跨多类，叫多机制订单 (multiple mechanism order)。在 797,068 笔订单里，约 90%（723,998 笔）是单机制订单。这些单机制订单又被切成四类，你可以把它们想成一条「营销订单有多卖力」的连续谱：

日内交叉 (day cross)：在交易时段内，于 ITG 的 POSIT 上按主市场当时的报价中点匿名配对。108,111 笔。
盘后交叉 (after-hours cross)：在 Instinet 的盘后交叉网络上，按收盘价撮合。只有 4,048 笔——样本太小，作者全程提醒它的统计精度有限。
ECN：本文里几乎全部是 Instinet 的「日间系统」，机构在屏幕上匿名挂单、和对手议价，有价格发现。51,127 笔。
券商成交 (broker-filled)：传统的 NYSE / Amex / Nasdaq 券商系统。券商最积极地提供即时性，主动满世界找对手盘，甚至动用自有资本。560,712 笔——这是绝对的大头，也是全文检验的基准 (numeraire)。

这条谱的逻辑很顺：交叉系统不提供价格发现，它只是把买卖盘匿名地兜在一个池子里配对，所以它对「现在就要成交」要求低的订单更友好；ECN 提供主动的价格发现，在主市场本身比较分散、买卖价差大的时候特别有用——这正是为什么交叉大多发生在 NYSE 挂牌的股票上，而 ECN 扎堆在 Nasdaq 股票上。这个分工不是巧合：交叉系统需要一个像 NYSE 那样可靠的主市场价格来支撑撮合（Hasbrouck, 1995 提供了 NYSE 价格发现质量的证据），而 ECN 恰好补上了 Nasdaq 那种分散、高价差市场里缺失的价格发现。

数据也佐证了这种分工背后的订单差异：交叉系统和 ECN 经手的订单，平均美元金额都明显小于券商；券商订单更大、被拆成更多笔成交、成交率也更高。换句话说，最难啃的单子，往往还是交给了券商。

接着，一个自然的问题是：既然订单本身就长得不一样，你怎么能直接比较它们的成本？

3 识别策略：怎样才算「公平地」比成本

这是全文真正的方法论核心，值得慢慢说。

衡量成本的尺子，作者用的是 Perold (1988) 提出、经 Keim & Madhavan (1995, 1997) 发扬的执行落差 (implementation shortfall) 法。它的思想极简单：把「纸面组合」（在你做出交易决策那一刻、按当时价格成交的假想组合）和「真实组合」（你实际成交的价格、再加上佣金）之间的差，定义为总执行成本。这把成本干净地拆成两块：

$$ \text{Total execution cost} = \underbrace{\text{Implicit cost}}_{\text{price-related}} + \underbrace{\text{Explicit cost}}_{\text{commissions}} $$

隐性成本来自价格的移动（也就是市场冲击那一块），显性成本就是佣金。这个拆分很重要，因为故事的反转之一就藏在这里。

但光有尺子不够。订单特征千差万别，直接对比四类场所的平均成本毫无意义。作者用了两道互补的控制：

第一道，匹配样本 (matched sample)。 按交易方向（买/卖）、订单指令、订单规模、交易所挂牌地、市值这五个维度，给每一笔另类系统订单配一笔尽可能相似的券商订单来对比。好处是不强加任何线性或函数形式假设——你不需要相信成本和规模是线性关系。

第二道，OLS 回归。 回归的价值在于可以塞进机构固定效应 (institution-specific fixed effects)。为什么这一步关键？因为 Keim & Madhavan (1997) 早就发现，不同机构填单的「打法」天差地别，这种差异会直接体现在它们的执行成本里。控制掉机构固定效应，等于是问「同一家机构，把单子分给不同场所，成本差多少」，估计自然更保守。

然后，但真正关键的一步在于——内生性。

Warning

交易者不是随机地把订单扔进某个场所的。一笔他预感「很难做、冲击会很大」的单子，他可能一开始就避开交叉系统、直接找券商。于是「场所选择」和「事后实现的成本」是内生的：你观察到券商订单成本高，可能不是券商贵，而是因为难做的单子才去了券商。

为了拆开这层纠缠，作者上了 Madhavan & Cheng (1997) 的内生转换回归 (endogenous switching regression)：第一阶段是一个 probit，预测交易者会选择哪类场所；这个选择再喂进第二阶段的执行成本回归，从而对选择性 (selectivity) 做出修正。他们还进一步用 Heckman et al. (1997) 的匹配思路，挑出那些在竞争场所间「有共同支撑 (common support)」的订单来重做转换回归。

结果如何？基本结论不变——成本差异依旧存在，有些情形下甚至变大了。

4 主要结果：那几十个基点，是真的

把三道方法的数字摆出来，故事就清楚了。

匹配样本下：日内交叉相对券商，总执行成本低约 30 个基点——对样本里均价的股票，这相当于每股省 13 美分；ECN 相对券商的差更大，达 66 个基点，约合每股 20 美分。

这里是第一个反转：大部分成本差来自成交价格本身，而不是佣金。 交叉系统的佣金确实低（通常一两美分一股），但真正拉开差距的是隐性成本那一块。也就是说，你在另类系统上省下的，主要不是「手续费便宜」，而是「价格没被自己顶起来」。

OLS 回归下（加了机构固定效应，所以更保守）：日内交叉相对券商，买单省 17 bps、卖单省 14 bps；ECN 则是买单 28 bps、卖单 54 bps。固定效应一进来，差额收窄——印证了「不同机构打法不同」这件事确实在数据里。

转换回归修正选择性之后，这些差额依然稳健地存在，而且像前面说的，有时反而走阔。

最后，作者把注意力对准选择性最可能作祟的地方——那些用了多种机制的订单。一个有意思的发现：虽然多数订单的最后一笔成交是在券商手里完成的，但有超过 40% 的订单，最后一笔落在了某个另类系统上。如果一笔单子里最难做的往往是最后那一截，那么这个 40% 就在说一件颇为颠覆的事——做市商（券商）并不总是「最后求助的市场 (market of last resort)」。对这批多机制订单做交易层面的分析，同时控制订单和成交层面的特征后，结论仍然成立：交叉与 ECN 的成交，成本更低。

5 一个绕不开的疑问，与作者的两种解释

读到这里，聪明的读者一定会皱眉：机构投资者负有法定的「最优执行 (best execution)」义务，理论上他们会去成本最低的地方。如果均衡成立，不同场所之间的「超额」成本差应该是零才对。那这几十个基点的持续差异，到底意味着什么？

作者很诚实，给了两条可能的解释，而且分得很清楚。

对 ECN，他们倾向于「失衡 (disequilibrium)」说。 如果是低成本驱动了这些系统的爆炸式增长，那么我们应该看到：竞争、行业结构变化、监管政策，会随时间把成本差抹平。而样本里恰好有两个这样的冲击，都与 ECN 有关：

1997 年的订单处理规则，要求做市商把 ECN 上的报价反映进自己的价格，从而削弱了 Nasdaq 与 ECN 之间的市场分割；
同年 SEC 强制缩小最小报价单位 (tick size)，把「ECN 能用更细的价格刻度、而交易所不能」这一优势也削掉了。

这两件事之后，样本里机构对 ECN 的相对使用下降了，ECN 总成交量在 tick size 改革后似乎也回落；更关键的是，ECN 的成本优势在每次冲击后都下降了，虽然仍然非零。这正是「失衡正在向均衡收敛」该有的样子。

对交叉系统，他们给了一个不需要失衡的解释。 交叉系统的成本差较小，而它天生是被动的——撮合不成你就成交不了。这里藏着一个测量上的偏误：那些扔进交叉系统、却完全没配对成功的单机制订单，根本不会出现在数据里。所以本文测的是已实现成本，是以「成交了」为条件的。没成交的「机会成本 (opportunity cost)」被系统性地低估了。这个机会成本有多大？Edwards & Wagner (1993) 估计它从大盘股的 16 bps 到小盘股的 220 bps 不等——这个量级，足以解释交叉与券商之间那点成本差。

Tip

这是全文最克制、也最值得学的一笔：同样是「成本更低」，ECN 那部分作者敢解读为真实的竞争红利，交叉系统那部分他们却主动提醒「可能是幸存者偏差」。一个把自己结论的边界讲清楚的实证作者，比一个把所有结果都往「显著」上靠的作者，可信得多。

6 数据

把数据单独拎出来说，因为它是这篇论文的命根子。

主数据来自 Plexus Group——一家专门监测机构交易成本的咨询公司。订单层面是事前 (ex ante) 信息：股票代码、市值、买卖方向、做出交易决策的日期、决策日前一天的收盘价、决策日前五天日成交量的几何均值，以及一个指令变量（市价单 / 限价单 / 交叉）。每笔成交则记录股数、成交价、负责的券商 ID、以及佣金（每股几美分）。机构名字被替换成代码，并被 Plexus 映射成三种风格：动量、价值、多元化。

观测单位：订单，及其下属的成交。
样本期：1996 年第一季度到 1998 年第一季度。
样本量：过滤后 797,068 笔订单、59 家机构、约 2.15 百万笔成交。
过滤：跟随 Keim & Madhavan，剔除价格低于 $1.00 的股票、非美国股票，以及指令字段缺失或为「X」的订单（后者顺带剔掉了八家机构）；应 Plexus 要求再剔一家数据可疑的机构。订单数据与 CRSP 的价格、收益匹配。
部分检验还用了 Instinet 提供的、与样本期匹配的「日间系统」逐日逐券成交量。

这份数据的稀缺性，正是论文的护城河：它逐笔标注了每笔成交是哪个券商或哪个另类系统执行的，这是 TAQ 永远给不了的。

7 文献脉络

把这篇论文放回它生长的那条线里看，会更有味道。

最上游是两件工具性的奠基工作。一是 Perold (1988) 的执行落差概念，把「决策价」和「成交价」之间的落差正式定义为执行成本；二是 Kyle (1985) 奠定的市场微观结构理论传统，让「信息」「即时性」「价格冲击」有了统一的语言。

接着，Keim & Madhavan (1995, 1997) 把执行落差真正用到机构交易数据上，刻画了机构填单过程的解剖学，并发现投资风格深刻地决定了执行成本——这直接给了本文「为什么要放机构固定效应」的理由。与此并行，Chan & Lakonishok (1995, 1997) 研究了机构交易前后的股价行为、以及 NYSE 与 Nasdaq 的成本对比，Madhavan & Cheng (1997) 则在「楼上 vs 楼下」大宗交易里发展出本文借用的转换回归方法。同一批作者自己的 Conrad, Johnson & Wahal (2001) 关于软美元的研究，则是本数据的「前传」。

然后，电子化交易这条新支流涌了进来。Hendershott & Mendelson (2000) 建了交叉网络与做市商市场竞争的理论模型；Huang (2002) 用报价数据证明 ECN 是重要的价格发现贡献者；Barclay et al. (2002) 发现 ECN 成交的价差更窄；而市场改革本身——Barclay, Christie, Harris, Kandel & Schultz (1999) 记录了 Nasdaq 改革如何压低了交易成本。

但这些研究有一个共同的局限：它们盯的是「某个平台上发生的全部成交」，无法区分单机制和多机制成交，也无法识别一笔成交在原始订单里的次序。最接近本文的是 Domowitz & Steil (1999) 和 Naes & Odegaard (2001)，但它们都只看单一机构。本文所处的位置，正是「第一篇系统分析机构如何策略性地横跨多个交易平台、以最小化执行成本」的研究——它的独特性，全在那份能逐笔归因、又能把订单拆成序列的数据上。

（顺带一提，这条「电子市场 vs 传统市场」的线一直延续到今天。关于交易所自己「关灯」变暗后透明度的代价，可参见《把自家的灯关掉：一个交易所的「黑暗实验」，照出了透明度的价值》；关于电子交易所是否还需要一个「楼上市场」，可参见《电子交易所，还需要一个「楼上」吗？》。）

8 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：既然机构有「最优执行」的法定义务，成本差为零才对，那这几十个基点是不是说明它们没尽责？

不必然。作者给了两种不靠「失职」的解释：对 ECN，是市场尚在向均衡收敛的暂时性失衡（1997 年两次冲击后差额确实在缩）；对交叉系统，是因为没成交的订单不进数据，已实现成本低估了机会成本。把这两块剥掉，剩下的「真实超额差」可能远没有表面那么大。

Q：那 66 bps 的 ECN 优势，可信吗？会不会全是选择性偏误？

这正是转换回归要回答的。用 probit 预测场所选择、再修正第二阶段成本后，差额非但没消失，有时反而走阔；机构固定效应进来后收窄但仍在。三道方法（匹配、OLS、转换回归）指向同一方向，是这篇论文最有底气的地方。

Q：交叉系统的成本优势和 ECN 的，能等量齐观吗？

不能，作者自己也不这么看。ECN 的优势他们解读为可被竞争和监管侵蚀的真实红利；交叉系统的优势则很可能是「幸存者偏差」——失败的撮合根本不在样本里。Edwards & Wagner (1993) 给的 16–220 bps 机会成本，量级足以吞掉交叉的那点优势。

Q：「超过 40% 的订单最后一笔在另类系统成交」为什么算重要发现？

因为它挑战了「做市商是最后求助的市场」这一长期假设。如果一笔单子最难的是收尾那一截，而四成订单把收尾交给了被动的交叉系统或匿名的 ECN，说明机构对另类系统的信任，已经深入到了最棘手的环节。

Q：1997 年的两个冲击（订单处理规则、缩小 tick size），怎么知道是它们、而不是别的趋势压低了 ECN 优势？

这是识别上最弱的一环。作者依赖的是「冲击发生前后」的时序对比，而非一个干净的对照组。同期还有 ECN 数量增加、行业结构变化等并行趋势，很难把功劳唯一地归给这两条规则——作者的措辞也确实是「appear to have reduced」，留了余地。

Q：这份 1996–1998 的数据，对今天还有意义吗？

方法论的意义大于具体数字。今天的暗池、ECN 早已不是当年模样，但「逐笔归因 + 拆订单序列 + 修正场所选择内生性」这套做法，是后续所有机构执行成本研究的模板。具体的 30/66 bps 是时代的快照，框架才是遗产。

(b) 几个可能的研究问题与提案

1. 把同一框架搬到公司债市场 - 【经济故事】本文的全部洞见都建立在「订单可以被拆成跨场所的序列、且每笔成交可归因」之上。公司债市场近十年正经历类似的电子化（RFQ 平台、全或无、做市商网络），但流动性极度分散、成交稀疏，机构如何在「叫价系统 vs 直接找交易商」之间分配一笔大单，几乎是空白。 - 【可行性】中。需要类似 Plexus 的机构订单级数据（如某资管的内部 OMS 记录）配 TRACE 成交。识别可沿用本文的转换回归。难点是公司债成交太稀，匹配样本难做、机会成本（未成交）更严重——但这恰恰让「幸存者偏差」这一主题更有研究价值。（流动性测量上的相关讨论，可参见《把「成交价」从「成交量」里解放出来——重新丈量公司债的流动性》。）

2. 外资机构是否在另类系统上「被收了更高的过路费」？ - 【经济故事】本文把机构当作同质的成本最小化者，但不同机构打法不同（这也是放固定效应的理由）。一个自然的延伸：本土 vs 外资机构，在匿名的 ECN / 暗池上的执行成本是否系统性不同？若外资因信息劣势或时区错配而更依赖被动撮合，它们可能承担更高的机会成本。 - 【可行性】中低。需要带机构国籍标签的订单级数据，现实中很难拿到。可退而求其次，用某个新兴市场交易所的会员席位（区分境内外）做近似。

3. 监管冲击作为干净的自然实验 - 【经济故事】本文对 1997 年两个冲击的识别偏弱（仅时序对比）。但 ECN 和暗池领域此后有大量分阶段实施的监管（Reg ATS、Reg NMS、MiFID II 的暗池容量上限），天然适合做交错双重差分。 - 【可行性】高。监管实施日期是公开的、分券种/分市场错开的；执行成本数据在 TRACE / 交易所层面可得。识别上需警惕交错 DiD 的已知陷阱（关于这一点，可参见《当「更稳健」的设计悄悄把符号弄反了——重读交错双重差分》）。

4. 把「未成交」显式建模进去 - 【经济故事】本文最诚实的局限，是交叉系统里失败的撮合不进数据。若能拿到包含未成交挂单的完整订单簿，就能直接估计机会成本，而不必借 Edwards & Wagner (1993) 的外部数字。这会把「另类系统到底便不便宜」从「条件于成交」推进到「无条件」的答案。 - 【可行性】中。需要单一交叉系统/暗池的全量挂单数据（成交 + 未成交）。这类数据稀缺但并非不存在，关键是说服平台方开放。

9 我的判断

先说贡献。这篇论文的价值，九成在数据，一成在它对数据的克制。在一个因为「专有」而无法被 TAQ 看见的市场里，它第一次把机构订单逐笔归因、拆成跨场所的序列，并用三种互不依赖的方法（匹配样本、带机构固定效应的 OLS、修正选择性的转换回归）一致地证明：另类系统上的已实现执行成本更低。更难得的是，它没有把这个结论一锤定音地包装成「另类系统更优」，而是老老实实地区分了 ECN（可能是真实的、会被竞争侵蚀的红利）和交叉系统（很可能是幸存者偏差），并指出 1997 年的监管与 tick size 改革如何同步削掉了 ECN 的优势。这种「先把结论的边界画清楚」的写法，是实证微观结构里教科书级别的示范。

再说对识别的担忧。最弱的一环是 1997 年那两个冲击的因果解读——纯时序对比，没有干净的对照组，同期又有 ECN 数量激增等并行趋势，作者用「appear to」措辞是合适的，但读者不该把它当成因果。其次，转换回归的可信度，最终系于第一阶段 probit 里排除性约束的合理性——什么变量只影响场所选择、却不直接进入成本方程？论文（在截断的篇幅里）对这一点的论证，是我最想看到更多细节的地方。第三，「以成交为条件」这件事，对交叉系统的偏误是结构性的，作者诚实地承认了，但也意味着「交叉系统更便宜」这个具体结论，几乎不可能从本文数据里被无偏地证实。

最后，我想看到的后续。一是把这套框架搬进今天的市场——暗池、ECN、做市商网络早已迭代了几轮，但「拆订单序列 + 修正场所选择」的方法论应当历久弥新；二是拿到包含未成交挂单的数据，把机会成本从外部借来的数字，变成内生估计出来的量。那一天，我们才算真正回答了这篇论文二十多年前抛出的问题：另类市场的便宜，到底有几分是真的。

参考文献

Barclay, M., Christie, W., Harris, J., Kandel, E., Schultz, P. (1999). Effects of market reform on the trading costs and depths of Nasdaq stocks. Journal of Finance 54, 1–34.
Barclay, M., Hendershott, T., McCormick, T. (2002). Information and trading on electronic communication networks. Working paper, University of Rochester.
Chan, L., Lakonishok, J. (1995). The behavior of stock prices around institutional trades. Journal of Finance 50, 1147–1174.
Chan, L., Lakonishok, J. (1997). Institutional equity trading costs: NYSE versus Nasdaq. Journal of Finance 52, 713–735.
Conrad, J., Johnson, K., Wahal, S. (2001). Institutional trading and soft dollars. Journal of Finance 56, 397–416.
Conrad, J., Johnson, K., Wahal, S. (2003). Institutional trading and alternative trading systems. Journal of Financial Economics 70(1), 99–134.
Domowitz, I., Steil, B. (1999). Automation, trading costs, and the structure of the trading services industry. Brookings-Wharton Papers on Financial Services.
Edwards, M., Wagner, W. (1993). Best execution. Financial Analysts Journal 49, 65–71.
Hasbrouck, J. (1995). One security, many markets: determining the contributions to price discovery. Journal of Finance 50, 1175–1199.
Heckman, J., Ichimura, H., Todd, P. (1997). Matching as an econometric evaluation estimator: evidence from evaluating a job training programme. Review of Economic Studies 64, 605–654.
Hendershott, T., Mendelson, H. (2000). Crossing networks and dealer markets: competition and performance. Journal of Finance 55, 2071–2116.
Huang, R. (2002). The quality of ECN and Nasdaq market maker quotes. Journal of Finance 57, 1285–1319.
Keim, D., Madhavan, A. (1995). Anatomy of the trading process: empirical evidence on the behavior of institutional traders. Journal of Financial Economics 37, 371–398.
Keim, D., Madhavan, A. (1997). Execution costs and investment style: an inter-exchange analysis of institutional equity trades. Journal of Financial Economics 46, 265–292.
Kyle, A. (1985). Continuous auctions and insider trading. Econometrica 53, 1315–1335.
Madhavan, A., Cheng, M. (1997). In search of liquidity: block trades in the upstairs and downstairs markets. Review of Financial Studies 10, 175–203.
Naes, R., Odegaard, B.A. (2001). Equity trading by institutional investors: to cross or not to cross? Working paper, Norwegian School of Management.
Perold, A. (1988). The implementation shortfall: paper versus reality. Journal of Portfolio Management 14, 4–9.