为什么大单反而能拿到折扣？——把伦敦交易所的「关系」算成一笔账

[2005 RFS] Why Do Larger Orders Receive Discounts on the London Stock Exchange?

Dan Bernhardt, Vladimir Dvoracek, Eric Hughson, Ingrid M. Werner

Jun He June 01, 2026

市场微观结构做市商流动性交易关系

Note

本文读的是 Bernhardt, Dvoracek, Hughson & Werner (2005, Review of Financial Studies)：在像伦敦证券交易所这样的「交易商市场」里，一笔订单的竞争不是发生在「此刻」，而是发生在「未来」。交易商愿意给老客户更多让价，是为了留住他们今后的生意；于是表面上看「大单拿折扣」，本质上是「大单大多来自被珍视的老客户」。控制住关系的价值之后，同一个客户的大单反而拿到更差的价格。

1 一个违背常识的事实

先从一个让人挠头的事实说起。

打开任何一本市场微观结构的教科书，你都会读到同一句话：大单要付出更差的价格。理由有两条，几乎写进了所有模型。其一是信息不对称 (asymmetric information)——如果主动下单的人比报价的人懂得多，那么一张大单很可能携带着「我知道而你不知道」的坏消息，流动性提供者只能用更差的报价来保护自己 [Glosten and Milgrom (1985)、Glosten and Harris (1988)]。其二是库存 (inventory)——做市商是厌恶风险的，吃下一张大单意味着背上一个更不平衡的头寸，他得用更高的价格来补偿自己 [Ho and Stoll (1983)]。这两条逻辑指向同一个方向：订单越大，价格越差。纽约证券交易所、美国各区域交易所、以及巴黎那种开放限价簿的市场，数据都老老实实地点了头。

可是接着，一个尴尬的反例冒了出来。

Reiss and Werner (1996) 去看伦敦证券交易所（London Stock Exchange, LSE）这种典型的「交易商市场」，却发现了完全相反的图景：大单拿到的让价（price improvement）比小单更多，只有到了异乎寻常的巨单，让价才开始回落。这就奇怪了——信息不对称和库存问题在伦敦同样存在，凭什么它们的方向在这里被整个掀翻？一定有某种「足够强」的力量，强到压过了信息和库存这两座大山。

Note

这正是本文要追的那一个核心问题：在交易商市场里，到底是什么，让「大单拿折扣」这件反常的事成了常态？

作者给出的答案，藏在一个被前人忽略的地方——竞争发生的时点。

2 竞争，到底发生在「什么时候」？

要理解伦敦的反常，得先看清楚两类市场的根本差别。

在纽约的交易大厅、在巴黎那样的开放限价簿里，竞争是同时发生的：所有愿意接这张单的人——限价单交易者、场内交易员、做市商——一起报价，价低者得，最好的报价立刻成交。这是一种空间上的、此刻的竞争。

但在传统的交易商市场（dealer market）里，事情完全两样。交易商当然也对外挂出广为传播的报价，可一个真要下单的交易者，通常是先挑定一家交易商，然后一对一地把最终价格谈出来。在这个议价的当口，旁边并没有别的交易商来「搅局」。如果交易者对谈出来的价格不满意，他的选择其实很有限：要么捏着鼻子成交、然后下次换一家；要么现在就去找另一家重新谈——但这要花时间，信息会泄露，而且新交易商未必给得更好。

这种市场设计的直接后果，是把交易商之间的当下竞争给削弱了。一个最能说明问题的证据是：Hansch, Naik, and Viswanathan (1999) 发现，在 LSE 上超过 70% 的订单，并没有送给当时报价最好的那家交易商。换句话说,交易者常常压根不去找报价最优的人。这件事，在「客户永远和报价最好的交易商成交」的模型里（如 Rhodes-Kropf (1999)、Viswanathan and Wang (2002)）是根本推不出来的。

那么，竞争去哪儿了？

作者的回答是：它没有消失，只是被推到了时间轴上。

Tip

单看某一笔订单，它也许没有暴露在当下的竞争里；但拉长时间看，交易者会一次又一次地下单，而正是这种对未来订单的竞争，写出了 Reiss and Werner (1996) 看到的那套定价关系。老客户手里握着更值钱的「未来生意」，交易商为了留住这份持续的惠顾，才肯给他们更多让价。

这就是全文的「一个核心」：跨期竞争（intertemporal competition）。下面，作者用一个刻意写得很「瘦」的模型，把这句话变成可以求导、可以检验的命题。

3 模型：把「未来的生意」折成今天的让价

模型的设定干净得近乎苛刻，但每一个假设都服务于那一个核心。

谁在场。 风险中性的经纪商（broker）从客户那里被动地收到对某只资产的订单，他的目标是替客户把一生的交易成本压到最低，办法就是选交易商。客户、交易商、经纪商对资产价值的信息是对称的——注意，作者特意把信息不对称先关掉，就是要证明：哪怕没有信息问题，光靠关系也能造出那套反常定价。经纪商和交易商彼此知道对方是谁（LSE 上参与者数目有限，身份藏不住）。

节奏与报价。 每隔 $t$ 单位时间，经纪商收到一张规模为 $w$ 的订单，$w$ 服从分布 $G(\cdot)$，取值于 $[0,W]$。经纪商不打包、不拆单，原样转给交易商。交易商挂出一个报价 $y$（$0\le y\le 1$），表示他打算从这笔交易里最多抽走的份额；这个报价对所有订单规模通用，$y$ 是外生的（可以是合谋的结果，也可以不是）。

关系会断。 每一期，以概率 $1-p$，经纪商会因为「价格之外的原因」被一个冲击打散、不再走这家交易商。于是 $p$ 既可理解为关系存续的概率，也可重新解读为交易商的贴现因子。

现在是关键。当经纪商交来一张规模 $w$ 的订单，交易商实际抽走的份额是 $z(w;G,p,t)$，于是给出的让价就是 $y-z(w;G,p,t)$（百分比口径，且 $0\le z\le y$）。经纪商用一条极简单的规则决定去留：只要让价不低于某个门槛 $y-z^\*(w;G,p,t)$，就留下；否则永不再来。

于是交易商面对一道取舍题。

未来的价值。 如果交易商给足让价、留住了这位经纪商，他对这段关系的未来价值是：

$$ V(G,p,t)=\sum_{\tau=1}^{\infty}(pt)^{\tau}\,\mathbb{E}_{G(\cdot)}\!\left[z(\tilde w;G,p,t)\,\tilde w\right]=\frac{pt}{1-pt}\,\mathbb{E}_{G(\cdot)}\!\left[z(\tilde w;G,p,t)\,\tilde w\right]. $$

这一步是把「今后每一期、每一张随机订单上能抽到的份额」按关系存续概率 $pt$ 一期期折现、再加总——一个等比级数，收敛成那个干净的 $\dfrac{pt}{1-pt}$ 系数。直觉很朴素：关系越「黏」（$p$ 越大）、下单越勤（$t$ 越小，间隔越短），这条未来现金流就越粗。

当下的诱惑。 反过来，如果交易商这一单干脆不让价、按报价 $y$ 全额抽成，他这笔的收入就是 $yw$。于是，交易商愿意给让价，当且仅当：

$$ \cssId{a1}{yw} \;\le\; \cssId{a2}{z(w;G,p,t)\,w} \;+\; \cssId{a3}{\frac{pt}{1-pt}\,\mathbb{E}_{G(\cdot)}[z(\tilde w;G,p,t)\,\tilde w]} $$

这道不等式就是整篇论文的心脏：左边是「现在就翻脸」的即时收益，右边是「继续做朋友」的当期收入加未来价值。 哪边大，决定了交易商会不会让价。

均衡让价。 作者聚焦于让经纪商交易成本最小的那个均衡——经纪商动用最狠的威胁：谁不给够让价，就永远拉黑谁。在这个均衡里，交易商对「全额抽成 $yw$」和「让价 $y-z^\*$ 以维系关系」恰好无差异，于是 $y-z^\*$ 让上面的不等式取等号：

$$ y-z^{*}(w;G,p,t)=\frac{V(G,p,t)}{w}=\frac{pt}{w(1-pt)}\,\mathbb{E}_{G(\cdot)}\!\left[z(\tilde w;G,p,t)\,\tilde w\right]. $$

就这一个式子，把全部预测一次性挤了出来。对它求导，四条比较静态扑面而来：

$$ \frac{\partial z^{*}}{\partial t}>0,\qquad \frac{\partial z^{*}}{\partial p}<0,\qquad \frac{\partial z^{*}}{\partial w}>0, $$

外加一条：若 $\hat G$ 一阶随机占优于 $G$，则 \(z^{*}(w;\hat G,p,t)

把它们翻译成人话（记住 $z$ 越小、让价越多）：

$\partial z^\*/\partial t>0$：下单越稀（间隔 $t$ 越大），关系越不值钱，让价越少。
$\partial z^\*/\partial p<0$：关系越不容易被外生地打散（$1-p$ 越小），关系越值钱，让价越多。
$\partial z^\*/\partial w>0$：这是反转的支点——对同一段关系，当下订单越大，交易商「翻脸不让价」的诱惑就越强，因为 $yw$ 随 $w$ 线性涨，而未来价值 $V$ 是给定的。于是固定关系，大单反而拿到更差的价格。
一阶随机占优那条：倾向于交大单的经纪商，关系本身更值钱，因而平均拿到更多让价。

到这里，那个开篇的悖论终于解开了。模型同时给出两条看似打架的结论：

关系越值钱，任何规模的订单都能拿到更多让价；
固定关系，订单越大，价格越差。

要让这两条与「大单平均拿到更多让价」这个事实并存，唯一的办法是：大单不成比例地来自那些给交易商带来更多生意的老经纪商。不是「大」本身被奖励，而是「大单背后那个人」被珍视。FX 交易商的经验也印证了这点——他们给大单更好的价，却对那些下单不规律的外国客户给特别差的价。

Warning

一个常被混为一谈的替代解释是搜寻 (search)：大单的「赌注」更高，经纪商愿意为它多跑几家、找到更看重这张单的交易商，于是大单拿到更好的价。但搜寻假说有个致命的检验含义——如果让价是搜寻驱动的，那么过去的交易往来与让价之间不该有系统关系，经纪商也不该把交易集中在少数几家交易商身上。后面的数据会把这条岔路堵死。

（关于「无风险市场里交易商为何还要管头寸、又如何在成本与议价力之间分配租金」，可参见《无风险市场里的风险厌恶：是谁给做市商系上了「风险限额」这根绳》与《做市商的「无风险」生意：把成交成本拆成成本与议价能力》。）

4 把模型拖到 1991 年的伦敦

理论再漂亮，也得让数据点头。作者用了一份相当独特的样本。

数据。 来自 Reiss and Werner (1998) 的 LSE 日内数据，覆盖 25 只 FTSE-100 成分股、1991 全年的价格与报价。这些股票处在 FTSE-100 里市值偏中下的位置：平均股价 £2.75，平均内部价差（inside spread）3 便士，约合中间价的 110 个基点；最小报价规模的中位数（均值）是 50,000（42,000）股。伦敦把最小报价规模管制在一个「正常市场规模」（Normal Market Size, NMS），一个 NMS 大致是该股上一季度日均成交量的 2.5%。

作者先筛出经纪商与交易商之间的普通代理交易（剔除期权相关、剔除带特殊条件码的、再剔掉价格离内部价差太远的极端离群值，仅删掉 576 笔、占 0.11%），最终留下 585,841 笔交易、约 £8.7 亿 的成交额。用 1991 年 1 月估计「关系变量」，于是在条件于关系变量时，工作样本是 2 月到 12 月的 561,209 笔交易。样本里有 245 个经纪商，每只股票的交易商数目在 9 到 16 之间。

怎么量「关系」。 这是全文识别的命门。作者用过去的经纪商—交易商成交量来刻画关系价值，在 20 天的滚动窗口上定义五个变量，核心三个是：VOLUME（某股上经纪商与某交易商的成交量，按 NMS 标准化）、XVOL（该经纪商交给该交易商的平均单笔规模，按 NMS 标准化）、BDVOL（跨所有股票、该经纪商与该交易商的 VOLUME 之和）。作者认为 VOLUME 最能代表关系价值——它同时含了过去的单笔规模与下单频率，比只看平均规模的 XVOL 更全面；而 BDVOL 把不同股票一锅烩，会被少数高量股主导，反而最差。

VOLUME 的分布本身就说明了「关系」差异有多大：经纪商与交易商在某只股票上的月度成交量中位数是 0.174 个 NMS，按 42,000 股的平均 NMS 折算约 7,308 股；而四分位区间从 1,428 股（25 分位）一路拉到 22,764 股（75 分位）。同一个市场里，不同经纪商带给交易商的生意，可以差出一个数量级。

5 数据怎么说

先看最朴素的图景。Table 1 把交易按规模分箱，报告三种口径下让价的分位数。

几个数字值得记住。约三分之二的交易小于报价规模的 2.5%（即 NMS 的 0.025 以下，累计频率 67.8%），只有 2.4% 的交易超过报价规模——大单是少数派。随规模上升，三种口径下「大单让价更多」的模式都成立。但真正呼应模型的是离散度：在每一个规模箱里，让价的第一四分位都是零（也就是说，无论单大单小，总有四分之一的订单一分钱让价都拿不到）；而第三四分位的让价，对最大的那批单子能高达内部价差的 50.0%。

Note

这正是模型的一个微妙预言：随订单变大，不让价的诱惑在上升（$\partial z^\*/\partial w>0$），可大单又多半来自被珍视的老经纪商、能拿到丰厚让价——两股力量并存，结果就是让价的方差随订单规模「扇形张开」。同时也解释了为何到了对老经纪商都算异常的巨单，平均让价才开始回落。

更有说服力的是后面的关系检验。作者发现：对所有订单规模分组，平均让价都随 VOLUME 这类捕捉「持久关系」的变量显著上升。也就是说，决定让价的不是订单规模本身（order size per se），而是那段持久的关系。同时，一个经纪商会把交易高度集中在极少数几家交易商身上。这两点合起来，恰好把上一节那条「搜寻假说」的退路彻底封死——若是搜寻驱动，过去往来与让价不该相关、交易也不该如此集中。

（顺带一提，交易商能否识别下单者的身份，是这套机制的前提；关于「匿名」如何反过来改变价差与执行，可参见《看不见报价人的名字，价差为什么反而变窄了？》。而「同样的交易商面对不同客户、核心—边缘网络是被挑出来的」这一脉，则见《同样的交易商，不同的客户：核心—边缘网络是被「挑」出来的》。）

6 模型假设的「现实修正」

作者很诚实地讨论了把「真实世界」的特征加回去会怎样，而这些讨论本身就是对识别的辩护。

库存。 一旦库存有成本，大单确实会倾向于拿更差的价——但只要存在持久关系，交易商仍愿意给大单一些让价，以降低丢掉未来生意的概率。有意思的是，数据里经纪商会和多家交易商建立关系，这恰恰是库存随机波动时该有的样子：不同交易商此刻的库存不同、对订单流的估值也不同，于是经纪商和几家都搭上关系，再把单子送给当下报价最好的那家关系交易商——而不是报价最好的非关系交易商。因为后者没有动机让价，前者还惦记着未来。作者还点出：由于他们的估计没有把这种「关系建设」行为纳入，很可能低估了持久关系对让价的真实影响。

信息不对称与固定成本。 加入信息不对称只会让「建立关系以换让价」更有价值（Desgranges and Foucault (2002) 把这个论证形式化了）；而交易商的固定交易成本会削弱「只下小单的经纪商」的关系价值。两者都不改变核心方向。

7 文献脉络

把这篇论文放回它生长的那条线上，故事就更清楚了。

最早，市场微观结构的两大支柱各自登场：一支讲库存——Ho and Stoll (1983) 把做市商的报价与头寸联系起来；另一支讲信息——Glosten and Milgrom (1985) 用逆向选择解释买卖价差，Glosten and Harris (1988) 进一步把价差拆成信息成分与其他成分。两条线殊途同归，都预言「大单价更差」，并在 NYSE、巴黎 Bourse [Biais, Hillion, and Spatt (1995)] 等开放限价簿市场得到验证。

接着，反例出现了。Reiss and Werner (1996) 在 LSE 上发现了相反的定价模式，把「大单价更差」这条铁律掀翻，留下一个悬而未决的「为什么」。随后 Hansch, Naik, and Viswanathan (1999) 又添了一笔反常证据：七成订单根本不去找报价最优的交易商——这是「客户总和最优报价者成交」那类模型（Rhodes-Kropf (1999)、Viswanathan and Wang (2002)）无法消化的。本文作者自己的前作 Bernhardt and Hughson (2002) 已经开始在交易商市场里思考日内交易的结构。

本文正是站在这个交叉口：它没有去修补信息或库存模型，而是换了一个维度——竞争的时点，用跨期竞争把 Reiss and Werner (1996) 的全部反常一次性地解释掉，并用同一份伦敦数据把预测逐条验证。它和 Desgranges and Foucault (2002) 的声誉定价、以及更广的「交易关系」文献，共同构成了「关系驱动定价」这一支的代表作。

评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：这和「客户和报价最好的交易商成交」的模型到底差在哪？

差在竞争的时点。后者假设此刻就有充分竞争、客户总去找最优报价；本文则承认当下竞争被市场设计削弱，竞争被推到了对未来订单的争夺上。一个直接的可证伪含义是：本文能解释「七成订单不去找最优报价」（Hansch et al. 1999），而对手模型不能。

Q：「大单拿折扣」到底是因果，还是只是选择效应？

本文的立场恰恰是：它本来就是选择效应，而这正是答案。不是「大」被奖励，而是大单不成比例地来自高价值老客户。一旦控制住关系变量（VOLUME 等），固定客户的大单反而拿到更差的价——把「规模效应」从「关系效应」里剥了出来。

Q：怎么排除「搜寻」这个替代解释？

用两个数据事实：若让价由搜寻驱动，过去往来与让价不该系统相关、交易也不该集中。但数据里让价随过去 VOLUME 显著上升，且经纪商把交易高度集中在少数几家交易商——两者都与搜寻假说相悖。

Q：信息不对称被假设掉了，结论还可信吗？

作者刻意关掉信息不对称，是为了证明「光靠关系」就够。把信息加回来只会强化结论——此时建立关系以换让价更有价值（Desgranges and Foucault 2002）。所以这是一个保守设定，不是漏洞。

Q：为什么让价的方差会随订单规模张开？

因为两股力量同时作用：订单越大，交易商「翻脸不让价」的诱惑越强（每个规模箱的 25 分位都是零让价）；可大单又多来自老客户、能拿到高达内部价差 50% 的让价（75 分位）。两者并存，方差自然扇形展开。

Q：这套机制只适用于 1991 年的伦敦吗？

机制依赖两个条件：当下竞争被削弱（一对一议价）、且交易商能识别客户身份。只要这两点成立——很多 OTC、外汇、固定收益市场都符合——机制就该有效。LSE 1991 是个能观测到身份的干净实验室，但含义更普适。

(b) 几个可能的研究问题与提案

把这套「关系定价」搬到公司债 OTC 市场。 【经济故事】公司债至今高度依赖交易商、一对一询价（RFQ），且大客户与交易商的关系久经经营——本文的跨期竞争逻辑几乎是为它量身定做的。可检验：控制住债券特征与信用风险后，老客户（高历史成交量）是否拿到更窄的有效价差，而同一客户的大单是否反而更贵。【可行性】高。TRACE 加上交易商身份（监管版 TRACE 或 FINRA 内部数据）可识别客户—交易商对；识别策略可仿照本文，用滚动窗口的历史成交量度量关系。难点在于公开 TRACE 不带交易对手身份，需要受限数据。
危机时关系会「升值」还是「贬值」？ 【经济故事】当库存成本飙升、做市能力收缩时，未来订单流的价值 $V$ 和当下翻脸的诱惑同时变化，方向不明。本文模型预言关系仍能让交易商对大单给些让价；但极端压力下交易商可能优先保命。可用 2020 年 3 月公司债流动性危机做事件窗口检验。【可行性】中。需要带交易商身份的高频成交数据；危机窗口短、噪声大，识别要小心。
外资客户在关系定价中吃亏吗？ 【经济故事】本文提到 FX 交易商对「下单不规律的外国客户」给特别差的价——这与「外资持有人」这条线天然相关：外资客户往往关系更浅、下单更不规律，按模型该拿更差的价。可在跨境债券或股票交易中检验外资身份对执行成本的影响，并区分「关系浅」与「信息劣势」两条渠道。【可行性】中。需要能识别投资者国籍与交易商关系的成交数据（如某些新兴市场的监管数据集）。
匿名化交易把关系定价「关掉」了吗？ 【经济故事】本文机制以「交易商能识别客户身份」为前提。许多交易所在 1990 年代后陆续匿名化——这提供了一个准自然实验：匿名化之后，关系变量对让价的解释力是否系统性下降？【可行性】中到高。需要找到一次清晰的匿名化制度变更，做前后双重差分；关键是控制住同期其它微观结构改革。

评述者的判断

这篇论文最漂亮的地方，是它没有去和信息、库存这两座大山硬碰，而是换了一个被人忽视的维度——竞争发生在哪一刻——就把 Reiss and Werner (1996) 的全部反常优雅地收编了。一个刻意写「瘦」的模型，靠一道「现在翻脸 vs. 继续做朋友」的不等式，挤出四条可证伪的比较静态，再用同一份伦敦数据逐条验证；理论与实证咬合得相当紧。它对「关系驱动定价」这一支文献是奠基性的。

但识别上仍有可担忧之处。其一，关系变量本质上是相关性证据：高 VOLUME 的经纪商拿到更多让价，未必全是「未来生意」在起作用，也可能这些经纪商本就更精于谈判、或系统性地交易更易处理的订单流——作者用「搜寻假说的两个反例」做了排除，但没有一个真正外生的关系冲击。其二，模型把 $y$ 当外生、把关系断裂概率 $1-p$ 当外生，而现实中报价水平与关系黏性很可能是内生地一起决定的。其三，样本是 1991 年 25 只中小盘 FTSE-100 股票，外部效度（尤其到今天高度电子化、部分匿名化的市场）需要谨慎。

我接下来最想看到的，是一个带交易商—客户身份的当代 OTC 数据（公司债是最自然的候选）上的复制：如果在控制信用风险与债券特征后，「老客户的大单更便宜、但同一客户的边际大单更贵」依然成立，这套跨期竞争的逻辑就从一个 1991 年的伦敦故事，升格为信用市场定价的一条通则。（关于公司债大宗交易里「谁来接盘」这一相关问题，可参见《谁来接住这一大笔债券？——公司债大宗交易里被遗忘的「接盘人」》。）

参考文献

Bernhardt, D., Dvoracek, V., Hughson, E., & Werner, I. M. (2005). Why Do Larger Orders Receive Discounts on the London Stock Exchange? Review of Financial Studies 18(4), 1343–1368.

Bernhardt, D., & Hughson, E. (2002). Intraday Trade in Dealership Markets. European Economic Review 46, 1697–1732.

Biais, B., Hillion, P., & Spatt, C. (1995). An Empirical Analysis of the Limit Order Book and the Order Flow in the Paris Bourse. Journal of Finance 50, 1655–1689.

Desgranges, G., & Foucault, T. (2002). Reputation-Based Pricing and Price Improvements in Dealership Markets. Mimeo, HEC.

Glosten, L., & Harris, L. (1988). Estimating the Components of the Bid/Ask Spread. Journal of Financial Economics 21, 123–142.

Glosten, L., & Milgrom, P. (1985). Bid, Ask, and Transaction Prices in a Specialist Market with Heterogeneously Informed Traders. Journal of Financial Economics 13, 71–100.

Hansch, O., Naik, N., & Viswanathan, S. (1999). Preferencing, Internalization, Best Execution, and Dealer Profits. Journal of Finance 54, 1799–1828.

Ho, T., & Stoll, H. (1983). The Dynamics of Dealer Markets under Competition. Journal of Finance 38, 1053–1074.

Reiss, P., & Werner, I. (1996). Transaction Costs in Dealer Markets: Evidence from the London Stock Exchange. In The Industrial Organization and Regulation of the Securities Industry, 125–175. Chicago: University of Chicago Press.

Reiss, P., & Werner, I. (1998). Does Risk-Sharing Motivate Interdealer Trading? Journal of Finance 53, 1657–1703.

Rhodes-Kropf, M. (1999). Price Improvement in Dealership Markets. Mimeo, Columbia University.

Viswanathan, S., & Wang, J. (2002). Inter-Dealer Trading in Financial Markets. Mimeo, Duke University.