为你的订单付钱,结果你却付了更多

[2003 JFE] Payment for Order Flow
Note

本文读的是 Parlour & Rajan (2003, Journal of Financial Economics):当做市商为了买你的散户订单流而向券商付钱(payment for order flow),表面上看是「羊毛出在羊身上、最后会通过更低的佣金还给你」,但作者用一个无穷期博弈证明——只要这笔钱是正的,市场就再也回不到「做市商零利润」的均衡;价差被撑得更宽,宽到不仅吃掉了返还的佣金,还把财富从下市价单的人(流动性需求方)转移给了下限价单的人(流动性供给方)。消费者福利和社会福利都下降了。

1 一个看上去人畜无害的「回扣」

先从一个让监管者头疼了二十年的现象说起。

零售订单流是一种商品。它会被做市商买走——有时是直接给券商现金,有时是给软件、给数据、给一个好用的下单界面。在美国股票市场,这种交易已经是二十年的惯例;2001 年多重挂牌爆发之后,它又蔓延到了期权市场。论文里给了一个具体的量级:Knight Securities 每天大约成交 6.5 亿股,按每股 0.2 美分算,单是这一家做市商,每天就要为 Nasdaq 证券的订单流付出约 130 万美元。这不是小数目。

那么,问题来了:这笔钱,到底动了谁的奶酪?

一个非常自然、也非常流行的直觉是这样的:消费者只关心交易的总成本——他承受的价差,加上他付给券商的佣金。如果「为订单流付费」只是做市商和券商之间的一笔转移支付,那么在竞争惨烈的零售券商市场里,这笔钱迟早会以更低的佣金更好的服务回流到消费者手里(Battalio et al., 2001 确实找到了佣金下降的一些证据)。如果是这样,那它就是一笔无害的「侧支付」,监管大可不必操心。

这篇论文要做的,就是把这个「人畜无害」的直觉,放到一个严肃的均衡模型里去拷问。结论是:直觉错了,而且错得相当根本。

2 模型的舞台:三类人,一个无穷期的博弈

要理解作者凭什么敢说直觉错了,得先看清楚他们搭的这个舞台。这是一个无穷期 (infinite-horizon) 模型,里面有三类参与者:

每一期的时序是固定的:做市商先报价差,券商再报佣金和路由,最后投资者到场下单。

这里有几个设定是全文的关键,值得停下来咂摸:

第一,作者刻意把「信息」这件事拿掉了。 以往大量文献把订单流付费理解成一种「撇奶油 (cream-skimming)」的工具——做市商花钱买的是散户的、不知情的订单流,因为这部分订单不会让他在信息上吃亏(Easley, Keifer & O'Hara, 1996;Battalio, 1997)。但本文反其道而行:它假设标的资产价值对所有人都是已知的,根本没有知情交易。这样做的好处是,一旦得到「价差变宽」的结论,你就没法把它甩锅给信息成本——它纯粹是竞争结构的产物。

第二,限价单被显式地搬上了台面。 一个投资者下限价单,本质上是在供给流动性,他在和做市商抢生意。限价单在簿上停留一期:下一期若有匹配的市价单进来,就成交;否则就撤掉。于是「订单簿」只有两种状态——有一张上期遗留的限价单(状态 1),或者空簿(状态 0)

第三,也是最妙的一点:做市商收到市价单的概率,与订单簿的状态无关。 直觉上,这相当于假设券商(比如 E*TRADE)没法、也不会去盯着某一个做市商的簿上还挂着哪些未成交的限价单——这种监控成本太高了。这个看似技术性的假设,后面会变成整个反转的引信。

投资者怎么决策?每个投资者对交易有一个私人估值 \(b\),从一个连续分布 \(F(\cdot)\) 中抽取,支撑集为 \([\underline{b},\bar{b}]\),且 \(\underline{b}<0<\bar{b}\)。\(b\) 可以理解成「离最优组合有多远」:\(b\) 越大,这笔交易越能把他带向最优。一笔成交的净收益是 \(b\) 减去交易成本。而两种订单的交易成本是不一样的

$$T^d(s,c^m) = c^m + \frac{s}{2}, \qquad T^s(s,c^l) = c^l - \frac{s}{2}.$$

市价单提交者(liquidity demander)要付半个价差 \(s/2\)——他在价差的「错误一侧」成交;限价单提交者(liquidity supplier)则半个价差,所以他的成本里是 \(-s/2\)。这个符号的差别,是全文的命门:价差一旦变宽,市价单的人更疼,限价单的人更爽。

3 投资者怎么选:一道在「市价」与「限价」之间的临界值

接下来是投资者的最优下单策略,作者把它收敛成一个临界值 \(b^*\)。

市价单立刻成交,净收益是 \(b-T^d\)。限价单未必成交:设 \(p_t\) 为在 \(t\) 期下的限价单在 \(t+1\) 期成交的概率,则它的事前期望收益是 \(\delta p_t (b-T^s)\)(\(\delta\) 是共同贴现因子)。令一个投资者恰好对两者无差异的那个 \(b\) 为 \(b^*\),它满足下面这个隐式方程:

$$ \cssId{a1}{\delta p_t}\,\cssId{a2}{(b - T^s)} \;=\; \cssId{a3}{b - T^d} $$

直觉很顺:\(b\) 很高的人「等不起」,他急着成交,宁可付价差下市价单;\(b\) 中等的人不那么急,愿意挂个限价单去赚价差、赌一个成交概率;\(b\) 太低(甚至为负)的人干脆不交易。于是 Lemma 1 给出一个干净的分层——当 \(T^d>T^s\) 时,\(b\in[T^s,b^*)\) 的人下限价单,\(b\in[b^*,\bar{b}]\) 的人下市价单。

由此还能写出三个概率:市价单到达概率 \(\mu=1-F(b^*)\),限价单概率 \(\lambda=F(b^*)-F(T^s)\),无订单概率 \(F(T^s)\)。Lemma 2 顺手给了一组关键的比较静态:价差 \(s\) 一升,\(\mu\) 下降、\(\lambda\) 上升——市价单变少,限价单变多。记住这条,它是后面福利分析的支点。

4 没有订单流付费时:一个干净的零利润均衡

现在先看「没有订单流付费」的世界(\(\gamma_b=0\))。

这是一个重复博弈,理论上能撑起一大堆均衡——folk 定理告诉我们,只要贴现因子够大,任何高于 minmax 的支付都能用「触发—惩罚」来维持(这条思路可上溯到 Abreu, 1988)。作者用的惩罚也很直白:谁敢偏离均衡价格,此后所有同类(所有做市商、或所有券商)就永远打到零利润——也就是进入一段「惨烈竞争」期。

在对称、平稳均衡里,作者递归地写出了各方的价值函数。对券商(Lemma 3):

$$H(0)=\frac{\mu}{1-\delta}\left[\frac{c^m}{B}+\frac{\delta c^l(\lambda/B)}{2M}\right],\qquad H(1)=\frac{\mu}{1-\delta}\left[\frac{c^m}{B}+\frac{c^l\big(1-\delta(1-(\lambda/B))\big)}{2M}\right].$$

对做市商(Lemma 4):

$$J(0)=\frac{\mu s\,(2-\delta(\lambda/M))}{4M(1-\delta)},\qquad J(1)=\frac{\mu s\,(1+\delta(1-(\lambda/M)))}{4M(1-\delta)}.$$

这两组函数里藏着两个值得说的细节。其一,\(H(0)\le H(1)\):手里一张待成交限价单的券商,处境更好——因为这张单这期有概率成交、给他挣到限价佣金。其二,\(J(0)\ge J(1)\):手里有限价单的做市商反而更差——因为簿上那张限价单是个竞争对手,按价格优先它会先吃掉进来的市价单,把本该属于做市商的生意抢走。

把这两点放在一起,故事就立起来了:限价单对券商是资产,对做市商是负债。 在没有订单流付费时,这套账依然能凑出一个做市商零利润的均衡——价差只够覆盖成本,消费者面对的是一个零交易成本的世界。一切都还算太平。

5 反转:当做市商开始为「每一张」市价单付钱

真正关键的一步,是引入订单流付费 \(\gamma>0\):做市商为它收到的每一张市价单向券商支付 \(\gamma\)。

注意「每一张」这三个字。这正是第 2 节那个「券商盯不住簿」的假设开始发威的地方。回想一下:做市商有时簿上挂着一张上期遗留的限价单。当一张市价单进来、而簿非空时,按照价格优先,这张市价单会和限价单成交,而不是和做市商成交。换句话说,做市商从这笔交易里一分钱没赚,却仍然要为这张市价单付出 \(\gamma\)。

而问题在于,簿是空还是非空,是做市商自己内部管理的状态,外部不可观测、因而不可写进合约。所以做市商没法说「只为那些真正和我成交的市价单付钱」——他必须为所有市价单付钱,包括那些他毫无所得、纯粹倒贴的。

于是逻辑链条闭合了:做市商既然在某些状态下要白白倒贴 \(\gamma\),他的价差就必须宽到足以覆盖这部分预期损失。 用论文的话说:

在订单流付费下,做市商为所有市价单付钱,包括那些他得不到任何好处的。因此价差必须宽到能覆盖他在这类交易上亏掉的钱。

这就导出了本文的核心命题——只要 \(\gamma>0\),就不存在做市商零利润的均衡,也不存在市价单提交者的零交易成本均衡。佣金 \(c^m\) 确实可能降下来(这一点和那个流行直觉吻合),但价差 \(s\) 撑大的幅度超过了佣金下降的幅度,所以市价单的人面对的总成本 \(T^d=c^m+s/2\) 反而上升

而宽价差对另一群人是好消息。回到第 3 节那个符号差别:限价单的成本 \(T^s=c^l-s/2\),价差越宽,限价单越赚。于是订单流付费的净效果,是一台财富再分配机器:它把好处从下市价单的人(流动性需求方)转移到下限价单的人(流动性供给方)。

这里还有一个博弈论意义上漂亮的收尾:给定别的做市商都在为订单流付费,单个做市商的最优反应就是跟着付。 所以订单流付费在这个模型里,干脆就是一个反竞争装置 (anticompetitive device)——它把整个系统从零利润均衡里硬生生顶了出来。

Tip

这里要和「最优执行 (best execution)」与「价格匹配 (price-matching)」区分开。订单流付费合约里通常附带一条:做市商保证给券商的价格不差于当前最优买卖价(NBBO),这其实是一份价格匹配协议。而众所周知,价格匹配本身就能瓦解 Bertrand 竞争(这个直觉源自 Salop, 1986)。为了把两件事分开,作者分别分析了有无 NBBO 要求的情形,发现结论在定性上一致——也就是说,价差变宽不是价格匹配带来的,订单流付费自己就够了。

6 福利:被补贴出来的「过多限价单」

最后是福利账。

作者比较了「无付费的零交易成本均衡」与「有正付费、且券商零利润的均衡」。结论是后者的消费者福利和社会福利都更低。机制有两层:

其一,在订单流付费的均衡里,限价单被补贴了,于是出现了过多的限价单(相对社会最优而言)。其二——也是更微妙的一层——一些本来下市价单会更好的投资者,被价差顶到了去下限价单。回想 Lemma 2:价差一升,临界值 \(b^*\) 移动,\(\mu\) 降、\(\lambda\) 升。这些被「劝退」成限价单的人,承担了执行的不确定性(限价单未必成交),整体的交易效率因此受损。

所以这篇论文给出的画面是:订单流付费不是把蛋糕重新切给消费者,而是把一部分蛋糕从一群投资者手里挪到另一群投资者手里,而且在挪动的过程中,蛋糕本身还变小了。

7 文献脉络

把这篇论文放回它所在的脉络里看,会更清楚它的位置。

早期关于订单流付费的工作,比如 Chordia & Subrahmanyam (1995) 和 Kandel & Marx (1999),把这个现象归因于价格的离散性——他们认为订单流付费是 tick size 不为零的产物,等 tick 缩到零、价格连续化之后,它就该消失。但 Battalio & Holden (2001) 指出,在一个连续价格的模型里,订单流付费照样能活下来——事实上它确实挺过了「小数化 (decimalization)」。本文也站在这一边:在零 tick 的设定下,订单流付费依然存在。

另一条线是「撇奶油」叙事:Easley, Keifer & O'Hara (1996)、Battalio (1997) 等用信息不对称解释为什么订单流值得买。本文的贡献恰恰是把信息关掉,证明即便没有撇奶油的动机,订单流付费也会内生出宽价差——这是一个全新的、纯竞争结构层面的理由。这也正是它与 Battalio & Holden (2001) 的分野:在后者里,付费均衡等价于不付费的竞争均衡(做市商仍是零利润);而在本文里,付费摧毁了零利润均衡。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

还有一条关于「做市商竞争」的脉络:Dennert (1993)、Dutta & Madhavan (1997) 都研究了交易商市场的竞争与合谋。本文与 Dutta & Madhavan (1997) 最近——同样是无穷期博弈——但关键的差异在于,本文显式地把券商市场的竞争也建模进来了:券商为争夺客户而竞争,因而会最优地路由订单。正因为有了券商这一层,作者才能谈论消费者实际支付的总交易成本,而不只是做市商之间的价差。这一点也让本文成为 Kandel & Marx (1999) 的补充——后者关心的是订单流付费如何影响某只股票里做市商的数量,而本文关心的是券商与做市商之间的互动。

至于实验证据:Bloomfield & O'Hara (1997) 在实验室里发现,订单流被「优先处理 (preferenced)」得越多,价差越宽——这与本文的核心结论高度一致。本文进一步说清楚了,这些租金(rents)有一部分会被券商通过佣金返还给消费者,但不是全部

(关于散户订单流今天最终落到哪里、执行质量如何,可参见《集中,到底是谁的福利?——一张散户订单的旅行账单》;关于限价订单簿本身如何被理解成一座流动性的集市,可参见《买卖价差为什么会自己长回去?》。)

8 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:这篇论文说价差会变宽、消费者更糟,可现实里散户的佣金确实一路降到了零,这不矛盾吗?

不矛盾,这恰恰是论文最想纠正的误读。模型里佣金 \(c^m\) 确实可以降,作者从不否认;它说的是价差 \(s\) 撑大的幅度超过了佣金下降的幅度,所以总成本 \(T^d=c^m+s/2\) 反而上升。佣金归零是「看得见」的那一半,价差变宽是「看不见」的那一半——只盯着佣金,正是那个流行直觉栽跟头的地方。

Q:为什么「做市商收单概率与簿状态无关」这个假设这么要命?

因为它制造了「不可契约性」。如果券商能盯住每个做市商的簿、只为真正和做市商成交的市价单付钱,那做市商就不必为「白白倒贴」的那部分定价,宽价差的逻辑就垮了。正是「盯不住簿」让做市商必须为每一张市价单付费,包括那些被簿上限价单截胡的,他才不得不靠宽价差来摊平这笔系统性的损失。

Q:这和「撇奶油」假说到底差在哪?

撇奶油假说靠的是信息不对称——订单流付费是用来分离出不知情订单的工具。本文把知情交易整个拿掉了,标的价值人人皆知。所以它的宽价差不可能来自信息成本,只能来自竞争结构本身。这是一个独立于信息的、全新的机制,也让结论更干净:你没法用「这是为了补偿逆向选择」来为它辩护。

Q:限价单提交者「受益」,那订单流付费岂不是对一部分投资者是好事?为什么还说社会福利下降?

对,限价单的人(流动性供给方)确实因为价差变宽而受益,这正是「再分配」的含义。但社会福利看的是总和:一方面限价单被补贴导致过多限价单,另一方面一些本该下市价单的人被价差挤去下了限价单、承担了不必要的执行不确定性。再分配本身不创造价值,而扭曲过的订单结构带来了净损失。

Q:结论依赖那套「永远零利润」的无限惩罚吗?换个惩罚会不会就翻盘?

无限惩罚是用来把均衡价格撑到最高的工具,它服务于刻画「能维持多高的订单流付费」这个上界。但「\(\gamma>0\) 就不存在做市商零利润均衡」这个核心命题,根子在于做市商为不可观测状态下的市价单倒贴 \(\gamma\)——这是支付结构问题,不是惩罚结构问题。所以核心结论并不脆弱地依赖某一种特定的触发策略。

Q:作者为什么只看对称均衡?现实里做市商给不同券商的返点明明不一样。

作者自己承认了这一点(并引了 Battalio & Holden, 2001 和 Battalio et al., 2001 关于差异化返点的证据),只是为了解析上的可处理性才聚焦对称均衡。他们明说非对称均衡的结果集合「显然更大」。这意味着本文的福利结论更像是一个保守的、干净的基准,而不是对现实返点结构的完整刻画。

(b) 几个可能的研究问题与提案

1. 把这套逻辑搬到公司债市场的「成交即返佣」上。

【经济故事】公司债是 OTC 市场,交易商网络分层(core-periphery),散户/小机构的订单常被路由给特定交易商,存在类似订单流付费的安排。本文的机制——为不可观测状态下的订单倒贴、从而撑宽价差——在债券市场可能更强,因为债券簿更不透明、状态更难观测。 【可行性】中。TRACE 数据能看到成交价和交易商身份,但「付费」本身几乎不可观测,需要从价差结构反推,识别上偏弱;可考虑用某次监管披露规则的变化做事件研究。

2. 用「执行质量披露规则」(Rule 11Ac1-6 / 605-606)做一次自然实验。

【经济故事】2001 年的披露规则让订单流付费表(schedule)上网可查。本文预测:付费越高,价差越宽、总成本越高。披露本身改变了券商的路由激励,可以检验「曝光」是否压缩了价差。 【可行性】高。605/606 报告是公开面板数据,券商×做市商×时间维度齐全,可做 DiD。关键是找到一个干净的、外生改变披露强度或付费水平的冲击。

3. 把外资/跨境零售订单流加进来。

【经济故事】不同辖区对订单流付费的监管天差地别(欧盟 2026 年起逐步禁止,美国允许)。如果同一只跨境上市股票在两套规则下交易,本文的再分配机制预测两边的价差结构应系统性不同。 【可行性】中。需要匹配跨境上市股票的双边微观结构数据,识别来自监管差异;难点是控制掉两地流动性、税制、时区等混杂因素。

4. 限价单补贴与「过多限价单」的直接检验。

【经济故事】本文的福利损失有一个可证伪的预言:订单流付费越普遍,限价单相对市价单的比例越高(因为限价单被补贴、且市价单的人被价差挤过来)。 【可行性】高。限价单/市价单比例可从订单簿数据直接构造,付费强度可从 606 报告取,做横截面或面板回归即可。这是本文最 doable 的一个直接检验。

5. 当券商市场不是完全竞争时,租金怎么分?

【经济故事】本文假设券商竞争激烈、零利润,所以部分租金返还给消费者。但若零售券商市场高度集中(现实里 PFOF 收入高度集中于少数券商),租金返还会更少、消费者更糟。把券商市场结构内生化,能刻画「集中度→返还比例→消费者福利」的链条。 【可行性】中。理论上是本文模型的自然扩展(放松 \(B\) 的零利润假设);实证上需要券商集中度与执行成本的匹配数据,识别偏理论驱动。

9 我的判断

这篇论文的贡献,在我看来不在于「发现了订单流付费让价差变宽」——Bloomfield & O'Hara (1997) 在实验室里已经看到了这个相关性。它真正的贡献是给出了一个剥离了信息的、纯竞争结构的微观机制:做市商必须为不可观测状态下、自己毫无所得的那部分市价单倒贴,因而价差被系统性地撑宽,零利润均衡被摧毁。这个「不可契约的簿状态」是整篇文章的引信,设计得很巧,也很可信。把它从「撇奶油」叙事里独立出来,是一个干净的理论增量。

对识别(这里是「对模型稳健性」)的担忧主要有三点。其一,「券商盯不住做市商的簿」是一个极强的假设——在今天高度电子化、数据密集的市场里,这个假设是否还成立,直接决定了核心机制是否还在。其二,对称均衡是为了可处理性做的妥协,作者自己也承认非对称(差异化返点)的现实更复杂,福利结论在非对称世界里能撑多远,并不清楚。其三,模型里限价单只活一期、价值已知、无知情交易——这些都是为了把机制照亮而做的简化,但也意味着它离真实的订单簿动态和逆向选择还有距离。

我接下来最想看到的,是把这套理论拿去和「执行质量披露」时代的真实数据对账:限价单/市价单比例是否真的随订单流付费强度上升?总交易成本(而非佣金)是否真的没降反升?以及——在 2026 年欧盟逐步禁止 PFOF、美国仍允许的当下——一次干净的跨辖区比较,或许正是检验这个二十年前的理论的最佳时机。

参考文献