集中，到底是谁的福利？——一张散户订单的旅行账单

[2025 JFE] The Retail Execution Quality Landscape

Anne Haubo Dyhrberg, Andriy Shkilko, Ingrid M. Werner

Jun He June 01, 2026

市场微观结构散户交易做市商规模经济

Note

本文读的是 Dyhrberg, Shkilko & Werner (2025, Journal of Financial Economics)：用四年、覆盖一万两千只美股的 SEC Rule 605/606 公开数据，作者们第一次系统地把美国散户订单流的「批发」生意拆开来看。结论很反直觉——这个被监管者担心「太集中」的市场，恰恰因为集中，才让散户拿到了更低的成交成本：最大的两家批发商 Citadel 与 Virtu 报价最便宜，源头是规模经济；而当一个新的大玩家（Jane Street）杀进来时，执行成本不降反升。

1 一个让监管者头疼的悖论

先讲一个几乎是常识的故事。

经济学家（Autor et al., 2017；Grullon et al., 2019）、记者（Economist, 2016）、政策制定者（CEA, 2016）这些年都在反复敲打同一件事：各行各业越来越「集中」，少数巨头吃下越来越大的份额，消费者因此要为商品和服务多掏钱。这套逻辑当然有道理——前提是大公司拥有定价权（pricing power）。可如果集中不是靠垄断、而是靠效率竞争出来的呢？那么按照 Demsetz (1973)、Peltzman (1977) 的老传统，更能服务客户的公司份额更大，反而会带来长期效率与更友好的价格。

这就是本文的张力所在。散户订单流的「批发」市场正是一个集中度高得吓人的行业：两家最大的批发商（wholesaler），Citadel Securities 和 Virtu Financial，合计吃下了将近 70% 的散户订单流。监管者——包括美国证监会（SEC）的高层——据此忧心忡忡：这么集中，散户还能有好果子吃吗？SEC 甚至提出要搞逐单拍卖（order-by-order auction），让流动性提供者为每一笔散户订单单独竞价，谁给的价格改善最多谁才有权成交（SEC, 2022）。

作者们要回答的，就是这个被吵翻了天的问题：当下这套「经纪商 → 批发商」的散户订单处理机制，到底是在保护散户，还是在揩散户的油？

Figure 1: Herfindahl–Hirschman Indices for Individual Stocks

2 一张散户订单的旅行路线

要理解这场争论，得先看清一笔散户订单是怎么「旅行」的。

在 1990 年代，很多美国零售经纪商（broker）是自己做市、在内部撮合客户订单的。但 2000 年代初的市场演化和监管改革催生了激烈的流动性竞争，逼着经纪商退出了自营做市，转而把订单外包给一类垂直整合的场外做市机构——也就是批发商。今天，绝大多数经纪商把客户订单发给批发商，后者用自己的库存「内部化」（internalize）掉大部分主动成交的订单：散户要卖，它就买下来；散户要买，它就卖出去，赚的是买卖价差（bid–ask spread）。

这道价差怎么分？批发商留一部分，一部分以价格改善（price improvement）的形式让利给散户（即成交价比交易所挂牌价更好），还有一部分在某些情况下作为订单流支付（payment for order flow, PFOF）返还给经纪商。

整个争论的火力，集中在「价格改善到底有多少」上。批评者（包括 SEC 的一些官员）认为，批发商给的价格改善是 de minimis 的——少到不能再少。而本文的数据给出的第一个硬结论是：远非如此。

Tip

全样本里，批发商提供的价格改善达到挂牌价差的 27%；在一只平均的标普 500 成分股里，散户拿到的价格改善更是高达挂牌价差的 51%。与此同时，作者们根据 Rule 606 披露估算出，批发商付给经纪商的 PFOF，平均只占挂牌价差的 1%。

换句话说，散户拿到的让利是真金白银的几成价差，而 PFOF 不过是个零头。更关键的是，接受 PFOF 的经纪商对所有批发商收取同一个 PFOF 费率——也就是说，经纪商怎么在各家批发商之间分配订单，并不会改变它的 PFOF 收入。这一步看似不起眼，却堵死了「经纪商为了多收 PFOF 而把订单卖给出价差的批发商」这条质疑路径。而且像 Fidelity、Vanguard 这样根本不收 PFOF 的大经纪商，照样把订单大量发给批发商——单纯为了履行最优执行（best execution）义务。

Figure 2: Retail Broker Routing

3 真正关键的一步：用什么尺子量「执行质量」

接着，一个自然的问题是：既然要比较八家批发商谁好谁坏，该拿什么当尺子？

直觉上，价格改善（相对挂牌价差）似乎够用了。但本文指出，这把尺子对比较批发商而言是有偏的。原因藏在一个词里——毒性（toxicity）。

所谓毒性，指的是「需求流动性的散户订单」与「批发商供给流动性后所面对的不利价格移动」之间的关联。说白了：如果一家批发商接到的订单，往往在成交后价格立刻朝不利方向走（散户买完就涨、卖完就跌），那这批订单就是「毒」的——批发商赚到的价差会被随后的价格移动吃掉。

而本文的数据恰恰揭示，不同经纪商的订单流毒性差异巨大。老牌经纪商如 E*TRADE、Schwab、TD Ameritrade 产生的订单流更「毒」；而 Robinhood、Webull 这些新经纪商的订单流毒性更低。由于 Rule 606 报告显示每家批发商接到的「经纪商组合」不同，毒性也就在批发商之间产生了显著差异——Rule 605 数据显示，最大的两家批发商 Citadel 与 Virtu，恰恰接到了最毒的订单流。

Figure 3: Broker Toxicity

这就引出了本文测量逻辑的核心。一笔成交里，散户实际付出的有效价差（effective spread），会被分解成两块：批发商真正落袋的部分，和成交后被价格移动「吃掉」的部分。前者就是经过毒性调整后的已实现价差（realized spread），后者正是价格冲击（price impact）——也就是毒性本身。这是微观结构里的标准分解：

$$ \cssId{es}{ES_{i}} = \cssId{rs}{RS_{i}} + \cssId{pi}{PI_{i}} $$

逻辑于是变得清楚：当一个经纪商比较各家批发商时，它自己客户的订单流毒性是「天然held constant」的——同一批客户的毒性，发给谁都一样。所以对经纪商来说，用不调整毒性的价格改善去比较批发商，是合适的。但对研究者来说，我们拿到的是按批发商汇总的数据，混入了不同经纪商的毒性，这时就必须用已实现价差（realized spread）这把「毒性调整后」的尺子，才能公平地横向比较批发商。值得一提的是，这个 realized spread 也正是 SEC 在「订单竞争规则」经济分析里所采用的核心指标。

4 核心：为什么「越大越便宜」？

然后，真正反转的地方来了。

如果用 realized spread 这把对的尺子去量，会发现——最大的两家批发商，Citadel 和 Virtu，收的费用反而比小竞争对手更低。更狠的是，作者们发现，运营规模（operation size）几乎完整地解释了头部两家与其余批发商之间的成本差异。这意味着，规模经济在批发商层面实实在在地压低了成本，而这些节省又被传导给了散户。

为什么是规模经济？本文从产业组织（industrial organization）和库存管理（inventory management）两条线给出了机制。

第一条是市场结构。批发市场呈现出典型的垄断竞争（monopolistic competition; Chamberlin, 1933; Dixit and Stiglitz, 1977; Asplund and Nocke, 2006）特征：两家领头羊 + 一圈竞争性的「边缘厂商（competitive fringe）」；存在显著的固定成本（暗示规模经济）；批发商提供的是差异化服务（除了执行成本，还有规模改善、可靠性、资本承诺等本文无法测量的维度）。在这种结构下，每家批发商面对一条向下倾斜的需求曲线，定价以利润最大化；而进入与退出的威胁，最终会把批发服务的价格推向平均成本。

第二条，也是更精巧的一条，是库存管理。和 Amihud and Mendelson (1980)、Ho and Stoll (1981) 那种「靠调整报价管理库存」的经典做市商不同，批发商对全国最优买卖报价（National Best Bid and Offer, NBBO）几乎没有影响力——它们和经纪商的安排要求自己照单全收所有可成交订单。于是批发商只能通过在别的场所交易来对冲库存失衡，这往往要放弃预期的价差收入、还要付场所费用。Huang et al. (2012)（单一证券）与 Song (2010)（多证券）把这个问题刻画成「带成本控制的库存管理问题」，并证明最优库存政策是一个门槛政策（threshold policy）：上下两个门槛决定何时把库存「甩」出去。

关键在于：如果批发商的风险厌恶越低、或证券波动率越低，它就会把门槛设得更宽，从而在控制库存上花更少的资源。而风险厌恶随财富下降（Arrow, 1971；Paravisini et al., 2017）——这正好解释了为什么规模有用：体量越大、资本越雄厚，风险厌恶越低，库存管理越省。同时，批发商在数千只证券上提供服务，为一个分散化的组合管理库存，远比逐只证券地管要便宜——这一点，和多资产做市里「一只股票的冲击会改写另一只报价」的逻辑一脉相承（关于这一点，可参见《做市商的「一本账」：当一只股票的冲击，悄悄改写了另一只的报价》；而做市商被风险厌恶「系上绳」的机制，亦可参见《无风险市场里的风险厌恶》）。

那么，问题又来了：头部批发商既然有这么多规模红利，为什么愿意「让」给散户，而不是自己留下当利润？

答案在经纪商这一侧——它也很集中。比如 TD Ameritrade，即便在被 Charles Schwab 收购之前，就占了作者们能从 Rule 606 估算出的散户订单流的 47% 以上。换句话说，经纪商坐在驾驶座上。它们持续监控执行质量，把订单流重新分配给表现更好的批发商：谁的执行成本低，谁就拿到更多的量。数据与「经纪商精心监控成本、用更多订单流奖励优秀批发商」高度一致。

5 一个被低估的细节：「打包」如何救活了小盘股

这里还藏着一个特别有意思的制度细节——打包（bundling）。

一个典型的经纪商，并不是逐只证券地评价批发商的。也就是说，哪怕 Citadel 在苹果（Apple）这只票上执行成本最低，它也未必能因此拿到更多苹果的订单流。相反，Citadel 必须在整个证券谱系上、包括那些交易稀疏的小票上都跑赢对手，才能整体上赢得更多订单流。

这个机制的后果很微妙：经纪商实际上是在逼着批发商在微盘和小盘股里竞争。这些低成交、高库存成本的票，本来是中介最不愿碰的；监管者和交易所也常常发愁怎么改善它们的流动性。而本文发现，一旦把库存成本纳入考量，批发商在微盘和小盘股上收的执行成本，相对大盘股竟然是偏低的——正是「经纪商强制打包」在为小票托起了流动性。

这也直接关系到 SEC 那个逐单拍卖的提案。本文给出了两点冷静的提醒：第一，提案假设「非专业流动性提供者」会踊跃地为散户订单报出比批发商更优的价格改善——这在大盘股或许成立（散户对非散户的比例是 1:13），但在数千只散户实际在交易的微盘小盘股里，交易稀疏，这个比例只有 1:2，假设很可能落空。第二，逐单拍卖会消灭打包，从而削弱中介在微盘小盘股上服务散户的激励。作者们因此警告：真要实施，许多散户的执行质量可能不升反降——这与 Ernst et al. (2024) 基于理论模型得出的结论一致。

6 反转：当一个新巨头进场

最后，故事迎来了真正的反转。

在样本期内，一个新玩家——Jane Street Capital——杀进了批发市场，并在短短几个月里抢下了超过 12% 的散户订单流。按照「竞争越多越好」的朴素直觉，多了一个有力的竞争者，批发商之间的火拼应该更激烈，散户的执行成本应该下降才对。

可作者们的双重差分（difference-in-differences, DiD）分析，没有证实这个预期。事实恰恰相反：执行成本上升了。

这并不矛盾——它正是规模经济逻辑的镜像。新进入者抢走了一部分订单流，意味着在位者（incumbents）的运营规模缩水，规模经济被削弱，单位成本上升，最终反映为更高的执行成本。集中带来的红利，会随着集中度被打散而流失。

Figure 5: Execution Costs Around Jane Street Entry

这也回答了一个自然的疑问：既然越大越便宜，市场为什么没有自然演化到「只剩一家批发商」的极端？本文的回答是：那对经纪商而言是次优的——一个垄断的批发商太难驾驭，何况只有一家还意味着巨大的操作风险。所以当下这种「几家竞争 + 一圈竞争性边缘」的格局，更像是一种精妙的平衡：允许少数玩家做大、享受规模经济，同时保留一个可信的竞争威胁，吓阻任何一家乱来。

7 数据

本文的数据本身就是一项贡献——它完全来自公开的 SEC Rule 605 与 Rule 606 报告。

Rule 605：每个市场中心（含批发商）须按月、按个股披露其执行质量。本文收集了 2019 年 1 月至 2022 年 12 月共四年的数据。
Rule 606：每个经纪商须按月披露它向各市场中心的路由比例与收付的款项（含 PFOF）。
样本：与 CRSP 月度数据匹配后，得到 12,012 只 NMS 证券（含 ETP）；覆盖全部 8 家主要批发商。子样本划分为标普 500，以及非标普 500 按市值分的三个三分位（tercile 1 ≥ $600M；tercile 2 在 $110M–$600M；tercile 3 < $110M）。
可信度：SEC 在「订单竞争规则」的经济分析里指出，Rule 605 报告与监管层可访问的 Consolidated Audit Trail (CAT) 数据高度一致；许多机构还用第三方分析商生成报告，FINRA 也定期审计——这降低了自报偏差的担忧。
局限：数据是月频的，且不含零股（odd lots）和卖空。Battalio and Jennings (2023) 显示这两者约占散户成交量的 7.34%，且会放大价格改善的价值——这意味着本文可能低估了批发商提供的服务价值。

8 文献脉络

这条研究线，可以看作三股力量的汇流。

一股来自产业组织：从 Demsetz (1973)、Peltzman (1977) 关于「集中未必有害、效率也能造就集中」的老争论，到 Chamberlin (1933)、Dixit and Stiglitz (1977)、Asplund and Nocke (2006) 的垄断竞争理论——本文借它们来给批发市场的结构定性。

一股来自做市与库存管理：Amihud and Mendelson (1980)、Ho and Stoll (1981) 的经典库存模型，到 Huang et al. (2012)、Song (2010) 把它推广到「批发商无法影响 NBBO、只能照单全收」的现实情形，给出门槛型最优库存政策——这是规模经济机制的理论地基。

第三股来自执行质量的实证：2001 年 SEC 强制披露执行质量后，Bessembinder (2003)、Boehmer (2005)、Boehmer et al. (2007) 等一批研究用早期的 Dash 5 / Rule 605 数据起步；O'Hara and Ye (2011) 用 Rule 605 数据研究市场分割。而在当下这套「批发商 + PFOF」的新结构下，几乎同期出现了三篇用专有或自生数据的工作论文——Battalio and Jennings (2023)（某一家匿名批发商的订单级数据）、Ernst et al. (2023)（三家经纪商的专有路由数据）、Huang et al. (2024)（自生零股订单的实地实验）。本文的位置很清楚：它用公开、全覆盖的四年数据，第一次同时看清了全部八家批发商、近 100% 的散户订单流，以及经纪商的路由动态与订单流毒性——这是任何单一专有数据都做不到的全景。

（顺带一提，本文与本博客此前几篇关于散户与执行的文章遥相呼应：散户为什么会聚在某些票上，见《散户的栖息地》；不同投资者的「成交场所准入」如何决定成本，见《谁能进这间「暗房」，决定了你的成交成本》；以及散户需求如何外溢到衍生品定价，见《当波动率曲面被「散户」推歪》。）

9 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：价格改善（price improvement）和已实现价差（realized spread），到底用哪个？作者是不是在两套尺子之间「挑」对自己有利的？

不是「挑」，而是「看谁用」。对经纪商比较批发商而言，价格改善是合适的——同一批客户的订单流毒性在各批发商之间天然相同，被自动抵消了。但对研究者用按批发商汇总的数据做横向比较而言，必须用毒性调整后的 realized spread，否则会把「Citadel 接到最毒的流」误读成「Citadel 更贵」。两把尺子各有其正确的使用场景，这恰是本文测量上的关键洞见。

Q：批发商「自报」的 Rule 605/606 数据，可信吗？

有三道防线。其一，SEC 自己在「订单竞争规则」分析里说，Rule 605 与监管层掌握的 CAT 数据高度一致；其二，原始 Rule 605 里还混着 4000 多只根本不需要报告的非 NMS 证券（如权证、可转债），说明机构是把全部原始数据「整批」交给第三方分析商，而非挑挑拣拣再上报；其三，FINRA 定期审计，样本内无机构因报告不一致被处罚。

Q：「集中反而便宜」会不会只是因为大批发商接到的订单恰好更好做？

这正是毒性调整要解决的问题。事实上方向是反的——最大的两家接到的是最毒的订单流。在用 realized spread 调整掉毒性后，它们依然更便宜，且运营规模几乎完整解释了成本差。这让「订单更好做」的替代解释很难成立。

Q：Jane Street 进来后成本上升，会不会是巧合，而非「规模经济被稀释」？

作者用 DiD 来识别这一冲击，且结果与机制方向一致：在位者订单流缩水 → 规模经济削弱 → 单位成本上升 → 执行成本上升。当然，DiD 的可信度取决于平行趋势与「Jane Street 进入是否外生于执行成本的其他驱动」，这是需要谨慎对待的地方（见下文我的判断）。

Q：既然越大越便宜，为什么不干脆只留一家批发商？

因为那对经纪商不是好事。一个垄断批发商太难驾驭，且单点依赖意味着巨大的操作风险。当前「几家竞争 + 竞争性边缘 + 进入威胁」的格局，反而是让某些玩家做大享受规模经济、同时保留可信威胁的平衡解。

Q：那 SEC 的逐单拍卖提案，是好是坏？

本文的立场偏谨慎。拍卖假设非专业流动性提供者会踊跃竞价，这在大盘股（散户/非散户 = 1:13）也许成立，但在数千只微盘小盘股（仅 1:2）很可能落空；而且拍卖会消灭「打包」，削弱中介服务小票的激励。结论是：很多散户的执行质量可能因此变差，而非变好。

(b) 几个可能的研究问题与提案

1. 把「批发商规模经济」搬到公司债市场。 【经济故事】公司债是经销商（dealer）主导的场外市场，库存成本与规模经济的逻辑天然契合——大经销商是否也因规模而给客户更低的成交成本？【可行性】中。TRACE 提供成交级数据，可构造经销商层面的已实现价差与库存指标；难点在于公司债没有 NBBO、且大宗交易的「接盘人」结构复杂（可参见《谁来接住这一大笔债券？》），识别规模经济需要在控制券种、评级、久期后做横截面比较。

2. 订单流毒性的「经纪商指纹」能否预测散户收益？ 【经济故事】本文发现 Robinhood/Webull 的订单流毒性低于老牌经纪商。若毒性可按经纪商稳定区分，它本质上是在度量不同散户群体的「信息含量」——这与「散户是不是聪明钱」的争论直接相关。【可行性】高。Rule 605/606 是公开的，可构造各经纪商的毒性时间序列，再与该群体可观测的交易表现或市场事件对照。

3. 外资持有人结构如何影响中介的库存成本与执行质量？ 【经济故事】本文把规模经济追溯到「分散化库存 + 低风险厌恶」。如果一类资产的边际持有人是外资（其交易时区、流动性需求、信息不同），中介对冲库存的成本会随之改变，进而影响执行质量。【可行性】中。需要把持有人结构数据（如 13F、国际持仓）与成交成本对接，识别上要处理「持有人结构内生于资产流动性」的反向因果。

4. 用 Jane Street 进入做一次干净的「规模经济稀释」自然实验。 【经济故事】本文已用 DiD 给出方向性证据。下一步是把「在位者份额损失的异质性」当作连续处理强度，检验份额损失越多的批发商、其执行成本上升越多——这能把「规模经济」从「同期其他冲击」中进一步剥离。【可行性】中高。数据现成（Rule 605），关键是构造份额冲击的工具或用进入前的份额做处理强度，并做安慰剂检验。

5. 「打包」对小盘股流动性的因果效应。 【经济故事】本文论证经纪商的打包逼着批发商在小票上竞争、托起了小票流动性。若逐单拍卖真的落地，可作为消灭打包的外生冲击，事前事后地度量微盘小盘股流动性的变化。【可行性】低到中。取决于提案是否实施及实施范围；在它落地前，只能用横截面或结构模型间接推断。

10 我的判断

这篇论文最大的贡献，是用公开数据把一个被政策辩论裹挟、却长期看不真切的市场，第一次完整地摊在了桌面上。它的说服力不在某一个花哨的识别，而在「全覆盖 + 四年 + 八家批发商 + 全部散户流」这个数据视角本身——这是 Battalio and Jennings (2023)、Ernst et al. (2023)、Huang et al. (2024) 那些专有/小样本工作论文都给不了的全景。而「集中源于规模经济、且红利被传导给散户」这个反直觉的结论，加上「打包托起小盘股流动性」这个被忽视的制度细节，对当下 SEC 的逐单拍卖之争是极有分量的实证输入。

但我有两点保留。其一是识别。本文最接近因果的部分是 Jane Street 进入的 DiD，其余多为横截面相关——「规模 → 低成本」的因果方向，仍可能被「某些批发商先天更高效，于是既大又便宜」这类不可观测的能力差异所污染；运营规模「完整解释」成本差，更像是规模与效率难以分离的体现，而非纯粹的规模因果。Jane Street 这一冲击是否外生于执行成本的其他同期驱动（如 2019–2022 这段极不平静的市场环境），也值得更细的平行趋势与安慰剂检验。其二是数据口径：月频、且不含零股与卖空，作者诚实地承认这可能低估了批发商的服务价值——反过来说，我也想看到在更高频、纳入零股后，结论的量级是否稳健。

我接下来最想看到的，是把这套「规模经济 + 库存分散化 + 打包」的框架，搬到 NBBO 不存在、经销商主导、库存成本更显性的公司债与信用市场去检验——那里既是规模经济逻辑的天然试验场，也是散户保护与中介集中之争的下一个战场。

参考文献

Amihud, Y., Mendelson, H. (1980). Dealership market: Market-making with inventory. Journal of Financial Economics 8(1), 31–53.
Asplund, M., Nocke, V. (2006). Firm turnover in imperfectly competitive markets. Review of Economic Studies 73, 295–327.
Autor, D., Dorn, D., Katz, L.F., Patterson, C., Van Reenen, J. (2020). The fall of the labor share and the rise of superstar firms. Quarterly Journal of Economics 135, 645–709.
Battalio, R.H., Jennings, R.H. (2023). Wholesaler execution quality. Working paper, University of Notre Dame.
Bessembinder, H. (2003). Selection biases and cross-market trading cost comparisons. Working paper, University of Utah.
Boehmer, E. (2005). Dimensions of execution quality: Recent evidence for US equity markets. Journal of Financial Economics 78(3), 553–582.
Boehmer, E., Jennings, R., Wei, L. (2007). Public disclosure and private decisions: Equity market execution quality and order routing. Review of Financial Studies 20(2), 315–358.
Chamberlin, E.H. (1933). The Theory of Monopolistic Competition. Harvard University Press.
Demsetz, H. (1973). Industry structure, market rivalry, and public policy. Journal of Law and Economics.
Dixit, A.K., Stiglitz, J.E. (1977). Monopolistic competition and optimum product diversity. American Economic Review.
Ho, T., Stoll, H.R. (1981). Optimal dealer pricing under transactions and return uncertainty. Journal of Financial Economics.
O'Hara, M., Ye, M. (2011). Is market fragmentation harming market quality? Journal of Financial Economics 100(3), 459–474.
Paravisini, D., Rappoport, V., Ravina, E. (2017). Risk aversion and wealth: Evidence from person-to-person lending portfolios. Management Science 63(2), 279–297.
Peltzman, S. (1977). The gains and losses from industrial concentration. Journal of Law and Economics 20, 229–263.
Song, M. (2010). Applications of Stochastic Inventory Control in Market-Making and Robust Supply Chains. Dissertation, MIT.