把成交质量晒在阳光下,订单就真的跟着走了吗?

[2007 RFS] Public Disclosure and Private Decisions: Equity Market Execution Quality and Order Routing
Note

本文读的是 Boehmer, Jennings & Wei (2007, Review of Financial Studies):2001 年 SEC 强制各「市场中心」每月公布标准化的成交质量报告(Dash-5)之后,那些报告出来「价差更低、成交更快」的市场,在随后的月份里确实抢到了更多订单;更关键的是,这些报告里装着 TAQ 数据之前没有的增量信息。一句话——阳光真的让订单跟着走了。

1 一个监管者的信仰,和一个不容易回答的问题

监管者有一种近乎宗教般的信仰:阳光是最好的消毒剂。美国证监会(SEC)在介绍自己时反复强调,它的首要工作是「促进重要信息的披露」,背后的逻辑是——只要让人们掌握足够的信息,他们就会做出让市场更有效率的决策。

可这只是一个信仰。信仰需要证据。

故事的引子是这样的:在美国,一只在纽交所(NYSE)挂牌的活跃股票,它的订单可以送到很多地方去成交——纽交所自己、五家区域性交易所、若干家做 Nasdaq Intermarket 的做市商、还有八家电子撮合网络(ECN)。一笔市价单到底花了多少隐性成本、等了多久才成交,历史上没有一把统一的尺子可以衡量。于是 SEC 在 2000 年 11 月祭出了 Rule 11Ac1-5(业内昵称 Dash-5):从此每家市场中心都要按月公布一套标准化的成交质量指标,目标是「赋予市场力量以工具,去实现一个更具竞争、更有效率的全国市场体系」。

听上去很美。但请注意这里有一个让人不安的细节:绝大多数投资者根本不自己决定订单送到哪儿。SEC 自己的 Rule 11Ac1-6 报告显示,超过 90% 的订单没有指定具体的成交市场——路由权被委托给了券商。哪怕是机构订单,业内估计也有约 80% 把路由决定留给了券商。

于是真正的问题浮出水面:

Note

当一份报告每月公布、又被监管和客户拿着放大镜审视时,那些替别人做决定的券商,真的会因为这份报告而改变订单的去向吗?而且——这份报告里,真的有 TAQ 数据之外的新东西吗?

这就是本文要回答的两个问题。它看起来是一篇市场微观结构的论文,但骨子里,它是在替「强制披露」这件公共政策做一次体检。

2 识别策略:把「市场份额」当成因变量

要回答「成交质量好的市场是不是抢到了更多订单」,作者需要一个能把多个相互竞争的市场中心同时装进去的计量框架。他们没有用常见的面板回归,而是借来了市场营销学里一套成熟的工具——吸引力市场份额模型 (attraction market-share model),其根基是 Bell, Keeney and Little (1975) 提出的「市场份额定理」,估计方法则沿用 Nakanishi and Cooper (1982) 的 MCI 模型。

为什么是这套模型?因为它有一个天然契合的性质:每家市场中心的份额非负、且所有份额之和恒为 1。这正是「订单要么去 A、要么去 B、要么去 C」的瓜分逻辑。

模型的核心很朴素:一只股票在第 i 家市场的成交份额 MS_i,等于它对这家市场的「吸引力」A_i 占所有竞争市场吸引力之和的比例;而吸引力本身,是各项成交质量属性(价差、速度等)的乘积式函数。

$$ MS_{i} = \cssId{a1}{\frac{A_{i}}{\sum_{j=1}^{J} A_{j}}}, \qquad A_{i} = \cssId{a2}{\exp(\alpha_i)}\;\cssId{a3}{\prod_{k} x_{ik}^{\beta_k}}\;\cssId{a4}{\varepsilon_i} $$

这个乘积式没法直接跑回归。这里真正关键的一步是 Nakanishi-Cooper 的「对数中心化 (log-centering)」变换:把每个变量都除以它在竞争市场间的几何均值(下文用 ~ 表示),再取对数,乘积就被拉成了一个可以用线性方法估计的式子:

$$ \log\!\left(\frac{MS_{i}}{\widetilde{MS}}\right) = (\alpha_i-\tilde{\alpha}) + \sum_{k}\beta_k \,\log\!\left(\frac{x_{ik}}{\tilde{x}_{k}}\right) + \log\!\left(\frac{\varepsilon_i}{\tilde{\varepsilon}}\right) $$

直觉上,左边问的是「这家市场的份额,比所有竞争对手的『平均水平』高还是低」;右边问的是「它在各项成交质量上,又比平均水平好还是差」。β_k 于是有了一个干净的解读:当一家市场的某项质量相对竞争对手改善 1%,它的相对市场份额会变动百分之几。这恰恰就是「订单是否追着成交质量走」的弹性。

作者把它落到两条具体方程上:方程 (7) 用于第一阶段的事件研究,方程 (8) 用于主分析。

3 事件研究:Dash-5 之前 vs. 之后

要论证「是 Dash-5 这份公开报告改变了行为,而不仅仅是成交质量本身在起作用」,作者用了一个聪明的对照设计。

他们刻意挑了一个横跨 Dash-5 实施前后都能算的成交质量指标——用纽交所 TAQ 数据算出来的有效价差 (effective spread)。这是衡量成交成本的标准尺子,2001 年 Dash-5 上线之前就有、之后也有。逻辑是这样:如果券商一直就在看成交成本路由订单,那么市场份额对有效价差的敏感性,在 Dash-5 前后应该没什么变化;可如果是「把成交质量摆上台面」这件事本身改变了行为,那么实施之后,这个敏感性应该变大

结果正是后者:Dash-5 实施之后,市场份额对成交成本的敏感性显著上升。如表 3 所示,方程 (7) 的估计把这种「敏感性的跳变」量化了出来。

Table 3: summarizes the regression results for Equation (7), estimated

Table 3: summarizes the regression results for Equation (7), estimated

作者很克制,没有把这说成铁板钉钉的因果——毕竟同期市场结构本身也在变(十进制报价、自动化撮合都在这几年发生)。但这个结果至少给出了一个强有力的暗示:强制披露给了券商一个额外的理由,去把量化的成交质量纳入路由决策。这也呼应了另一类「公开披露改变行为」的证据——当做空数据从延迟公布变成实时公开后,市场效率也随之改变(参见《短卖单不再是「先知」:当做空数据被实时公开之后》)。

4 数据:两个样本,一把 TAQ 做的「照妖镜」

先把数据讲清楚,因为这篇论文的说服力,很大程度上来自它对数据陷阱的处理。

样本期是 2001 年 6 月到 2004 年 6 月(TAQ 数据从 2000 年 6 月起)。起点是 NYSE 主文件里 2561 只非优先股证券,经 CRSP 股票代码筛掉外国注册公司、封闭式基金、ADR 等,再剔除三只股价超过 $1000 的票(伯克希尔 A/B 和 Security Capital),最终留下 1435 只 NYSE 挂牌股票。

为了平衡「纳入的市场数」和「纳入的股票数」,作者构造了两个样本:

如表 1 所示,两个样本的描述统计印证了这种取舍:小样本偏向高市值、高活跃度的大盘股,大样本则更接近全市场分布。

Table 1: summarizes that the large sample includes lower capitalization

Table 1: summarizes that the large sample includes lower capitalization

这里有两个细节,体现了作者的谨慎。其一,他们主动剔除了 Instinet 和 Island(Inet)——因为这两家在样本期内因 Dash-5 数据涉嫌不实而被 SEC 处罚(罚款 220 万美元)。这一脚踢得很关键:它既排除了已知的「脏数据」,又反过来说明 Dash-5 报告确实被监管巡查,从而提高了对其余市场报告的信心。其二,全样本里 NYSE 一家就吃下了 81% 的市价类订单、约 91% 的 Dash-5 订单——市场份额高度倾斜,这也正是为什么必须用份额模型而非简单回归。

至于成交质量本身,Dash-5 报告只对市价单和「可成交限价单」披露三个核心指标:有效价差(成交价相对收单时 NBBO 中点的偏离的两倍,衡量隐性成本)、价格冲击 (price impact)(订单的永久性信息成分,反映其「难度」)、执行速度 (execution speed)(从收单到成交的时间)。如表 2 所示,各市场在这三项上差异巨大——NYSE 的订单普遍含有更多信息成分,Archipelago 也像是知情订单的去处。

Table 2: provides descriptive statistics for both samples. We report

Table 2: provides descriptive statistics for both samples. We report

而真正把这篇论文从「相关性」往「增量信息」推进一步的,是作者在附录里做的一件事:拿 TAQ 算出的成交质量Dash-5 报告的成交质量逐一对照。他们没有发现系统性的不一致。这意味着——后面主分析里只要控制住 TAQ 指标,Dash-5 报告里剩下的解释力,就是它独有的增量信息

5 反转:报告里真的有「新东西」

到这里,一个自然的质疑会冒出来:Dash-5 报告会不会只是把 TAQ 早就有的信息换个包装重说一遍?如果是,那它对政策的意义就大打折扣。

这正是全文最漂亮的一击。作者在主分析(方程 8)里同时放进 TAQ 口径的成交成本和 Dash-5 口径的成交质量,看后者在控制住前者之后还剩多少解释力。

答案是:剩得不少。当一家市场的 Dash-5 有效价差或成交时间相对竞争对手偏高时,它在随后会丢失订单流。 如表 4 所示,方程 (8) 的估计在控制了 TAQ 成交成本等多个因素之后,Dash-5 的价差与速度依然显著地解释了市场份额的变动。

Table 4: presents estimation results for Equation (8) with three

Table 4: presents estimation results for Equation (8) with three

这件事并不 trivial,因为 Dash-5 报告有一堆先天缺陷:它只覆盖约三分之一的总订单流、滞后一个月发布、不经审计、对底层订单数据的聚合方式很敏感。在这么多噪声之下,它仍然携带了增量信息——这是对「强制披露」最有力的一票。

但作者也诚实地指出了另一面的反转:糟糕的 Dash-5 表现并不意味着立刻被市场淘汰。至少在中期,有一部分订单流对价差和速度的差异无动于衷。为什么?因为有些市场在价差和速度捕捉不到的维度上竞争——比如专门处理难成交的订单,或者干脆给券商支付「订单流报酬 (payment for order flow)」。换句话说,成交质量是竞争的一条主线,但不是唯一一条。这一点在 Table 6 的分市场、分订单规模的结果里也相当一致。

把这两面合起来,本文的核心贡献就清楚了:

Note

强制信息披露确实改变了「替别人做决定的人」的行为——成交质量好的市场抢到更多订单,且报告本身提供了原先没有的信息。但这种竞争压力是有限度的:当一个市场能在「报告照不到的角落」提供别的价值(难单处理、订单流付费)时,差的成交质量也未必让它出局。

6 文献脉络

这条研究线的演进,是一个「先比较、再追问、最后做实验」的过程。

最早的一批工作关心的是「不同市场的成交质量到底差多少」。Blume and Goldstein (1992)、Lee (1993) 比较了 NYSE、区域所与 NASD 之间的成交价;Easley, Kiefer and O'Hara (1996) 用「奶油撇取 vs. 利润分享」的视角解释了被购买订单流(purchased order flow)的角色;Huang and Stoll (1996)、Bessembinder and Kaufman (1997) 则系统比较了做市商市场与拍卖市场的成交成本。这一阶段的关键词是比较

接着,一个自然的问题是:成交成本的差异,到底是结构性的,还是只在某些时候出现?Bessembinder (2003b) 给了一个精彩的答案——他发现 Nasdaq Intermarket 的成交成本只在它报价不具竞争力时才偏高;一旦报价有竞争力,差异就微乎其微。这把问题从「市场之间差多少」推向了「成交质量是随时间、随报价而变的」。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

然后,真正悬而未决的一步是:既然成交质量在市场间、在时间上都有差异,那么做路由决策的人,到底有没有把这些差异考虑进去?过去的数据条件让这个问题几乎无法回答。Chung, Chuwonganant and McCormick (2004) 触及了定向订单流与成交成本的关系,Boehmer (2005) 则系统刻画了美国股市成交质量的多个维度。

本文所处的位置,正是接住了这最后一问。借着 Dash-5 这场监管自然实验,作者第一次能直接观察「成交质量的变化 → 订单路由的反应」,并把强制披露的增量作用单独识别出来。如果说前人是在描述这个市场,本文则是在检验人们如何对这个市场的信息做出反应——而这恰恰是把微观结构问题升格为公共政策问题的那一跃。

把视野再放宽一点,这篇 2007 年的论文,和后来一系列「监管透明度实验」是同一血脉。债券市场上那场被监管钦定的透明度实验(参见《掀开交易商的「桌布」:一场被监管钦定的公司债透明度实验》),以及今天对散户订单成交质量地形的重新丈量(参见《集中,到底是谁的福利?——一张散户订单的旅行账单》),问的都是同一个母题:当监管把成交质量摆上台面,市场会如何重新组织自己?

7 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:既然 90% 以上的订单都不指定市场,券商凭什么要在意 Dash-5?

因为券商对客户负有「最优执行 (best execution)」的受托责任,而 Rule 11Ac1-6 又要求他们披露自己的路由实践和订单流付费安排。Dash-5 给了券商一个可以向客户和监管轻松交代的量化理由——把订单送到报告好看的市场,是一个容易自证清白的决策。激励不在投资者那头,而在券商的合规与声誉那头。

Q:作者怎么排除「成交质量本身在起作用、和 Dash-5 公开无关」?

靠两件事。一是事件研究(方程 7):用前后都能算的 TAQ 有效价差,证明市场份额对成交成本的敏感性在 Dash-5 之后变大——质量没变,是「公开」让反应更强了。二是主分析(方程 8)里同时放进 TAQ 和 Dash-5 指标,看 Dash-5 在控制住 TAQ 之后还剩解释力。两条腿走路。

Q:Dash-5 不是有 220 万美元的造假罚单吗?这数据还能信吗?

这恰恰被作者用成了优势。他们剔除被罚的 Instinet 和 Island,并在附录里把 Dash-5 与 TAQ 逐一对照,没发现系统性偏差。更重要的是,罚单证明 Dash-5 确实被监管巡查——这反而提高了对其余市场报告可信度的信心。坏消息被转化成了识别上的好消息。

Q:为什么有些市场成交质量差,却没被淘汰?这不是和「订单追质量走」矛盾吗?

不矛盾,是「质量」的维度不止价差和速度。有些市场专门接难成交的订单,有些靠订单流付费买订单。价差和速度照不到的地方,仍是竞争的战场。所以本文说的是「成交质量是竞争的一条主线」,不是唯一的线。

Q:为什么用市场份额模型,而不是直接对成交量做回归?

因为路由是一个瓜分问题:订单去了 A 就不会去 B,所有市场份额必须非负且加总为 1。普通回归不保证这点,而 Bell-Keeney-Little 的吸引力模型天然满足,再经对数中心化就能线性估计。模型选择本身就是对经济结构的尊重。

Q:这篇 2007 年的结论,在今天高频、暗池主导的市场里还成立吗?

要打个问号。样本期(2001–2004)正值十进制报价、撮合自动化的转型早期,订单流也远没有今天碎片化。今天大量散户订单被内部化、走批发商和暗池,Dash-5(后来的 Rule 605/606)覆盖的口径与权重都变了。结论的「方向」大概率仍在,但「量级」需要重新校准。

(b) 几个可能的研究问题与提案

1. 把同样的「披露 → 路由」实验搬到公司债市场

2. 外资持有人对成交质量披露的反应是否不同?

3. 「报告照不到的维度」到底值多少钱?给订单流付费定价

4. 强制披露的「疲劳效应」:报告看久了还有用吗?

我的判断

这篇论文最值得称道的,是它把一个虚的政策信仰(「阳光能改善市场」)做成了一个实的可检验命题,并且在识别上层层设防:事件研究锁定「公开」的作用、TAQ 对照锁定「增量信息」、剔除被罚市场把脏数据变成识别优势。结论既不夸大(承认无法宣称严格因果),也不回避反例(承认部分订单流无动于衷),分寸感很好。

对识别我有两点保留。其一,样本期正撞上市场结构剧变(十进制化、自动化撮合、NYSE 2003 年自动报价决定),事件研究里「Dash-5 之后敏感性上升」很难和这些同期冲击完全切割——作者也坦承了这点,但读者要记得这个 caveat 始终悬着。其二,份额模型把「吸引力」设成属性的乘积式,函数形式相对刚性;如果券商的真实路由规则有阈值或非线性(比如「只要不是最差就行」),模型可能系统性地低估或高估弹性。

后续我最想看到的,是把这套框架放到今天重新跑一遍:当散户订单被批发商内部化、暗池占比飙升、Rule 605 几经修订之后,「披露 → 路由」的弹性是变强了还是被稀释了?以及,把它从股票延伸到信用市场——那里既缺乏标准化的成交质量报告,又最需要竞争压力。这篇 2007 年的论文,给所有这些问题提供了一个干净的起点。

参考文献