看不见交易商的手:一份大宗交易合约该长成什么形状

[2024 JFE] Block Trade Contracting
Note

本文读的是 Baldauf, Frei & Mollner (2024, Journal of Financial Economics):当养老金把一笔大单外包给交易商执行、却只能盯着市场价格(看不见交易商到底怎么下单)来付钱时,最优的「加权平均价」合约不是业内常用的 TWAP,也不是 MOC,而是一条对称的 U 形——把重量压在交易窗口的头和尾。在连续时间极限下,它简化成一个惊人干净的形状:两端各放一个等大的「原子」,中间是一条常数密度。

1 引言:两种摩擦,第一次被放在同一张桌子上

设想你管着一只养老金,今天要买入一大笔某证券。你当然可以自己慢慢买——这正是「最优执行 (optimal execution)」这条文献研究了几十年的问题:因为有 价格冲击 (price impact),一次性砸下去会把价格买飞,所以聪明的做法是把一张「母单 (parent order)」拆成若干「子单 (child order)」,分散在一段时间里执行。

但现实里,养老金、共同基金、捐赠基金往往自己做这件事,而是把执行外包给一家交易商 (dealer)。于是事情就有了第二层摩擦:交易商的利益和你并不一致。这就是 代理冲突 (agency conflict)。

Note

这篇论文真正的野心,是把这两种摩擦——价格冲击代理冲突——第一次放进同一个模型里,看它们如何相互纠缠。在此之前,最优执行文献几乎只谈前者,假设你自己执行;而委托代理文献谈后者,却很少触及交易里那套精巧的价格动态。

外包是怎么定价的?实务中,一笔「大宗交易 (block trade)」常常按执行窗口内市场价的某种加权平均来结算。最常见的两种:一种是按窗口内的 时间加权平均价 (time-weighted average price, TWAP) 结算,即所谓「保证 TWAP 合约」;另一种是按窗口结束时刻的收盘价结算,即「保证收盘价合约 (market-on-close, MOC)」。这些合约之所以存在,一个经济学上的理由是交易商厌恶风险——大单风险大,加上监管要求交易商为敞口持有资本,他们确实有动机把一部分价格风险转回给客户。

可问题来了:这两种业内通用的合约,对客户而言是最优的吗?哪怕只是在「加权平均价」这一类里最优?如果不是,客户怎样才能为自己做得更好?

这个问题绝不是吹毛求疵。Nasdaq (2022) 与 SIFMA (2021) 估计,美国股票市场上机构投资者每年的交易成本约 $70 billion,其中几乎全部来自价格冲击。而执行环节的利益冲突有多真实?FINRA 第 5270 号规则一边禁止交易商利用「迫在眉睫的大宗交易」的非公开信息抢跑 (front-running),一边又开了一个口子:为「履行或便利客户大宗订单的执行」而做的交易不在此限——这就给「下单时机」留足了博弈空间。2024 年摩根士丹利为大宗交易调查支付 $249 million 和解金,正是这种冲突真金白银的注脚。

2 模型设定:一个委托人,一个代理人,一条价格

这是一篇理论论文,核心是一个委托代理模型。粗略地说,它把一个经典的价格冲击模型(à la Bertsimas & Lo, 1998;Almgren & Chriss, 2001)和一个经典的隐藏行动契约模型(à la Holmström, 1979)焊在了一起。

委托人(客户):需要买入固定数量的证券,归一化为买 1 股。她是风险中性的。

代理人(交易商):具有不变绝对风险厌恶 (constant absolute risk aversion, CARA),系数为 \(\lambda\),效用函数

$$u(w) = -\exp(-\lambda w).$$

时间线:在 \(t=0\),客户提出一份合约,交易商接受或拒绝。合约规定客户将在 \(T+1\) 时刻以某个价格从交易商手中买入 1 股,而这个价格是市场价 \((p_1,\dots,p_T)^\top\) 的函数。如果交易商接受,他就在交易期 \(t\in\{1,\dots,T\}\) 内到市场上买入对冲,\(x_t\) 是第 \(t\) 期买入的股数,且必须 \(\sum_{t=1}^T x_t = 1\)。

关键摩擦——隐藏行动:客户看不见交易商在市场上那一连串具体的对冲交易 \(x_t\),只能看见实现出来的市场价时间序列。换句话说,价格是交易商行动的信号,但是带噪声的信号。

价格怎么动?论文采用了那条几乎是行业标配的线性动态:

$$ p_t = p_0 + \cssId{a1}{\gamma x_t} + \cssId{a2}{\theta \sum_{s=1}^{t} x_s} + \cssId{a3}{\sum_{s=1}^{t} \varepsilon_s} $$

这里 \(\theta\ge 0\) 是永久价格冲击,\(\gamma\ge 0\) 是临时价格冲击,\(p_0\) 是初始价位,\(\varepsilon_s\) 是第 \(s\) 期独立同分布的价格冲击,\(\varepsilon_s\sim N(0,\sigma^2)\),\(\sigma>0\)。为避免退化,假设 \(\theta\) 与 \(\gamma\) 至少有一个严格为正。

Tip

请记住 \(a1\) 和 \(a2\) 的区别,这是全篇的胜负手。临时冲击像水里的涟漪,你这一桨划下去水面凸起,桨一抬就平了;永久冲击像往池子里倒水,每倒一瓢,水位就永久抬高一截,而且后面所有的价格都被垫高了。正是后者,让「先买还是后买」这件事变得真正动态——时间的先后顺序开始有了实质含义。

客户的问题。客户要选一份合约 \(\boldsymbol{\tau}\) 和一条「建议给交易商的交易策略」\(\boldsymbol{x}\),在个体理性 (IR) 与激励相容 (IC) 两个约束下最小化自己的期望支付:

$$\min_{\boldsymbol{\tau}\in\mathcal{T},\,\boldsymbol{x}\in\mathcal{X}} \;\mathbb{E}[\tau(\boldsymbol{p})]$$

$$\mathbb{E}\!\left[u\big(\tau(\boldsymbol{p})-\boldsymbol{x}\cdot\boldsymbol{p}\big)\right]\ge u(0) \tag{IR}$$

$$\boldsymbol{x}\in\arg\max_{\hat{\boldsymbol{x}}\in\mathcal{X}}\;\mathbb{E}\!\left[u\big(\tau(\boldsymbol{p})-\hat{\boldsymbol{x}}\cdot\boldsymbol{p}\big)\right] \tag{IC}$$

直觉很顺:交易商的收入是客户付的 \(\tau(\boldsymbol{p})\),成本是他在市场上对冲的 \(\boldsymbol{x}\cdot\boldsymbol{p}\),二者之差就是他的利润。(IR) 保证他愿意接单(至少不亏),(IC) 则因为隐藏行动而必不可少——客户无法直接命令交易商怎么交易,只能用合约把「希望他走的那条路」变成他自己最优会走的路。

合约集。剩下的就是限定客户能从哪一类合约里挑。论文给了三种:

$$\boldsymbol{\tau}\in\left\{(\tau_1,\dots,\tau_T)^\top\in\mathbb{R}^T \;\middle|\; \sum_{t=1}^T \tau_t = 1\right\},$$

客户付给交易商 \(\sum_{t=1}^T \tau_t p_t\)。业内的两种常用合约正是它的特例:\(\boldsymbol{\tau}^{\text{TWAP}}=(\tfrac1T,\dots,\tfrac1T)^\top\),以及 \(\boldsymbol{\tau}^{\text{MOC}}=(0,\dots,0,1)^\top\)。

作者把分析定位得很清楚:在与现行合约「复杂度相当」的那一类里,寻找最好的合约。这一步「自我设限」其实是论文最讲究的地方——它放弃了那个不现实的理论最优,转而问一个实务上真正可落地的问题。

3 先看没有摩擦的世界:第一最优就是「匀速买」

要理解代理冲突改变了什么,先得有个干净的基准。把隐藏行动这层摩擦拿掉——假设客户看见交易商的交易,也不限制合约形式。

此时客户可以用一份「强制合约」:只要交易商偏离建议的策略就罚他一大笔。由 \(u\) 的凹性,满足 (IR) 的最优做法是让交易商恰好不赚不亏,即在他听话时令 \(\tau(\boldsymbol{p},\boldsymbol{x})=\boldsymbol{x}\cdot\boldsymbol{p}\)。代入目标,客户的问题塌缩成

$$\min_{\boldsymbol{x}\in\mathcal{X}}\;\mathbb{E}[\boldsymbol{x}\cdot\boldsymbol{p}].$$

这正是一个纯粹的最优执行问题。它的经典解众所周知:在每一期买入等量(匀速执行),借此把永久冲击带来的「自己把价格越买越高」的成本摊平。换句话说,第一最优下,交易商应当 \(x_t=1/T\),恰好等于 TWAP 的形状。

Note

这里埋下了一个非常漂亮的伏笔:如果没有代理冲突,TWAP 式的匀速执行就是对的。 所以业内偏爱 TWAP 并非毫无道理。问题在于,一旦交易商的手藏到了暗处,匀速还成立吗?

4 核心张力:交易商想「前置」,客户该怎么把他掰回来

现在把隐藏行动放回去。这是全篇的引擎,我们慢慢拆。

首先,看交易商的激励。 给定一份加权平均价合约 \(\boldsymbol{\tau}\),他的利润是 \((\boldsymbol{\tau}-\boldsymbol{x})\cdot\boldsymbol{p}\)。一个保底策略是让自己的交易权重完全镜像合约权重,即 \(\boldsymbol{x}=\boldsymbol{\tau}\),这样稳赚零利润。但他能做得更好:把交易量从期望价格高的时期挪到期望价格低的时期——在便宜的时候多买,在贵的时候少买,差额就是利润。

接着,一个自然的问题是:哪些时期价格高? 永久冲击 \(\theta\) 给了答案。因为每一笔买入都把后面所有价格永久垫高,所以越晚的期望价格越高。于是交易商有了一个明确的动机:前置交易 (frontloading)——把交易权重往前压,早买、便宜买。这个「前置」倾向并非纸上谈兵,论文指出它与外汇 (Bloomberg, 2016)、利率掉期 (Risk.net, 2021)、期权 (Bloomberg, 2019) 等多个资产类别里观察到的交易商行为一致。

然后,轮到客户。 她面对两股方向相反的力:

于是反转出现了。 这两股「想压早期」和「想压后期」的力量叠加,产物既不是 TWAP,也不是 MOC,而是一条对称的、U 形的最优合约:

$$\tau^*_1 \ge \tau^*_2 \ge \cdots \ge \tau^*_{\lceil T/2\rceil} \le \cdots \le \tau^*_{T-1} \le \tau^*_T,$$

并且 \(\tau^*_t = \tau^*_{T+1-t}\)(对称)。论文证明:永久冲击会加深 U 形的严峻程度,而临时冲击与交易商的风险厌恶会削弱它。直觉上,永久冲击是这一切力量的源头,所以它既加深合约的 U 形,也加剧交易商最终的前置;临时冲击和风险厌恶则给交易商引入了别的动机,方向相反。

Warning

别把这条 U 形误读成「客户在赌价格」。客户是风险中性的,她不在乎价格波动本身。U 形纯粹是激励的产物:两端的高权重,是同时回应「自己想占早期便宜」和「想把交易商从前置里拉回来」这两件事的最经济的方式。

5 连续时间极限:一个惊人干净的形状

离散时间下 \(\boldsymbol{\tau}^*\) 虽有闭式解,却复杂难读。真正让这篇论文「好看」的,是它的连续时间极限。在这个极限里,最优合约坍缩成一个极简的形状,可以看成 U 形的极端版本:

在两个端点时刻各放一个等大的「原子 (atom)」,中间所有内点时刻是一条常数密度。

而交易商对此的最优反应同样干净:内点也是同一条常数密度,两端各有一个原子——但初始端的原子是终端原子的 3 倍,这正是他前置冲动的精确刻画。

这一节里还藏着我认为全文最反直觉的一个结论:

Note

在连续时间极限下,临时价格冲击 \(\gamma\) 对最优合约完全没有影响。 为什么?因为它触发了两股恰好抵消的力:一方面,临时冲击抬高价格、抬高客户成本(若交易商交易固定);另一方面,临时冲击又部分抵消了交易商的前置冲动(早买的临时成本更高,逼他买得平缓些),反而降低客户成本。两相抵消,净效应归零。相应地,两端原子的质量——也就是 U 形的严峻程度——只随永久冲击递增,随风险厌恶递减

下图把这件事画得很清楚:在不同的临时冲击水平下,最优合约权重与交易商的最优反应策略各自长什么样。可以直观看到合约两端的「翘起」与交易商前置的那一端。

Figure 2: The optimal contract weights and best-responding trading strategy for different levels of temporary price impact. Without temporary price im

Figure 2: The optimal contract weights and best-responding trading strategy for different levels of temporary price impact. Without temporary price im

6 这能省多少钱?

理论再漂亮,也得落到一个「so what」。作者做了一个量级测算,用「实施差额 (implementation shortfall)」衡量交易成本,把最优合约与两种常用合约对比。结论是:在现实参数下,

对一笔价值 $100 million 的交易,省下的钱可能是几十万美元的量级。作者很克制,没有把这个数字吹成精确的福利估计,但方向是明确的:哪怕只在「加权平均价」这一类合约里换个形状,都有可观的改进空间。 这正是这篇论文给实务最直接的建议——别在 TWAP 和 MOC 之间二选一,把权重往两端的 U 形挪一挪。

7 文献脉络:从「怎么执行」到「替谁执行」

把这篇论文放回它的坐标系,能看得更清楚。

第一条线,是最优执行。 Bertsimas & Lo (1998) 与 Almgren & Chriss (2001) 奠定了「给定一个外生的价格冲击模型、求如何把大单在时间上铺开」的范式,Obizhaeva & Wang (2013) 进一步刻画了供需动态。本文的第一最优正好等价于这样一个问题,所以它在基准里复刻了这条文献的经典结论(匀速执行)。但本文的重心在别处——它要解的是第二最优 (second-best),那里隐藏行动才是主角。

第二条线,是金融契约与道德风险。 从 Holmström (1979) 的道德风险与可观测性,到 Holmström & Milgrom (1987)、Sannikov (2008) 的连续时间委托代理,再到 Hellwig & Schmidt (2002)、Biais et al. (2007) 对「离散逼近连续」的分析——本文的连续时间极限正是站在这条传统上。委托代理在金融里常见的两个变体是委托组合管理(Bhattacharya & Pfleiderer, 1985;Carpenter, 2000;Buffa et al., 2022)和委托资产管理(DeMarzo & Fishman, 2007;DiTella & Sannikov, 2021),而本文里代理人做的是一件不同的金融任务:调度一笔大单的执行

最关键的坐标,是作者自己的前作 Baldauf, Frei & Mollner (2022)。 那篇文章反过来走:先拿定一份常用合约(保证 VWAP),再去推导「什么样的市场模型能让它最优」,结论之一是价格冲击必须没有永久成分。本文走的是相反方向——先给定一个允许永久与临时冲击并存的标准市场模型,再推导最优的加权平均价合约。让永久冲击进场,是本文的关键创新:它把问题变成了真正动态的(时间顺序开始重要),而永久冲击的重要性在理论(Kyle, 1985)与实证(Biais et al., 2005)上都得到过反复确认。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

顺带一提,本文刻意把模型设成「交易商只做中介、不持有自营头寸」(\(\sum_t x_t=1\)),从而避开了双重交易 (dual trading) 文献(Röell, 1990;Fishman & Longstaff, 1992;Bernhardt & Taub, 2008)里那种「抢跑或并行交易」的冲突,专注于对冲时机这一种摩擦。与之相对,Edelen & Kadlec (2012) 研究的是代理交易(客户付实际执行成本),而本文是本金交易(价格事先约定)——这一区分对理解贡献至关重要。

8 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:U 形合约和 MOC、TWAP 到底差在哪?为什么不是其中之一?

TWAP 是匀速权重 \((1/T,\dots,1/T)\),MOC 是全压终点 \((0,\dots,0,1)\)。本文的最优合约对称且两端高、中间低,介于两者之间又不等于任何一个。直觉是:客户既要利用早期低价(像 TWAP 那样给早期份量),又要用后期权重把交易商从前置里拉回来(这点和 MOC 同向但远没那么极端)。两种诉求叠加,自然形成 U 形。

Q:风险中性的客户,为什么会容忍交易商赚走利润?

(IR) 约束下,客户只需保证交易商「不亏」即可接单。交易商之所以能赚到正利润,恰恰是因为隐藏行动——客户无法把他的前置行为完全管住。换句话说,那笔利润是信息租 (information rent) 的近亲:是隐藏行动这层摩擦的代价,而非客户主动让利。

Q:「临时冲击不影响最优合约」这个结论稳健吗,还是连续时间的人为产物?

它是连续时间极限下两股力恰好抵消的结果,作者诚实地标明了这一点。在离散时间里,临时冲击仍会削弱 U 形——只是当 \(T\to\infty\) 时净效应趋于零。所以这更像一个干净极限下的「巧合等式」,读者不该把它外推成「临时冲击在任何场景都无关紧要」。

Q:模型假设客户能观测到完整的市场价序列,这对所有资产类别都成立吗?

不成立,作者自己点明了。这对股票这类透明、有公开成交数据的资产合适;但外汇等更不透明的市场缺数据,无法在价格上随意签约。作者的出路是:一个有数据的第三方(平台或监管者)可以计算一个定价基准供签约用——于是模型转而对「基准设计」有了含义(呼应 Duffie & Dworczak, 2021 的稳健基准设计)。

Q:为什么不直接用 VWAP(成交量加权),那才是业内更常见的?

因为模型里没有市场成交量这个变量。作者用的是一个现成的价格冲击模型,但并没有一个同样「标准、现成」的模型来刻画成交量如何被决定。在本文框架内,TWAP 是 VWAP 最接近的类比。这是一个诚实的建模边界,而非疏忽。

Q:把交易商限定为「只中介、零净头寸」,会不会把最有意思的冲突排除掉了?

这是一个有意的取舍。\(\sum_t x_t=1\) 排除了非法抢跑和自营博弈,使模型聚焦于 FINRA 5270 明确允许的那一类行为——为履行客户订单而做的对冲——的时机冲突。好处是干净、贴合监管现实;代价是它确实关掉了双重交易那条更「黑」的冲突线。

(b) 几个可能的研究问题与提案

1)把这套合约搬到公司债大宗市场,做实证检验。

【经济故事】公司债大宗交易高度依赖交易商中介,且永久/临时冲击的分解在债券市场尤为重要。本文预测的 U 形合约能否在真实的 dealer–client 安排里找到影子?(关于谁来承接这些大单,可参见《谁来接住这一大笔债券?——公司债大宗交易里被遗忘的「接盘人」》。) 【可行性】中。TRACE 提供成交价与时间戳,可估计价格冲击的永久/临时分量;难点在于合约条款本身(结算基准)通常不公开,需要从机构披露或访谈中拼出。识别更偏「描述性 + 校准」,而非干净的因果。

2)多客户、单交易商:前置冲动会被相互抵消的订单稀释吗?

【经济故事】本文刻意只设一个客户。现实中交易商常同时接到方向相反的多笔订单,净敞口更小,前置的成本与动机都会变化。这会把 U 形压平还是扭曲? 【可行性】中。理论上可在本文框架里加入第二个客户,难度可控;实证上需要 dealer 层面的订单簿数据,较难获取。

3)把交易商的风险厌恶内生于资本约束。

【经济故事】本文把 \(\lambda\) 设为外生。但论文也提到,这份风险厌恶可能源于杠杆/保证金或股本约束(套利限度文献,Gromb & Vayanos, 2010)。若 \(\lambda\) 随监管资本要求变动,最优合约的 U 形会随宏观资本周期起伏吗?(做市商被「风险限额」捆住手脚的逻辑,可参见《无风险市场里的风险厌恶》。) 【可行性】中到低。理论扩展直接;要把它接到真实的资本约束数据上做识别则相当难。

4)基准设计的福利分析:当第三方为不透明市场「造」一个定价基准。

【经济故事】作者指出,外汇这类不透明市场可以由平台/监管者计算一个基准供签约。那么这个基准本身应该怎么设计,才能既抗操纵又贴近本文的最优 U 形?这和稳健基准设计(Duffie & Dworczak, 2021)直接对话。 【可行性】中。纯理论方向 doable;若想做实证,需要一个真实推出此类基准的自然实验。

我的判断

这篇论文的贡献在我看来非常清楚:它把价格冲击代理冲突这两条平行了几十年的文献焊到了一起,并且通过引入永久价格冲击这一步,让问题第一次变得「真正动态」——时间顺序有了实质含义,前置冲动有了来处,U 形有了根。更难得的是,它没有停在那个不现实的理论最优上,而是自觉退回到「与现行合约复杂度相当」的加权平均价类里,给出了一个可落地、可量化(省 9.8%–40.1%)、形状惊人干净的答案。对一篇 JFE 的理论文章来说,这种「理论漂亮 + 实务可用」的兼得并不常见。

但我也有两点保留。其一是对建模边界的依赖。 「临时冲击不影响最优合约」这个最抓眼球的结论,依赖连续时间极限下两股力的精确抵消;它干净,但也脆——离散时间里它就只是「削弱」。读者很容易把它过度解读。其二是从模型到现实的距离。 单客户、零净头寸、客户完全观测价格、CARA、线性冲击——每一条都让模型可解,但也都离真实的大宗交易台有一段路。尤其「客户能观测完整价格序列」对外汇这类最需要这套理论的市场恰恰不成立,作者把出路寄托在「第三方造基准」上,这本身就是一个未完成的子课题。

我接下来最想看到的,是有人拿真实的 dealer–client 合约条款(哪怕只是少数几家机构的披露)去对一对:现实里的结算基准,究竟离这条 U 形有多远?如果差得远,那 40.1% 的潜在节省就不只是一个理论数字,而是一笔实实在在、躺在桌上没人捡的钱。

参考文献