把「成交价」从「成交量」里解放出来——重新丈量公司债的流动性

[2022 JFE] Size-adapted Bond Liquidity Measures and Their Asset Pricing Implications

Jun He June 01, 2026

公司债流动性交易成本资产定价

Note

本文读的是 Reichenbacher & Schuster (2022, Journal of Financial Economics)：在 OTC 债券市场，交易成本强烈依赖于交易规模，而大多数债券又交易稀疏、单笔金额忽大忽小——于是「平均交易成本」的变化，往往记录的是「这次成交多大」，而不是「这只债有多好卖」。作者提出一个两步法，把全样本的「成本—规模」关系与单只债券的逐笔成交分开估计，得到一个与规模无关 (size-invariant) 的流动性度量。换个尺子，公司债流动性的时间序列、横截面、乃至它的资产定价含义，统统变了样。

1 一个被「成交量」悄悄污染的数字

先讲一个小故事，它就摆在论文的引言里，简单到几乎像个脑筋急转弯。

假设有一只公司债，今天成交了四笔。两笔是散户规模的小单，来回成本 (roundtrip cost) 各 150 个基点 (bps)；另两笔是机构的大单，来回成本只有 20 bps。把这四笔一平均，今天的「平均交易成本」是 85 bps。第二天，这只债只成交了两笔，都是散户小单，来回成本依然是 150 bps——于是「平均交易成本」跳到了 150 bps。

请问：从第一天到第二天，这只债的流动性变差了吗？

没有。小单的成本两天都是 150，大单的成本（如果有大单）也没动。这只债的流动性状况完全没变。但任何一个盯着「平均来回成本」的观察者，都会得出一个错误的结论：交易成本从 85 bps 暴涨到了 150 bps，流动性急剧恶化。

问题出在哪？出在平均这个动作上。它把「成本」和「规模」搅在了一起。第二天平均成本之所以高，不是因为债变难卖了，而仅仅是因为那天恰好没有大单来「拉低」平均值。

Warning

更糟的是那些常见的「补救」办法。剔除 $100,000 以下的小单？那第二天会被整个删掉，因为它只剩小单。用成交量加权 (volume-weighted) 的成本？在这个例子里反而雪上加霜——第一天加权成本被大单压得更低，第二天却纹丝不动，于是「上涨」的假象被放得更大。

这就是全文的张力所在。流动性是我们想测的东西，可我们手里的尺子，刻度会随着「这个月这只债碰巧成交了多大」而漂移。对单只债如此，对横截面比较、对时间序列、对危机时刻的判断，无一幸免。

2 为什么偏偏是美国公司债

接着，一个自然的问题是：这种「成交量污染」在哪里最致命？答案是美国公司债市场，理由有二。

第一，散户小单是绝对主力。 论文指出，约三分之二的成交都是 $100,000 以下的散户规模交易。这意味着，单笔成交的规模天然就在「散户—机构」两个量级之间反复横跳。

第二，绝大多数债券交易稀疏。 一只典型的公司债一个月可能只成交寥寥几次。样本越小，平均交易规模的随机波动就越大——今天碰上一笔大单，明天碰上两笔小单，平均成本就上蹿下跳，而这背后没有任何真实的流动性变化。

更要命的是，规模的漂移不只是「随机噪声」，有时是系统性的。论文举的例子是评级下调 (rating downgrade)：当一只债被打入垃圾级，受监管约束的机构投资者要集体抛售大额头寸，平均成交规模会系统性地放大。于是在这种「火线抛售 (fire sale)」前后，标准度量会被规模的系统性变化牵着鼻子走，产生方向性的偏误——恰恰是在我们最需要看清流动性的时刻，尺子坏了。

这里值得停一下。债券交易成本随规模递减，本身是个老知识（Stoll, 1978；Edwards et al., 2007；Feldhütter, 2012 都讲过）。但作者说，文献「知道」这件事，却在计算流动性度量时把它忽略了。他们要做的，是第一次把「成本—规模」关系直接焊进度量本身。

3 识别策略：把一件事拆成两步

现在到了真正关键的一步。作者的办法，本质上是一句话：让全市场去定义「成本—规模」的形状，让单只债去定义「自己在这条曲线上的高低」。

第一步，估一条全市场的成本函数。 在每个月 t，用样本里所有债、所有成交，非参数地估出一条 $c_t(vol)$——交易成本如何随成交（名义）规模 vol 变化。这条曲线是当月「市场平均流动性状态」的基准。为了让不同月份可比，把它归一化：

$$\hat{c}_t(vol) = \frac{c_t(vol)}{\overline{c}_t(vol)}$$

其中 $\overline{c}_t(vol)$ 是当月 $c_t(vol)$ 的成交量加权平均水平。归一化保证了一件事：跨期比较时，「代表性交易」的成本被锚定在 1。

这条曲线长什么样？见图 1。一个 $10,000 的散户头寸，平均来回成本约 1.5%；而一个 $5,000,000 的机构头寸，买卖价差 (bid-ask spread) 只有约 20 bps。文献把这种巨大差异归因于机构更强的议价能力、更低的搜寻成本，以及对债券公允价值更精确的判断（Green et al., 2007；Harris & Piwowar, 2006）。注意右尾那个微微的翘起——当规模大到极端时，交易商要承担更高的存货风险，成本反而回升。

Figure 1: Market-wide transaction cost functions of U.S. corporate bonds

第二步，给每只债估一个缩放因子。 有了 $\hat{c}_t(vol)$ 这条「形状」，单只债 i 在月 t 的流动性，就用一个缩放因子 (scaling factor) $sf_{i,t}$ 来刻画——它把这条全市场曲线整体上抬或下压，去最好地拟合这只债真实观察到的逐笔成本：

$$ tc_{k,i,t} = \cssId{a1}{sf_{i,t}} \cdot \cssId{a2}{\hat{c}_t(vol_{k,i,t})} + \cssId{a3}{\epsilon_{k,i,t}} $$

这里 $vol_{k,i,t}$ 是第 k 笔成交的规模。妙处在于：因为同一个月里所有债共用同一条 $\hat{c}_t(vol)$，不同债之间「碰巧成交了多大」的差异，被这条共同曲线吸收掉了，不再污染因子估计。这就是「与规模无关」的来源。

缩放因子怎么读？设想一个成交规模 $vol^*$，恰好让曲线取值等于当月成交量加权均值，那么 $\hat{c}_t(vol^*)=1$。于是 $sf_{i,t}$ 就可以直接解释为「一笔代表性规模交易的成本」——$sf = 0.005$ 意味着这只债代表性交易的买卖价差是 50 bps。一个数，干净利落地概括了这只债跨所有规模的流动性。

Tip

这套方法的「数据胃口」和标准度量一样小：只要有一笔成交，就能算。而且它顺手给了投资者一个红利——任意头寸规模的预期交易成本，直接用「个体缩放因子 × 全市场成本函数在该规模处的取值」就能算出来，无需挨个去问交易商报价。

4 把两个经典度量「改装」一遍

作者强调，这不是要发明又一个孤零零的新指标，而是一套可以嫁接到大量现有度量上的改装件。他们示范了两个最经典的。

其一，Schultz (2001) 度量。 它的原始模型是把逐笔的相对价格偏离 $y_{k,i,t}$ 对交易方向回归：

$$y_{k,i,t} = \alpha_{i,t} + c_{i,t}\cdot D_{k,i,t} + \epsilon_{k,i,t}$$

其中 $D_{k,i,t}$ 是交易方向指示：客户买入取 +1，客户卖出取 -1，交易商之间取 0；$c_{i,t}$ 近似这只债当月的平均半价差 (half-spread)。改装的做法，就是把那个「一刀切」的 $c_{i,t}$ 换成「缩放因子 × 全市场曲线」：

$$y_{k,i,t} = \alpha_{i,t} + sf^{Schultz}_{i,t}\cdot \hat{c}_t(vol_{k,i,t})\cdot D_{k,i,t} + \epsilon_{k,i,t}$$

其二，平均买卖价差 (average bid-ask spread) 度量（Hong & Warga, 2000；Chakravarty & Sarkar, 2003），即同一天买入价与卖出价的相对差：

$$AvgBidAsk_{i,d} = \frac{P^{buy}_{i,d} - P^{sell}_{i,d}}{0.5\cdot\left(P^{buy}_{i,d} + P^{sell}_{i,d}\right)}$$

它的改装稍微费点劲——因为买卖价差只在「每天」而非「每笔」上可得，得对当天进进出出的买单、卖单分别去评估全市场成本函数再做平均。技术细节作者用一个迭代的两阶段加权回归 (LOESS) 来实现，留给了网络附录。

为什么挑这两个？因为它们都用到了「成交方向」的信息，而且如 Schestag et al. (2016) 所示，债市里各种高频流动性度量彼此高度相关——示范这两个，方法的普适性就立住了。

5 换了尺子，世界变了样

那么，这把新尺子到底量出了什么不一样的东西？论文用了好几个应用来回答，我挑最有说服力的几个。

精度：少了 4%–18% 的测量误差。 作者做了一个 bootstrap 式的实验：拿那些交易频繁、本来能测得很准的债，故意丢掉一部分成交，看度量误差会变多大。结果是，两个 size-adapted 度量平均带来约 4% 到 18% 更低的测量误差。精度的提升来自三处：隐含的成交量加权让度量不再被散户成本主导；切断了「平均成交规模」与标准度量之间的机械关联；以及在成交极少时更稳健。

时间序列：危机里被系统性低估的恶化。 标准度量严重依赖散户小单成本，而危机里小单成本上升得反而比大单慢——于是标准度量会系统性地低估危机期的流动性恶化。作者把样本切成六段：危机前（2004.10–2007.6）、金融危机（2007.7–2009.4）、危机后、2010.7 起的监管期（Dodd-Frank）、2014.4 起的后 Volcker 期，以及 2020.3–6 的 COVID 冲击期。一个有意思的现象是：危机后散户成本因电子化交易而下降，大单成本却因更严的监管（Volcker 规则）而上升——两者反向移动，标准度量在这种时候彻底失灵，而 size-adapted 度量因为隐含加权，才看得清整体。

Figure 2: Time variation of transaction cost functions

横截面：谁才是流动性的真正决定因素。 在面板回归里，发行规模 (outstanding amount) 和年龄 (age) 这些「静态属性」对流动性的解释力，用 size-adapted 度量后大幅下降——因为它们本就与成交规模高度相关，标准度量是借着这层机械关联「虚高」了。反过来，剩余期限（作为利率风险代理）和信用评级，与流动性的关系在新度量下强得多。换句话说，标准度量经由它和成交规模的机械相关，会扭曲我们对「流动性横截面成因」的推断。

资产定价（其一）：收益率利差里被低估的流动性。 在一个借鉴 Friewald et al. (2012) 的面板设定里，作者把收益率利差的变化对逐笔交易成本的变化回归。能归因于交易成本的那部分调整后 $R^2$，从标准度量切换到 size-adapted 度量后翻了三倍多。这说明：用标准度量时，我们把「收益率里属于流动性的那一块」算少了。作为稳健性，删小单、简单成交量加权，表现都比未调整的标准度量还差——再次印证：小单里含着真金白银的流动性信息。

资产定价（其二）：流动性「水平」还是流动性「风险」被定价？ 这是我最喜欢的一个反转。文献长期争论：到底是债券流动性的水平 (level) 被定价（Amihud & Mendelson, 1986 的经典预测），还是流动性风险 (liquidity risk)——即对市场整体流动性冲击的暴露——被定价？Lin et al. (2011)、Dick-Nielsen et al. (2012)、Bai et al. (2019) 支持后者，而 Bongaerts et al. (2017) 干脆找不到显著的流动性风险溢价。

作者用更精确的 size-adapted 度量重做这件事，发现：流动性水平溢价在切换到新度量后增加了超过 50%；而流动性风险溢价反而略微变小。他们给的解释很漂亮：标准度量里的特异误差（idiosyncratic error）会相互抵消，而流动性水平又和流动性 beta 高度相关——于是本该归给「水平」的溢价，被误记到了「风险」头上。一旦尺子更准，水平这条腿就显形了。这与近年「流动性风险溢价证据脆弱」的怀疑是呼应的。

6 文献脉络

把镜头拉远，这篇论文坐落在一条相当清晰的演进线上。

最上游是市场微观结构的奠基：Stoll (1978) 用交易商提供「即时性」服务的供给来解释价差，Amihud & Mendelson (1986) 则把买卖价差正式写进资产定价——流动性差的资产，要用更高的预期收益来补偿。这是后面所有「流动性溢价」研究的母题。

接着，债市自己的度量工具开始成型。Hong & Warga (2000) 与 Schultz (2001) 给出了从交易数据估算公司债交易成本的经典方法——本文改装的正是这两个。再往后，TRACE 数据的开放催生了一波实证：Bao et al. (2011) 量出公司债的「非流动性」，Dick-Nielsen et al. (2012) 追踪了次贷危机前后的流动性变迁，Bessembinder et al. (2018) 用资本承诺刻画了危机后做市能力的萎缩（本文的子区间划分正是沿用了它的分界点）。

然后，一个总结性的工作出现了：Schestag et al. (2016) 系统比较了债市里各种流动性度量，并指出股市里好用的价格冲击类度量（如 Kyle 的 $\lambda$）在债市并不奏效——这恰恰给本文留下了空间：既然价格冲击不好用，那就把「规模依赖」直接缝进高频成本度量里。

于是本文落在这条线的末端：它不否定任何一个前人度量，而是给它们装上一个「与规模无关」的滤镜。关于「谁持有债券、谁来接盘如何决定其价格与流动性」这类更结构化的追问，可参见本博客《谁来接住这一大笔债券？——公司债大宗交易里被遗忘的「接盘人」》与《谁在持有这张债券，决定了它的价格》；而把机器学习用于公司债收益率预测的尝试，可参见《把机器学习的黑箱拆成玻璃箱：公司债收益率能被「看懂」地预测吗？》。

7 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：这和「成交量加权成本」到底差在哪？不都是在处理规模吗？

差别是根本性的。成交量加权仍然只用这只债自己的成交去算，碰上某天只有小单，加权成本照样虚高（开篇的例子里它甚至更糟）。本文用的是全样本估出的成本—规模曲线，单只债只贡献一个「整体上下平移」的缩放因子——它问的不是「这只债成交了多大」，而是「在同样规模下，这只债比全市场基准贵还是便宜」。

Q：用「全市场一条曲线」会不会太粗暴，抹掉了债与债之间形状的差异？

作者试过更灵活的设定（比如让大单成本相对小单可以变动更陡，借鉴 Anderson & Stulz, 2017），结论是复杂度只换来非常有限的精度提升。直觉上，「成本—规模」的形状在横截面上相当稳定，真正区分债券的是水平而非形状——这正是缩放因子要抓的东西。

Q：缩放因子那个回归 (2) 是不是有联立性问题？曲线要靠缩放因子，缩放因子又要靠曲线。

是的，严格说要同时优化曲线 $\hat{c}_t(\cdot)$ 和所有缩放因子。作者用一个迭代的两阶段加权回归绕开联立：先固定上一轮的缩放因子估曲线（LOESS），再固定曲线逐债估缩放因子，反复迭代直到归一化缩放因子的平均绝对变化低于 1e-6。这是工程上的近似，不是封闭解，但收敛性在实践中没问题。

Q：「水平溢价涨 50%、风险溢价反而缩小」会不会只是换了个度量后的机械结果？

这正是要警惕的地方。作者的论证是：更准的度量降低了特异测量误差，而测量误差在标准度量里会经由「水平与 beta 的高相关」把溢价错误地灌到风险那条腿上。这个解释自洽且与 Bongaerts et al. (2017)「找不到风险溢价」相容，但严格说它仍是一个度量改进下的再归因，而非一个独立的因果实验——把它当作「证据天平进一步偏向水平」比当作「定论」更稳妥。

Q：评级下调当「自然实验」，干净吗？

下调到垃圾级触发受监管机构的强制抛售，确实带来平均成交规模的外生上升，这一点机制清楚。但下调本身也伴随信用基本面恶化、价格下跌、波动上升——这些会同时影响真实流动性。作者的主张是「标准度量在此处有系统性偏误、新度量能看清恶化」，这个相对比较是可信的；但要把「流动性恶化幅度」精确归因，仍需小心其他同时发生的冲击。

Q：方法依赖逐笔成交方向（买/卖/商间），对那些连方向都难判的极稀疏债券还成立吗？

这是适用边界。两个示范度量都吃「交易方向」信息，Schultz 度量至少要两笔方向不同的成交加上共识价，平均买卖价差度量要同一天有买有卖。对一个月只成交一两次、且全是同向的债，方法和标准度量一样会受限——它改善的是「有信息但被规模污染」的情形，而非「根本没信息」的情形。

(b) 几个可能的研究问题与提案

1. 把 size-adapted 度量搬到「外资持有人」与流动性的关系上。 【经济故事】外资机构（尤其受本国监管约束者）在压力期的抛售，往往是大额、同向、集中的——这正是标准度量被「平均成交规模」系统性污染最严重的场景。用 size-adapted 度量重测「外资持有比例 → 债券流动性」，很可能修正现有文献里被规模混淆的结论。【可行性】中。需要 Enhanced TRACE（成本）叠加 eMAXX/Lipper 之类的持有人面板（外资份额），识别上可借「指数纳入」或「本国监管冲击」做外生变化。数据可得，难点在持有人国别的精确匹配。

2. COVID 冲击期的「水平 vs. 风险」再检验。 【经济故事】2020 年 3 月公司债流动性骤变（O'Hara & Zhou, 2021），是检验「水平溢价」稳健性的天然窗口。本文样本止于 2020.6，正好覆盖冲击但来不及看清横截面定价后果。【可行性】高。数据现成（Enhanced TRACE 已延伸），方法本文已开源（含 SAS 代码与逐月成本函数）。直接把样本延长、在冲击前后做横截面收益—流动性回归即可，doable。

3. 把「规模依赖」缝进价格冲击类度量，而不只是价差类度量。 【经济故事】Schestag et al. (2016) 说价格冲击度量在债市不好用，本文示范的是价差类（Schultz、bid-ask）。一个自然的问题是：能否用同样的「全市场曲线 + 个体缩放因子」框架，去救活 Amihud 式或 Kyle 式的冲击度量？【可行性】中。逐笔数据足够，难点是冲击度量本身在稀疏债券上信噪比低，缩放因子估计可能不稳——需要先论证识别条件，属于「值得一试但不保证成功」。

4. 用缩放因子做「任意规模成本预测」的交易级验证。 【经济故事】本文最实用的副产品，是「个体缩放因子 × 全市场曲线」能预测任意头寸的成本。这是个可被样本外检验的预测命题。【可行性】高。用 Diebold-Mariano / Harvey 等（本文参考了 Harvey et al., 1997；Diebold & Mariano, 1995）的预测精度检验，比较它与标准度量、与逐债历史均值的样本外误差，直接、干净、可发表为方法学贡献。

8 参考文献与我的判断

我的看法是：这篇论文的贡献朴素但扎实。它没有提出花哨的新模型，只是指出了一个被整条文献「知道却忽略」的污染源，并给出一个数据胃口极小、可嫁接、还顺手能算任意规模成本的修正件。最让我信服的是它的一致性——同一个改装，在精度、时间序列、横截面、收益率利差、资产定价五个互不相干的应用上都给出方向一致的改善，这不像是过拟合出来的巧合。

对识别，我有两点保留。其一，「水平溢价涨 50%、风险溢价缩小」终究是度量改进下的再归因，逻辑自洽，但缺一个独立于度量选择的因果杠杆；它把天平推向「水平」，却没给争论画上句号。其二，评级下调实验里，强制抛售带来的规模外生上升是干净的，但它与信用恶化、价格下跌同时发生，「流动性恶化幅度」的精确度量仍受其他冲击干扰。

后续我最想看到两件事：一是把这把尺子接到外资持有人与危机期定价上（见上文提案 1、2），看那些被怀疑「脆弱」的流动性风险溢价证据，在更准的度量下还剩几分；二是一个严肃的样本外成本预测比赛，把「缩放因子 × 全市场曲线」当成一个可证伪的预测器来检验——那将把它从「一个更好的度量」升格为「一个更好的工具」。

参考文献

Amihud, Y., Mendelson, H. (1986). Asset pricing and the bid-ask spread. Journal of Financial Economics 17, 223–249.
Bai, J., Bali, T.G., Wen, Q. (2019). Common risk factors in the cross-section of corporate bond returns. Journal of Financial Economics 131, 619–642.
Bao, J., Pan, J., Wang, J. (2011). The illiquidity of corporate bonds. Journal of Finance 66, 911–946.
Bao, J., O'Hara, M., Zhou, X.A. (2018). The Volcker Rule and corporate bond market making in times of stress. Journal of Financial Economics 130, 95–113.
Bessembinder, H., Jacobsen, S., Maxwell, W., Venkataraman, K. (2018). Capital commitment and illiquidity in corporate bonds. Journal of Finance 73(4), 1615–1661.
Bongaerts, D., de Jong, F., Driessen, J. (2017). An asset pricing approach to liquidity effects in corporate bond markets. Review of Financial Studies 30, 1229–1269.
Chakravarty, S., Sarkar, A. (2003). Trading costs in three US bond markets. Journal of Fixed Income 13, 39–48.
Dick-Nielsen, J., Feldhütter, P., Lando, D. (2012). Corporate bond liquidity before and after the onset of the subprime crisis. Journal of Financial Economics 103, 471–492.
Goyenko, R.Y., Holden, C.W., Trzcinka, C.A. (2009). Do liquidity measures measure liquidity? Journal of Financial Economics 92, 153–181.
Hong, G., Warga, A. (2000). An empirical study of bond market transactions. Financial Analysts Journal 56, 32–46.
Lin, H., Wang, J., Wu, C. (2011). Liquidity risk and the cross-section of expected corporate bond returns. Journal of Financial Economics 99, 628–650.
O'Hara, M., Zhou, X.A. (2021). Anatomy of a liquidity crisis: corporate bonds in the COVID-19 crisis. Journal of Financial Economics 142(1), 46–68.
Schestag, R., Schuster, P., Uhrig-Homburg, M. (2016). Measuring liquidity in bond markets. Review of Financial Studies 29, 1170–1219.
Schultz, P. (2001). Corporate bond trading costs: a peek behind the curtain. Journal of Finance 56, 677–698.
Stoll, H.R. (1978). The supply of dealer services in securities markets. Journal of Finance 33, 1133–1151.