价格慢半拍的那 0.02%：一把丈量「市场摩擦」的尺子

[2005 RFS] Market Frictions, Price Delay, and the Cross-Section of Expected Returns

Jun He June 01, 2026

资产定价市场摩擦投资者认知流动性

Note

本文读的是 Hou & Moskowitz (2005, Review of Financial Studies)：他们用「股价对信息反应的平均延迟」(price delay) 这一个数，简洁地刻画了一只股票所承受的市场摩擦严重程度。结论令人意外——延迟最严重的那批公司只占全市场市值的 0.02%，却背负着高达 每年 12% 的收益溢价；而把这块溢价撑起来的，不是传统意义上的流动性，而是 Merton (1987) 所说的「投资者认知」(investor recognition)。

1 一个绕不开的麻烦：摩擦到底有多大？

传统资产定价理论有一组很干净的假设：市场无摩擦、信息完全、投资者充分分散。可任何一个看过真实交易数据的人都知道，这些假设错得离谱——交易有成本，信息有死角，还有一大批散户根本没有分散持仓。

于是过去几十年里，研究者们一头扎进各种「摩擦」里：不完全信息 [Merton (1987)]、信息不对称 [Easley, Hvidkjaer, and O'Hara (2002)]、卖空约束 [Miller (1977)]、税收 [Constantinides (1984)]、流动性 [Amihud and Mendelson (1986)]、噪声交易者风险 [De Long et al. (1990)]……名单可以一直列下去。

但问题恰恰出在这张名单太长了。每一种摩擦都有自己的代理变量、自己的度量方式、自己的一套故事。一只股票同时被五六种摩擦缠住，你到底该用哪个数去刻画它「受摩擦折磨的程度」？这就是 Hou 和 Moskowitz 面对的张力：他们想要一个简洁(parsimonious)的、能把各种摩擦的净效果一网打尽的单一度量。

他们的答案出奇地朴素——看股价反应有多慢。

2 核心直觉：摩擦越重，价格越「慢半拍」

逻辑链条其实很短。一只没有任何摩擦的股票，市场上一有新消息，它的价格当周就调整到位；而一只被各种摩擦缠身的股票——没人盯它、买卖它要付高昂成本、信息要绕很久才传到——它的价格会拖泥带水地、分好几周才把消息消化完。

所以，价格反应的延迟，本身就是一切摩擦在价格过程上留下的「合成指纹」。你不需要分别去量信息成本、交易成本、认知程度，你只要量价格反应得有多慢，就一并把它们都捕捉了。这个想法与 Merton (1987) 的不完全信息模型、Arbel 系列的「被忽视公司」(neglected firms) 假说、以及 Hong and Stein (1999) 的渐进信息扩散模型一脉相承。

那怎么把「慢」变成一个可计算的数？

3 识别策略：用「滞后市场收益」量出延迟

这是全文的技术核心，值得一步步讲清楚。

每年 6 月底，作者对每只股票 j 跑一个回归：把它过去一年的周收益率，回归到当周以及前四周的市场组合收益上：

$$r_{j,t} = \alpha_j + \beta_j R_{m,t} + \sum_{n=1}^{4} \delta_j^{(-n)} R_{m,t-n} + \epsilon_{j,t}$$

这里 $r_{j,t}$ 是股票 j 在第 t 周的收益，$R_{m,t}$ 是 CRSP 市值加权市场指数的收益。直觉非常清楚：如果股价对市场消息反应及时，那么只有当期的 $\beta_j$ 显著，四个滞后项 $\delta_j^{(-n)}$ 应该全是零；反之，如果股价反应有延迟，那么一些 $\delta_j^{(-n)}$ 会显著不为零——也就是说，上周的市场消息要到这周才在它身上体现。

Tip

为什么用周频而不是日频或月频？月频下大多数股票都能在一个月内反应完，几乎没有区分度；日频虽然更精细，却会引入买卖价差跳动 (bid-ask bounce)、非同步交易这些微观结构噪声。周频是个折中。而且作者特意取「周三到下周三」收盘价计周收益，以避开 Friday-to-Friday 的高自相关和 Monday-to-Monday 的低自相关问题。

有了回归系数，作者构造了三个延迟度量。最主要的是 $D1$，它衡量「被滞后市场收益解释掉的那部分变动占比」——即把所有滞后项约束为零后 $R^2$ 的损失：

$$D1 = 1 - \frac{R^2_{\delta^{(-n)}=0,\ \forall n\in[1,4]}}{R^2}$$

这个数越大，说明越多的收益变动是被「上几周的市场消息」解释的，延迟也就越严重。它本质上是一个关于滞后项联合显著性的 F 检验，再用当期解释力做缩放。

由于 $D1$ 不区分滞后的长短、也不管系数的估计精度，作者又补了两个度量。$D2$ 用滞后阶数 n 给各滞后系数加权（越靠后的滞后，说明延迟越久，权重越大）：

$$D2 = \frac{\sum_{n=1}^{4} n\,\delta^{(-n)}}{\beta + \sum_{n=1}^{4}\delta^{(-n)}}$$

$D3$ 则进一步用 t 值（系数除以其标准误）替换系数本身，把估计精度也纳进来：

$$D3 = \frac{\sum_{n=1}^{4} n\,\delta^{(-n)}/se(\delta^{(-n)})}{\big(\beta/se(\beta)\big) + \sum_{n=1}^{4}\delta^{(-n)}/se(\delta^{(-n)})}$$

这些度量的雏形来自 Brennan, Jegadeesh, and Swaminathan (1993) 和 Mech (1993)，他们用类似的构造去刻画股票之间的领先—滞后关系。作者还做了一堆稳健性：加入领先项、用更高阶滞后、用绝对值系数，结果几乎不变——比如 $D1$ 与「加入领先项后的 $D1$」的横截面秩相关高达 0.90。

Warning

这里有个绕不过去的技术坑：周度个股回归的系数估得很不准（误差变量问题）。作者的处理是「两阶段组合延迟」(second-stage portfolio delay)——先按市值分十组，组内再按个股延迟分十组，得到 100 个 size-delay 组合，对组合重估回归(1)，再把组合的延迟值赋回组内每只股票。这相当于把个股延迟向「同规模、同延迟档」的均值收缩，大幅降低了估计噪声。但代价是：这个两阶段做法可能人为抬高规模与延迟的相关性——这一点后面会成为识别上的隐忧。

那么，被这把尺子量出来「最慢」的，是些什么公司？

4 数据与「延迟公司」的画像

样本是 1963 年 7 月到 2001 年 12 月 CRSP 上 share code 为 10/11 的全部普通股（1973 年起纳入 NASDAQ），需要 COMPUSTAT 的账面价值时按 Fama and French (1993) 定义。交易策略收益从 1964 年 7 月起算。

把股票按 $D1$ 分成十组后，画像一目了然（见表 1，正文 Table 1）。从第 1 组到第 10 组：

延迟 $D1$：0.002 → 0.341，且第 9 组到第 10 组的跳升最为剧烈；
市值：$18,444M → $6M——延迟最高那组公司的平均市值只有 600 万美元（1964–2001 名义美元）；
账面市值比 BE/ME：0.635 → 1.375（越延迟越「价值」）；
机构持股比例：52.7% → 6.3%；
分析师人数：22.4 → 1.3；
月成交额：从近 9 亿美元级别一路掉到 $370,000；
平均股价：$126.87 → $4.89。

换句话说，延迟最严重的公司，就是那些又小、又「价值」、波动大、近期表现差、几乎没人盯、几乎没人持有的票。作者还核对了系数本身：$D1$ 在 90 分位以上的股票，当期 $\beta$ 只有 0.77，但滞后系数高达 0.17、0.035、0.025；而 90 分位以下的股票当期 $\beta$ 为 1.02，滞后系数仅 0.04、0.006、0.008。延迟公司确实「反应慢」，这把尺子量准了。

记住这幅画像很关键——因为这些特征（小、价值、近期输家）每一个本身都和收益相关。下一步检验收益时，必须把它们都控制住。

5 反转：0.02% 的市场，撑起 12% 的溢价

现在到了全文最有张力的一步。延迟公司既然这么小、这么没人要，按市值加权，延迟最高的第 10 组只占整个市场市值的不到 0.02%——小到几乎可以忽略不计。

可偏偏就是这薄薄一片，扛着巨大的横截面收益差异。在控制了市场、规模、账面市值比、动量(Carhart 四因子)，又控制了 Amihud (2002) 价格冲击、Chordia, Subrahmanyam, and Anshuman (2001) 的交易活跃度等微观结构与传统流动性变量之后，延迟公司依然带着高达每年 12% 的收益溢价。这个溢价在样本的前后两半、在 1 月份、在各种设定与子样本下都稳健。

Table 2: reports the average returns of portfolios sorted on various delay

更妙的是，延迟还吞掉了「规模效应」的一部分——也就是说，小公司之所以收益更高，部分原因可能正是它们反应慢、不被注意。作者还顺手报告了几个相关发现：特质风险(idiosyncratic risk)只在延迟最高的公司里被定价；成交量溢价也主要集中在延迟股里；盈余公告后漂移 (post-earnings announcement drift) 随延迟单调递增，在非延迟公司里几乎不存在；价值溢价在延迟股里更强——但有意思的是，延迟公司并不表现出中期价格动量。

这一连串结果都指向同一个判断：这一小撮被市场遗忘的角落，是各种异象真正的「藏身之处」。（这种「一个看似全局的溢价其实只活在极小一块市场角落」的味道，和《显著性异象的「微缩」真相》讲的故事如出一辙。）

6 真正关键的一步：是流动性，还是「没人认识你」？

到这里，一个自然的问题是：延迟溢价到底是什么的补偿？最顺手的答案当然是「流动性」——延迟公司不好交易，溢价是流动性补偿。但作者偏要把这个最顺手的答案按住，做一次正面较量。

他们一边放上传统流动性代理：成交量、换手率、价格、交易天数、买卖价差，以及 Amihud (2002) 的价格冲击和交易成本度量；另一边放上投资者认知代理：分析师覆盖、机构持股、股东人数、员工人数、广告支出，乃至「偏远程度」（到机场的平均机票价格与距离）。

结果是一边倒的：

传统流动性代理既不能吸收延迟效应，也不能在有延迟在场时捕捉显著的横截面收益预测力；延迟溢价与 Pastor and Stambaugh (2003) 的总量流动性风险因子之间也几乎没有关系。
反过来，投资者认知代理却能解释掉延迟的预测力，即便在控制一大批流动性与规模变量之后依然如此。

于是作者的解读是：延迟溢价关乎公司是否被认知、是否被忽视，而非传统流动性。Merton (1987) 的逻辑在这里特别贴切——当一家公司被市场的大部分人忽略、与市场其余部分相隔离时，残差波动率（而非与市场的协方差）才是更恰当的风险度量，因为风险没有被有效地分摊出去。这恰好解释了「为什么特质风险偏偏只在延迟最高的公司里被定价」。

而信息不对称与情绪风险这两条线，作者都找不到支持：延迟溢价与 Easley, Hvidkjaer, and O'Hara (2002) 的知情交易风险度量没有关系；与高成长、动量股也关系甚微，因此也不像是 Barberis, Shleifer, and Vishny (1998) 意义上的噪声交易者风险。

最后还有一记诚实的回马枪：既然延迟溢价恰恰盘踞在小、不流动、价值、近期输家、低机构持股、高特质风险的股票里，那么想真正套出这块收益，难度极大。正如 Merton (1987) 与 Shleifer and Vishny (1997) 所言，正是这些「套利的障碍」让这类现象得以在市场中长期存在。换句话说：溢价是真的，但它是「看得见、吃不到」的那种。

7 文献脉络

这条研究线大致是这样长出来的。早期有两股力量并行：一是 Arbel and Strebel (1982)、Arbel, Carvell, and Strebel (1983) 提出的「被忽视公司」与小公司效应——制度性力量和交易成本会让不显眼的、被分割的公司延迟吸收信息；二是 Amihud and Mendelson (1986) 开创的流动性与买卖价差定价。理论上，Merton (1987) 给出了那个影响深远的不完全信息/投资者认知模型，奠定了「被谁认识」会进入定价的逻辑基础。

方法上的关键铺垫来自 Brennan, Jegadeesh, and Swaminathan (1993) 与 Mech (1993)，他们用滞后回归刻画股票间的领先—滞后关系；Hong and Stein (1999) 则给出渐进信息扩散的统一理论，Hong, Lim, and Stein (2000) 进一步用「分析师覆盖低 → 坏消息传得慢」解释动量。Amihud (2002) 又把价格冲击度量推到了前台。

本文 (Hou and Moskowitz, 2005) 站在这些工作的交汇处：它不去单独度量某一种摩擦，而是用价格延迟这一个数把它们的净效果打包，再用一场流动性 vs. 投资者认知的「对质」，把延迟溢价的来源钉在了「认知/忽视」上。（作者之一 Hou 同期的 Hou (2005) 把同样的延迟思想用到了行业层面的信息扩散，见《大公司先动，小公司后知》。）

8 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：「价格延迟」和「不流动」到底有什么区别？两者听上去几乎是一回事。

度量上确实高度相关——表 1 里 Amihud 不流动性与延迟的秩相关高达 0.96。但作者的关键论证是「条件性」的：在同时放入两类代理做横截面竞赛时，传统流动性度量吸收不了延迟，反而是认知类变量(分析师、机构、股东人数)能吸收延迟。作者自己也承认一种折中解读：延迟或许识别出了「流动性中真正被定价的那一部分」，而这部分恰好与投资者认知有关。两种解读对横截面预测力的含义是一致的。

Q：那个「两阶段组合延迟」会不会是在自己制造结果？它人为抬高了规模和延迟的相关。

这是最值得警惕的一点，作者也意识到了。为此他们补做了「一阶段个股延迟 + 对规模正交化」，并用最多五年的周数据、以及日频数据来提高个股延迟的估计精度。结论是：个股延迟产生的结果比组合延迟更弱但同向。所以核心结论不依赖两阶段做法，只是组合法更干净、信噪比更高。

Q：既然延迟公司这么小、占市值不到 0.02%，这个「12% 溢价」是不是只是小盘股流动性噪声，没什么经济意义？

恰恰相反，作者想强调的正是「小而重要」。市值占比微不足道，却贡献了大量横截面收益变异，这本身就说明摩擦在边际上极其重要。当然这也带来一个诚实的限制：等权重下效应才最强，真要交易这批又小又不流动的票，成本会吃掉大部分账面溢价。

Q：为什么延迟公司有价值溢价、有盈余漂移，却偏偏没有动量？

这是个反直觉但很有意思的事实。如果延迟纯粹是「坏消息传得慢」(Hong-Lim-Stein 式动量)，那延迟股本该动量很强。作者发现延迟股没有中期动量，反而削弱了「延迟=噪声交易者情绪」的解释——因为近期理论把情绪与成长、动量联系在一起。这把延迟更往「认知/忽视」而非「行为性反应不足」的方向推。

Q：用市场收益当「信息」，会不会漏掉公司层面的特质信息延迟？

会，但这是有意的取舍。作者只用对市场收益的滞后反应，是为了避免个股自身收益滞后带来的解释难题——Lo and MacKinlay (1990) 指出，由于强烈的序列交叉相关，组合收益正自相关而个股收益负自相关。只看对市场的反应，让延迟度量的解释干净得多。代价是它度量的是「系统性信息」的延迟，而非全部信息。

Q：1 月效应、规模效应这些老对手，会不会把延迟溢价解释掉？

作者专门检验了 1 月份与前后两半子样本，延迟溢价依然稳健；而且方向是延迟吞掉了部分规模效应，而非被规模吞掉。这意味着延迟在某种意义上比规模更「根本」——小公司高收益的一部分，可以被「它们反应慢」重新表述。

(b) 几个可能的研究问题与提案

1. 把「价格延迟」搬到公司债市场。 【经济故事】股票里延迟溢价由「投资者认知」驱动；公司债的投资者结构更集中、交易更稀疏、被覆盖程度差异更大，认知摩擦理应更突出。一只很少被交易、很少被卖方覆盖的债券，其价格对系统性信用消息（如信用利差指数、国债收益）的反应可能严重滞后。【可行性】中。可用 TRACE 成交数据构造债券层面的延迟度量（对信用因子收益的滞后反应），难点在于债券交易稀疏导致回归噪声极大，需要像本文那样做组合层面收缩。识别上可借鉴本文的认知 vs. 流动性对质（评级覆盖、做市商数量 vs. 价差、Amihud）。

2. 外资持有人是「加速器」还是「减速器」？ 【经济故事】外资进入往往伴随分析师覆盖上升、信息环境改善，按本文逻辑应当降低价格延迟、压缩延迟溢价；但外资也可能信息劣势、反应更慢。用「可投资度」开放作为冲击，可以检验外资究竟让价格反应变快还是变慢。【可行性】高。已有大量国别层面的「可投资度」(investability) 自然实验数据，配合本文的延迟度量即可做事件研究/DiD。这与《外资来了，全球新闻就传得更快吗？》是直接的对话对象。

3. 延迟溢价是否随「被动投资份额」上升而衰减？ 【经济故事】本文的认知机制依赖「有多少人真正在盯这只股票」。过去二十年指数化和被动持有大幅扩张，理论上提升了边缘公司的「被持有」广度，可能侵蚀延迟溢价；但被动资金「不研究、只持有」，也可能让信息反应更慢。两种力量方向相反。【可行性】中。需要长样本的被动持股份额数据（且口径有争议，可参见《被动投资份额其实是你以为的两倍》），用延迟度量做时间序列上的溢价衰减检验。识别偏弱，更适合做描述性证据 + 横截面异质性。

4. 用文本/另类数据直接度量「投资者认知」。 【经济故事】本文的认知代理（分析师、机构、广告、机票距离）都是间接的。如今可以用新闻提及频率、社交媒体关注、零售下单覆盖度等直接度量「有多少人在看这家公司」，从而把「认知 → 延迟 → 溢价」这条链条的中间环节钉得更死。【可行性】高。新闻与社媒数据已较易获得；可做中介分析：认知度量是否解释了延迟，延迟是否仍解释收益。诚实地说，因果识别仍是难点（认知与延迟可能同时被某个遗漏因素驱动），更适合作为机制证据而非因果声明。

9 参考文献与我的判断

我认为这篇文章最大的贡献是方法论上的简洁：它没有再往本就臃肿的「摩擦动物园」里添一个新变量，而是用一个可计算的、对市场收益滞后反应的回归，把所有摩擦的净效果压缩成一个数，然后用一场设计巧妙的「流动性 vs. 认知」对质，给这块溢价找到了一个可信的经济来源。「0.02% 的市值 / 12% 的溢价」这组对比，本身就是对「摩擦在边际上极其重要」最有力的修辞。

我对识别的主要担忧有两点。其一是两阶段组合延迟与规模的纠缠——作者用一阶段正交化做了缓解，但既然延迟与规模、不流动性的相关都在 0.9 以上，「延迟吞掉了规模效应」与「规模换了个名字叫延迟」在统计上很难被彻底区分，结论更多是「重新表述」而非「证伪」。其二是认知代理的内生性：分析师覆盖、机构持股本身就是公司特征的均衡结果，「认知解释延迟」可能部分是同源变量的共线，而非真正的机制识别。

后续我最想看到的，是把这套延迟度量放到一个有外生认知冲击的环境里去检验——比如交易所上市/退市、指数纳入、可投资度开放、某券商研究部门关闭——看延迟与其溢价是否随「被看见的程度」而真实地、因果地移动。那将把本文从一个漂亮的横截面相关性，推向一个干净的因果故事。

参考文献

Amihud, Y. (2002). Illiquidity and Stock Returns: Cross-Section and Time Series Effects. Journal of Financial Markets 5, 31–56.
Amihud, Y., and H. Mendelson (1986). Asset Pricing and the Bid-Ask Spread. Journal of Financial Economics 17, 223–249.
Arbel, A., and P. Strebel (1982). The Neglected and Small Firm Effects. Financial Review 17, 201–218.
Barberis, N., A. Shleifer, and R. W. Vishny (1998). A Model of Investor Sentiment. Journal of Financial Economics 49, 307–343.
Brennan, M. J., N. Jegadeesh, and B. Swaminathan (1993). Investment Analysis and the Adjustment of Stock Prices to Common Information. Review of Financial Studies 6, 799–824.
Chordia, T., A. Subrahmanyam, and V. Anshuman (2001). Trading Activity and Expected Stock Returns. Journal of Financial Economics 59, 3–32.
Easley, D., S. Hvidkjaer, and M. O'Hara (2002). Is Information Risk a Determinant of Asset Returns? Journal of Finance 57, 2185–2221.
Fama, E. F., and K. R. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics 33, 3–56.
Hong, H., T. Lim, and J. C. Stein (2000). Bad News Travels Slowly: Size, Analyst Coverage, and the Profitability of Momentum Strategies. Journal of Finance 55, 265–296.
Hong, H., and J. C. Stein (1999). A Unified Theory of Underreaction, Momentum Trading and Overreaction in Asset Markets. Journal of Finance 54, 2143–2184.
Hou, K. (2005). Industry Information Diffusion and the Lead-Lag Effect in Stock Returns. Working paper, Ohio State University.
Hou, K., and T. J. Moskowitz (2005). Market Frictions, Price Delay, and the Cross-Section of Expected Returns. Review of Financial Studies 18(3), 981–1020.
Mech, T. S. (1993). Portfolio Return Autocorrelation. Journal of Financial Economics 34, 307–344.
Merton, R. C. (1987). A Simple Model of Capital Market Equilibrium with Incomplete Information. Journal of Finance 42, 483–510.
Pastor, L., and R. Stambaugh (2003). Liquidity Risk and Expected Stock Returns. Journal of Political Economy 111, 642–685.
Shleifer, A., and R. W. Vishny (1997). The Limits of Arbitrage. Journal of Finance 52, 35–55.