为什么「理性投资者」也会拒绝换股？——把需求弹性拆成两半

[2025 JFE] Why Do Portfolio Choice Models Predict Inelastic Demand?

Jun He May 31, 2026

资产定价需求弹性投资组合选择弱因子

Note

本文读的是 Davis, Kargar & Li (2025, JFE)：经典资产定价模型预测股票的需求弹性高达「几千」，可经验估计只有「大约 1」，整整差了三个数量级。作者把需求弹性拆成「价格传递 (price pass-through)」和「非张成收益 (unspanned return)」两块，证明只要把这两块换成真实数据估出来的值，理论预测就会从约 7000 一路跌到约 5——绝大部分缺口，根本不需要摩擦或行为偏差来解释。

1 一个差了三个数量级的谜题

先讲一件让资产定价学者寝食难安的事。

如果你打开一个标准的资产定价模型——CAPM 也好，Fama–French 也好——问它：「假如某只股票的供给突然多出 1%，价格会跌多少？」模型几乎会异口同声地回答：几乎不跌。Gabaix and Koijen (2022) 算过，经典模型里一只股票的需求弹性大约在 5000 量级，这意味着 1% 的供给冲击只会引起约 0.02 个基点（也就是 1%/5000）的价格变动，约等于零。换句话说，在理论世界里，每只股票的需求曲线都近乎水平：你想卖多少都行，价格纹丝不动，因为总有无数完美的「替身」等着接盘。

可现实呢？指数纳入、共同基金的申赎、被动资金的流动……一次又一次的经验研究告诉我们，资金流确实能把价格推得很高。Koijen and Yogo (2019) 用需求体系 (demand system) 估出来的弹性，大约只有 1 的量级。粗略地说，1% 的供给冲击对应着约 1% 的价格冲击——比理论预测大了整整三个数量级。

Warning

这不是「估得不太准」的那种小分歧，而是「差了一千倍」的鸿沟。任何号称要刻画真实市场的模型，都绕不开它。

于是一个很自然的解释浮出水面：是不是现实里有太多摩擦？投资者有业绩基准的牵绊、有杠杆约束、有交易成本，还有种种行为偏差——这些都会压低需求弹性（Gromb and Vayanos, 2010; Haddad et al., 2025）。这条路当然走得通。但 Davis, Kargar and Li 这篇文章偏要反其道而行：他们想看看，在一个完全没有这些摩擦、投资者绝对理性的「干净」世界里，需求弹性到底能不能自己掉下来。

答案是：能。而且掉得很彻底。

2 香蕉和股票，是两种完全不同的需求

要理解作者的思路，得先想清楚一件容易被忽略的事：对资产的需求，和对香蕉的需求，根本不是一回事。

你对香蕉的需求弹性，直接由你对香蕉的「偏好」决定——你就是喜欢吃香蕉，价格涨了就少买点。可投资者对一只股票并没有这种「原生偏好」。没人真的「喜欢」苹果公司的股票本身，人们要的是它未来带来的收益，最终是为了消费和财富。所以，当价格变动时，一个理性投资者要不要调仓，关键不在于他多爱这只股票，而在于价格的变动，改变了他对未来收益的判断有多少。

这个区别听起来像哲学，其实是全文的命门。它意味着需求弹性这个东西，本质上不取决于偏好参数，而取决于股票收益的统计性质——而这些性质，是可以从数据里估出来的。

接着，一个自然的问题是：到底是收益的哪些性质，决定了需求弹性？

3 把需求弹性拆成两半

作者的第一步，是给需求弹性下一个干净的定义。投资者在 $t$ 时刻持有资产 $i$ 共 $Q_{i,t}$ 股，需求弹性 $\eta_{i,t}$ 就是持股数对价格的（负）对数导数：

$$\eta_{i,t} \equiv -\frac{\partial \log(Q_{i,t})}{\partial \log(P_{i,t})}$$

弹性等于 4，就是说一只股票（因非基本面原因）价格跌 1%，投资者就想把持股增加 4%。

接下来是一个看似平凡、却暗藏玄机的代数。注意持股数 $Q_{i,t}=A_t w_{i,t}/P_{i,t}$，其中 $A_t$ 是管理的总资产，$w_{i,t}$ 是组合权重。把它代进去，并假设财富 $A_t$ 外生（即忽略财富效应，这正是 Koijen and Yogo (2019) 的做法）：

$$\eta_{i,t} = -\frac{\partial \log(A_t w_{i,t}/P_{i,t})}{\partial \log(P_{i,t})} = 1 - \frac{\partial \log(w_{i,t})}{\partial \log(P_{i,t})}$$

请盯住这个 1。它来自分母里的 $P_{i,t}$：哪怕一个完全被动、一股都不买卖的持有者，价格跌 1% 也会让这只股票在他组合里的市值占比下降——从「持股数」的角度看，他「显得」需要买回来才能维持。这是一个纯机械的项。真正有意思的，是后面那个 $\partial \log(w_{i,t})/\partial \log(P_{i,t})$：一个主动优化的投资者，会因为价格变了而调整他想持有的权重。

然后是最关键的一步——用链式法则，把权重对价格的反应，拆成「权重对预期收益的反应」乘以「预期收益对价格的反应」：

$$\eta_{i,t} \approx 1 + \underbrace{\frac{\partial \log(w_{i,t})}{\partial \mu_{i,t}}}_{\text{weight responsiveness}} \times \underbrace{\left(-\frac{\partial \mu_{i,t}}{\partial \log(P_{i,t})}\right)}_{\text{price pass-through}}$$

两个全新的角色登场了：

价格传递 (price pass-through)，即 $-\partial \mu_{i,t}/\partial \log(P_{i,t})$：价格的变动，有多少「渗入」了下一期的预期收益 $\mu_i$。如果价格跌了之后下个月预期收益就涨上去（均值回复），传递就高；如果价格变动是持久的、不回头的，传递就低。
权重敏感度 (weight responsiveness)，即 $\partial \log(w_{i,t})/\partial \mu_{i,t}$：投资者的组合权重，对预期收益的变化有多敏感。

弹性高不高，就看这两块。经典模型把它们都设成了「极端值」，于是算出了天文数字。问题是——这两块到底该是多少？

4 模型：权重敏感度，等于「非张成收益」的倒数

价格传递还算直观，难点在权重敏感度。作者在这里给出了全文的理论内核，我们一步步推。

考虑一个具有常相对风险厌恶 (constant relative risk aversion, CRRA) 效用、收益服从对数正态、并面临卖空约束的投资者。如内部附录所示，这套设定近似等价于一个均值–方差问题：

$$\max_{w_t}\; \log \mathbb{E}(1+R_{p,t+1}) - \frac{\gamma}{2}\sigma^2_{p,t}$$

其中 $\gamma$ 是风险厌恶系数，$\sigma^2_{p,t}$ 是组合对数收益的条件方差。在卖空约束不绑定的那部分资产上，最优权重就回到了熟悉的均值–方差解：

$$w^{(1)}_t \approx \frac{1}{\gamma}\,\Sigma^{(1,1)-1}_t \mu^{(1)}_t$$

现在的问题是：单只资产 $i$ 的权重 $w_{i,t}$，对它自己的预期收益 $\mu_{i,t}$ 有多敏感？Stevens (1998) 给出的关键洞见是：要回答这个，必须把资产 $i$ 中不能被其他资产复制的那一部分剥离出来。于是作者做了一个回归——把 $i$ 的收益，投影到其余所有资产的收益上：

$$r_{i,t+1} = \mu_{i,\text{unspanned},t} + \beta'_{-i,t} r_{-i,t+1} + \epsilon_{i,t+1}$$

这个截距 $\mu_{i,\text{unspanned},t}$，就是本文的主角——非张成收益 (unspanned return)：资产 $i$ 的预期收益里，无法用其他资产线性组合出来的那部分。取条件期望，它满足

$$\mu_{i,t} = \underbrace{\mu_{i,\text{unspanned},t}}_{\text{unspanned}} + \underbrace{\beta'_{-i,t}\mu_{-i,t}}_{\text{spanned}}$$

非张成收益度量的是这只股票有多「独一无二」：如果它有近乎完美的替身，截距就接近零（这正是 CAPM 这类经典模型的隐含假设）；如果它没有好替身，截距就不可忽略。

Figure 2: Decomposing spanned and unspanned returns

有了这个，命题 1 的推导就水到渠成。在均值–方差解里，单只资产的最优权重可以写成

$$w_{i,t} = \frac{1}{\gamma}\left(\frac{\mu_{i,\text{unspanned},t}}{\sigma^2_{i,\text{unspanned},t}}\right)$$

分子是非张成收益，分母 $\sigma^2_{i,\text{unspanned},t}$ 是回归残差 $\epsilon_{i,t+1}$ 的方差，即「非张成方差」。现在对 $\mu_{i,t}$ 求导：由于 $\mu_{i,\text{unspanned},t}=\mu_{i,t}-\beta'_{-i,t}\mu_{-i,t}$，在固定其他资产时 $\partial \mu_{i,\text{unspanned},t}/\partial \mu_{i,t}=1$，于是

$$\frac{\partial \log(w_{i,t})}{\partial \mu_{i,t}} = \frac{1}{w_{i,t}}\cdot\frac{1}{\gamma}\cdot\frac{1}{\sigma^2_{i,\text{unspanned},t}} = \frac{1}{\mu_{i,\text{unspanned},t}}$$

最后一个等号，把 $w_{i,t}$ 的表达式代回去，$\gamma$ 和 $\sigma^2_{i,\text{unspanned}}$ 全部约掉，只剩一个惊人简洁的结果：

$$\frac{\partial \log(w_{i,t})}{\partial \mu_{i,t}} = \frac{1}{\mu_{i,\text{unspanned},t}}$$

权重敏感度，就等于非张成收益的倒数。 直觉是这样的：如果一只股票有完美替身（非张成收益≈0），那么它的预期收益哪怕只动了一丁点，理性投资者就会在它和替身之间疯狂地大进大出——因为换仓几乎没有代价。反过来，如果它独一无二（非张成收益大），换仓就要承担它自己那份特异风险，投资者反而懒得动。越独特，越「黏」，需求越缺乏弹性。

把这一切拼起来，就得到了全文的核心方程：

$$ \eta_{i,t} = \cssId{a0}{1} + \cssId{a1}{\frac{1}{\mu_{i,\text{unspanned},t}}} \times \cssId{a2}{\left(-\frac{\partial \mu_{i,t}}{\partial \log(P_{i,t})}\right)} $$

5 经典模型，是如何算出「7000」的

弄清了配方，再回头看经典模型，就知道它的「7000」是怎么炼成的了——它在两块上都取了极端假设。

第一，价格传递取了 1（或 1/12）。 很多用来研究需求弹性的模型是静态的，假设收益只在下一期实现，这等于默认所有当期价格变动都会在下期完全回复——价格传递等于 1。退一步，Petajisto (2009) 假设价格变动在一年内回复，对应月度传递 1/12。仅仅把这个 1/12 换成下面要讲的经验值 0.01，弹性预测就从 7000 掉到约 800——一下子小了 9 倍。

第二，也是更要命的，非张成收益取得极小。 经典模型隐含地假设股票之间近乎完美替代，非张成收益小到约 0.001%（Gabaix and Koijen, 2022）。在作者的框架里可以解出，非张成收益大致与「资产数 $N$ 的倒数」同阶——你假设市场上有成千上万只近乎完美的替身，非张成方差就被推向零，倒数（权重敏感度）就被推向无穷。这才是 7000 这个数字真正的来源。

换句话说，经典模型预测需求曲线水平，并不是因为它做了什么高深的假设，而是因为它偷偷假定了股票之间几乎可以无损互换。一旦这个前提站不住，整座大厦就塌了。

6 把真实数据塞进去：从 7000 到 5

那么真实数据说了什么？作者用月度美股数据，分别估了这两块。

价格传递。 用 Fama–MacBeth 回归，以滞后的对数价格预测下月收益，同时控制其他能预测收益的特征。结果约为 0.01——也就是说，每 1% 的、与现金流无关的价格下跌，只会让下个月的预期收益上升约 1 个基点。这和横截面里早已熟知的事实一致：短期反转（Jegadeesh, 1990）、动量（Jegadeesh and Titman, 1993）、长期反转（De Bondt and Thaler, 1985），这些价格的「可预测性」全都远小于一比一。本文的贡献不在于重新估出价格传递，而在于点明：弱的价格传递，直接导致低弹性。

非张成收益。 这需要预期收益和协方差矩阵的模型。作者用 Fama–MacBeth（基于常用股票特征）估预期收益，用日度收益的滚动一年窗口加上 Ledoit and Wolf (2004) 收缩估协方差。结果是：一只被纳入最优组合的「平均股票」，月度非张成收益约为 0.3%。请记住，经典模型假设的是 0.001%——真实值大了约 300 倍。正是这一块，把弹性从 800 进一步压到约 5。

整条路径，论文用一张瀑布图讲得明明白白：从经典的 7000，因价格传递降 9 倍到 800，再因非张成收益降约 160 倍到 5。剩下从 5 到经验估计的 1 那一小段，作者老实承认没有定论，可能是交易成本，也可能是别的摩擦——但那已经是零头了。

Figure 1: Explaining the gap between theoretical and empirical demand elasticities

Tip

注意作者的克制：他们没有去估需求弹性本身，也没有提出新的价格工具变量。他们只是估了收益的统计性质，然后让理论模型自己「吐」出弹性。这让结论更难被「内生性」之类的质疑击中——这是一个纯粹的、无摩擦的基准，正如 Modigliani and Miller (1958) 为无摩擦资本结构提供的那个基准。

7 非张成收益，其实就是「弱因子」

读到这里，习惯了因子模型的人可能会有点不适应：「非张成收益」听着很陌生，它和我们天天打交道的 alpha、因子，是什么关系？

但真正关键的一步，恰恰是作者在这里架起的那座桥。他们指出，高非张成收益，等价于存在「弱因子」(weak factors)——这正是 Lettau and Pelger (2020) 提出的概念：那些能解释预期收益的横截面、却解释不了多少收益时间序列波动的因子。

逻辑是这样的：早期的经典因子模型（CAPM、Fama–French 三因子）假设只有少数几个能解释大量共同波动的强因子被定价，言下之意就是「没有弱因子」，于是股票高度可替代、非张成收益≈0。但后续研究发现，要刻画横截面，需要越来越多、越来越「弱」的因子（Kelly, Pruitt and Su, 2019; Lettau and Pelger, 2020; Chen et al., 2023）。作者证明：当因子数目足够多时，这些模型必然隐含高非张成收益、从而低需求弹性。 图 3 把不同因子模型下的弹性画在一起，趋势一目了然——模型越「现代」、越能容纳弱因子，弹性就越低。

Figure 3: Demand elasticity for different factor models

于是，两条原本看似不相干的文献——「因子动物园为什么越来越大」和「需求曲线为什么向下倾斜」——在这里被缝到了一起。股票不是完美替代品，这件事既表现为「弱因子」，也表现为「低弹性」，它们是同一枚硬币的两面。（关于因子动物园与弱替代之间的联系，可参见《弱替代：因子动物园是从哪里冒出来的？》。）

作者还做了一个很有说服力的延伸：当把投资域 (investment universe) 限制到真实共同基金的范围时，弹性会更低。比如限制到行业型基金的持仓集合，一只「平均行业基金」中位数只持有 35 只股票，平均非张成收益升到 0.373%，对应弹性约 3.7，比全样本的 5 还要低。这个机制很干净：你能挑的替身越少，每只股票就越「独特」，需求就越黏。

8 文献脉络

把这条线索拉直了看，会发现这是一场跨越半个多世纪的拉锯。

最早，Scholes (1972) 论证股票应当是高度可替代的，不该是「独一无二的艺术品」——这是「需求曲线水平」一派的源头。但 Shleifer (1986) 用指数纳入做的经典研究捅破了这层窗户纸：需求曲线其实是向下倾斜的，资金流真的能推动价格。此后 Petajisto (2009) 把经典模型的弹性算到 6000 以上，把理论与经验的矛盾摆上了台面。

真正让这场争论升级的，是结构化的需求体系：Koijen and Yogo (2019) 用资产需求体系给资产定价，估出了「约 1」的低弹性；Gabaix and Koijen (2022) 进一步提出「无弹性市场假说」，把弹性差距推到了聚光灯下；Haddad et al. (2025) 则从竞争与被动投资的角度追问市场到底有多「有竞争性」。与此同时，资产定价的另一条线——从 Lettau and Pelger (2020) 的弱因子，到各路高维因子模型——悄悄准备好了解释的钥匙。

本文站的位置，正是这两条线的交汇点：它不去和经验估计争高低，而是回到投资组合选择的第一性原理，证明只要诚实地把收益的统计性质放进去，理性模型自己就会预测出无弹性的需求，并指认出「弱因子 = 高非张成收益 = 低弹性」这条贯穿始终的暗线。

9 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：这里的「需求弹性」，和我们平时说的「需求曲线向下倾斜」是一回事吗？

是同一枚硬币的两面，但表述更精确。「曲线向下倾斜」是定性说法；需求弹性 $\eta$ 是它的定量刻度——$\eta$ 越小，曲线越陡，资金流的价格冲击越大。经典模型的 $\eta\approx7000$ 对应近乎水平的曲线，经验的 $\eta\approx1$ 对应明显倾斜的曲线。

Q：价格传递只有 0.01，是不是等于说市场几乎完全有效、价格根本不可预测？

恰恰相反，它说的是价格变动很「持久」。传递低，意味着今天的价格变动不会在下期被大幅纠正回去——预期收益的变化是持久的。这与诸多动态资产定价模型里「预期收益有持续性」的设定完全一致，并不需要市场无效。

Q：「非张成收益」和 alpha 是一回事吗？

不完全是，差别很微妙但重要。普通 alpha 是相对某个固定因子组合（比如市场）的截距，而这里的回归把资产 $i$ 自己排除在外、用其余所有资产做解释变量。所以即便 CAPM 成立、按定义 alpha 为零，非张成收益仍可能非零（虽然很小）。它度量的是「可替代性」，不是「错误定价」。

Q：作者强调卖空约束，结论会不会是这个约束撑起来的？

不会。作者在正文和早期版本里都说明，去掉卖空约束，所有结论不变。引入约束只是为了贴近 Koijen and Yogo (2019) 的设定，并把分析限制在最优组合实际持有的那批资产上。

Q：从 5 到 1 的剩余缺口，凭什么甩给交易成本？这是不是「打扫战场」式的解释？

作者在这点上相当诚实，明说不对具体机制下定论。值得强调的是，他们的基准是「无摩擦最优投资者」——现实中有约束、有偏差的投资者，需求只会更无弹性。所以剩下的 5→1 完全可以由任何进一步压低弹性的因素（交易成本、基准约束、行为偏差）来填，方向是一致的。

Q：「弱因子越多、弹性越低」，会不会是循环论证——因子动物园本身就是被低弹性「造」出来的？

这是个好问题，也是本文识别上最该警惕的地方。作者的非张成收益依赖于预期收益和协方差的估计模型，换一套模型，估出的非张成收益会变。他们的辩护是：跨多种估计方法，结果都停留在同一个数量级。但「用什么因子模型来定义可替代性」本身带着研究者的主观选择，这一点无法完全摆脱。

(b) 几个可能的研究问题与提案

1. 公司债的非张成收益与需求弹性。

【经济故事】公司债比股票更「独一无二」：同一发行人不同期限、不同条款的债券彼此难以替代，二级市场又高度分割、流动性差。按本文逻辑，公司债的非张成收益应当远高于股票，需求弹性应当更低——这恰好能解释为什么信用市场的价格冲击如此显著。【可行性】中。数据用 TRACE（成交）+ Mergent FISD（债券特征），可仿照本文用滚动窗口估协方差、用特征回归估预期收益。难点在于债券收益的非同步交易与缺失值，协方差估计需要更强的收缩。（与《谁在持有这张债券，决定了它的价格》的需求视角天然互补。）

2. 投资域限制如何让外资持有人「更黏」。

【经济故事】外资持有人常受授权、母国偏好、可投范围的约束，能挑的「替身」更少。本文已证明：投资域越窄，非张成收益越高、需求越无弹性。那么外资占比高的市场/券种，是否系统性地表现出更大的资金流价格冲击？这对理解外资进出与流动性的关系很关键。【可行性】中。需要持有人层面的持仓数据（Koijen–Yogo 式）+ 各投资者的可投域刻画，识别上可借用本文「限制投资域→非张成收益上升」的机制做横截面对比。难点是准确界定每类投资者的真实可投集合。

3. 价格传递的时变性与流动性。

【经济故事】本文把价格传递当成一个相对稳定的统计量，但它很可能随流动性状况变化——危机中价格变动更持久（传递更低），需求更无弹性，从而形成「流动性枯竭 → 弹性下降 → 冲击放大」的正反馈。【可行性】高/中。用 Fama–MacBeth 在不同流动性状态（如按 VIX、买卖价差分组）下分别估价格传递即可，数据现成。挑战在于把「时变弹性」与已有的流动性螺旋理论对接，做出超越相关性的因果论断。

4. 弱因子数目与做市能力。

【经济故事】若非张成收益等价于弱因子，那么一个市场上「有效因子数」的多寡，应当直接映射到做市商对冲库存的难易——替身越少，做市越难、报价越宽。可以把本文的「非张成收益」直接接到做市文献的库存风险上。【可行性】中。需要做市商层面的库存与报价数据，识别上可用本文的非张成方差作为「对冲难度」的代理变量。数据可得性是主要瓶颈。

最后说说我作为读者的判断。

贡献上，这篇文章最漂亮的地方不是任何一个新估计，而是那个会计恒等式：$\eta\approx 1+\text{price pass-through}/\mu_{\text{unspanned}}$。它把一个吵了几十年、看似需要靠摩擦和行为来调和的「弹性之谜」，化简成两个纯粹由收益统计性质决定、可直接从数据读出的量。一旦你接受这个分解，「经典模型为什么错」就不再神秘——它错在偷偷假设了股票近乎完美替代。把这件事和「弱因子」「因子动物园」缝起来，更是一记漂亮的统一。

对识别的担忧，我最在意两点。其一，非张成收益对「用哪套预期收益/协方差模型」相当敏感，而这恰恰是研究者自由度最大的地方；作者用「跨方法同数量级」来辩护，但 5 和 1 之间本就只隔一个数量级，估计上的腾挪空间不算小。其二，全文是部分均衡的——价格性质外生给定，没有把价格内生化到一般均衡里。当大量投资者都按这套逻辑行动时，价格传递和非张成收益本身会不会内生地变化？这一步留给了未来。

后续最想看到的，是把这套分解搬到公司债和外资持有人上。股票已经「不够可替代」了，信用市场和受限投资者只会更甚——如果本文的机制在那里同样成立，我们或许就握住了一把统一解释「为什么信用市场的资金流冲击如此之大」的钥匙。

参考文献

Davis, C., Kargar, M., Li, J. (2025). Why do portfolio choice models predict inelastic demand? Journal of Financial Economics 172, 104096.
Gabaix, X., Koijen, R.S. (2022). In Search of the Origins of Financial Fluctuations: The Inelastic Markets Hypothesis. NBER Working Paper 28967.
Haddad, V., Huebner, P., Loualiche, E. (2025). How competitive is the stock market? Theory, evidence from portfolios, and implications for the rise of passive investing. American Economic Review 115(3), 975–1018.
Kelly, B.T., Pruitt, S., Su, Y. (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501–524.
Koijen, R.S., Yogo, M. (2019). A demand system approach to asset pricing. Journal of Political Economy 127(4), 1475–1515.
Ledoit, O., Wolf, M. (2004). Honey, I shrunk the sample covariance matrix. Journal of Portfolio Management 30(4), 110–119.
Lettau, M., Pelger, M. (2020). Factors that fit the time series and cross-section of stock returns. Review of Financial Studies 33(5), 2274–2325.
Modigliani, F., Miller, M.H. (1958). The cost of capital, corporation finance and the theory of investment. American Economic Review 48(3), 261–297.
Petajisto, A. (2009). Why do demand curves for stocks slope down? Journal of Financial and Quantitative Analysis 44(5), 1013–1044.
Scholes, M.S. (1972). The market for securities: Substitution versus price pressure and the effects of information on share prices. Journal of Business 45(2), 179–211.
Shleifer, A. (1986). Do demand curves for stocks slope down? Journal of Finance 41(3), 579–590.
Stevens, G.V.G. (1998). On the inverse of the covariance matrix in portfolio analysis. Journal of Finance 53(5), 1821–1827.