还不起债的世界里，期权成了 CAPM 漏掉的第二只手

[2004 RFS] Options Trading and the CAPM

Jun He June 02, 2026

资产定价期权 CAPM 一般均衡

Note

本文读的是 Vanden (2004, Review of Financial Studies)：当所有人都受到「不能资不抵债」的非负财富约束时，市场组合上的期权不再是冗余资产，经济体的定价核（pricing kernel）会同时取决于市场组合与这些期权；于是 CAPM 必须扩展成一个「市场 beta + 期权 beta」的多 beta 模型，而它在没有约束时会干净地退回到经典 CAPM。

1 一个让人不太舒服的事实

先从一个几乎是「常识」的判断说起。

期权是零净供给（zero net supply）的衍生品——有人买，就一定有人卖，整个经济体加总起来净持有为零。更要命的是，在一个足够完备的市场里，期权的收益完全可以用标的资产和无风险债券「复制」出来。换句话说，期权是冗余的（redundant）：它不带来任何新的配置功能，它的存在与否，不该影响任何资产的定价。

如果你相信这一点，那么 Sharpe (1964) 和 Lintner (1965) 的资本资产定价模型（capital asset pricing model, CAPM）就够用了：一只资产的期望超额收益，只由它对市场组合的 beta 决定，期权？无关紧要。

可经验证据偏偏不肯配合。Bakshi, Cao, and Chen (2000)、Buraschi and Jackwerth (2001)、Coval and Shumway (2001) 这几篇实证文章先后指出：S&P 指数期权看起来并不冗余——它们的收益里藏着市场组合解释不了的东西。

于是一个自然的问题摆在面前：如果期权真的「多余」，为什么它的收益还能解释风险资产的横截面？是经验证据错了，还是我们关于「冗余」的那个常识，本身就建立在一个被悄悄省略的假设之上？

Vanden 这篇文章的回答非常干脆：问题出在「借钱」上。

2 被省略的那个摩擦：还不起债

现实世界里，没人能无限度地借钱。买股票要交保证金，按揭要有抵押，信用卡有额度上限。Dybvig and Huang (1988) 把这一类约束统称为「有界信贷（bounded credit）」，并证明它在经济学上等价于一个非负财富约束（nonnegative wealth constraint）：你可以借钱（做空无风险资产），但走到经济的终点时，你必须有能力还清欠债，财富不能为负。

这听上去只是个技术性的下界，但它的威力惊人。本文的核心论点可以浓缩成一句话：

Tip

一旦所有人都受到非负财富约束，最优的风险分担方案就不再是「线性」的，而是分段线性（piecewise linear）的；而要在证券市场里实现一条分段线性的支付曲线，你必须交易市场组合上的期权。期权于是从「冗余」变成了「非冗余」。

接着，一个更深的含义浮现出来：既然期权是均衡里真实被交易、且不可被替代的资产，那么经济体的随机贴现因子（stochastic discount factor, SDF），也就是定价核，就不可能只是市场收益的光滑函数——它会在那些「有人开始还不起债」的财富水平上出现拐点。而拐点，恰恰是期权能定价、而市场组合定不了的东西。

这正是 CAPM 漏掉的第二只手。下面我们把这只手一步步「长」出来。

3 模型：分享规则为什么会「拐弯」

3.1 设定

两个日期：date 0 和 date 1。经济体里有 $I$ 个代理人，第 $i$ 个的效用函数是 $u_i(c_i)$，其中 $c_i \ge 0$ 是他在 date 1 的消费（也等于 date 1 的财富，因为只有一期）。本文用了四条假设：(i) 所有人都具有线性风险容忍（linear risk tolerance, LRT）且谨慎系数（cautiousness）相同；(ii) 信念一致；(iii) 都面临非负财富约束；(iv) 至少一个人在零财富处的边际效用有限。

(i) 和 (ii) 是文献里的标配，真正驱动模型的是 (iii) 和 (iv)。LRT 的精确含义是效用函数满足

$$-\frac{u_i'(c_i)}{u_i''(c_i)} = \tau_i + \gamma c_i$$

直觉上，$\tau_i + \gamma c_i$ 是「你愿意承担多少风险」随财富线性变化；「谨慎系数相同」指斜率 $\gamma$ 对所有人一样，只有截距 $\tau_i$ 可以不同。这个方程的解恰好对应三类效用——负指数、幂函数、对数，本文写成三种形式，其中最干净、对资产定价含义最强的是二次效用（quadratic utility）：

$$u_i(c_i) = \tau_i c_i - \tfrac{1}{2}c_i^2$$

聚合消费 $C$（即所有人消费之和）是一个外生给定、连续分布的随机变量。关键的一步在于：稍后我们会把 $C$ 直接解释成市场组合的清算红利（liquidating dividend）。

3.2 效率条件与「掉队」

如果配置是有效率的，那么对任意两个约束都没有绑定（即都还在消费）的代理人 $i$、$j$，他们的边际替代率必须相等：

$$\frac{u_i'(c_i)}{\lambda_i} = \frac{u_j'(c_j)}{\lambda_j}$$

这里 $\lambda_i$ 是第 $i$ 个人初始财富的影子价格（拉格朗日乘子）。令这个共同值等于 $e^t$，$t$ 是均衡里待定的随机变量。如果第 $i$ 个人的约束绑定了，他就消费不了，$c_i = 0$。于是每个人的配置可以统一写成

$$c_i = \max\!\big[\,0,\; u_i'^{-1}(\lambda_i e^t)\,\big]$$

把它对所有人加总，就得到聚合约束：

$$C = \sum_{i=1}^{I} c_i = \sum_{i=1}^{I} \max\!\big[\,0,\; u_i'^{-1}(\lambda_i e^t)\,\big]$$

现在定义一个实值函数 $\Phi$：

$$\Phi(x) \equiv \sum_{i=1}^{I} \max\!\big[\,0,\; u_i'^{-1}(\lambda_i e^{x})\,\big]$$

那么 $t = \Phi^{-1}(C)$，第 $i$ 个人的最优分享规则（sharing rule）就是

$$c_i = \max\!\Big[\,0,\; u_i'^{-1}\!\big(\lambda_i\, e^{\Phi^{-1}(C)}\big)\Big]$$

Proposition 1 证明了：在上述四条假设下，这些分享规则是 $C$ 的分段线性函数。

为什么会分段？直觉非常漂亮。先看 $C$ 很高的状态：所有人都消费，由于大家 LRT 且谨慎系数相同，分享规则在这段是线性的，斜率由全体代理人的特征决定。接着 $C$ 往下掉，总财富不够了，某一个（或几个）代理人的非负约束开始绑定，他掉队不消费了；剩下的人继续按线性规则分享，但斜率变了——因为分母里少了掉队那个人。$C$ 再往下掉，又有人掉队，斜率又变一次。每一次有人掉队，斜率就跳一下，于是整条分享规则被掰成了一段一段的折线。那些拐点的位置，就是「某个人恰好还不起债」的临界财富水平。

4 拐点如何被期权「实现」

折线有了，怎么在证券市场里真正交易出来？

这里 Vanden 用了两步「去中心化」。第一步，构造一个完备市场经济，每个人把 SDF $e^{\Phi^{-1}(C)}$ 当作给定，在预算约束下最大化期望效用——解出来的最优消费恰好就是 Proposition 1 里的分享规则。第二步，把 $C$ 认作市场组合的支付，再引入一组市场组合上的零净供给看涨期权（call options），让大家去交易。

谁是定价者？由于资源约束必须满足，总有一个人的非负约束永不绑定——把他标为代理人 1，称作定价代理人（pricing agent）。所有资产都按他的边际替代率线性定价。第 $j$ 个看涨期权的执行价（strike）正好设在第 $j$ 个人「掉队」的那个临界财富处：$K_j = \Phi\big[\log(\lambda_j^{-1}u_j'(0))\big]$。也就是说，每一个拐点，对应一份执行价恰好落在那里的期权。折线的每一节斜率变化，都靠多持有或少持有一份相应执行价的期权来拼出来。

由此可以直接读出资产价格。对任意 date 1 支付为 $X$ 的资产，

$$P_X = E\!\big[e^{\Phi^{-1}(C)}\,X\big] = \frac{E(X)}{R_F} + \mathrm{cov}\!\big(e^{\Phi^{-1}(C)},\,X\big)$$

定价核 $M(C) \equiv e^{\Phi^{-1}(C)}$ 不是 $C$ 的光滑函数——即使主观密度 $p(C)$ 光滑，风险中性密度

$$q(C) \equiv M(C)\,p(C)\Big[\textstyle\int M(C)\,p(C)\,dC\Big]^{-1}$$

也会带着拐点。这正是「期权非冗余」在定价核层面的指纹：一个光滑的市场收益函数，永远复制不出一个有拐点的 SDF。

5 当 CAPM 必须为期权让路

把上面的机制具体到二次效用，结论变得格外锋利。此时定价核可以写成定价代理人组合支付 $c_1$ 的线性函数 $e^{\Phi^{-1}(C)} = \lambda_1^{-1}(\tau_1 - c_1)$，而 $c_1$ 本身是

$$c_1 = C + \lambda_1 \sum_{j=2}^{I}\Big\{(\bar\lambda_j)^{-1} - (\bar\lambda_{j-1})^{-1}\Big\}\max\!\big[\,0,\; C - K_j\,\big]$$

其中 $\bar\lambda_j \equiv \lambda_1 + \lambda_2 + \cdots + \lambda_j$。注意 $\bar\lambda_j > \bar\lambda_{j-1}$，所以括号里那一项是负的——这意味着：定价代理人最优地持有「市场组合 + 对所有看涨期权的空头」。 换句话说，决定一只资产风险溢价的，不再是它与市场组合的协方差，而是它与「市场 + 一篮子期权」这个组合的协方差：

$$E(R_X) - R_F = \frac{\mathrm{cov}(R_X,\,R_{c_1})}{\mathrm{Var}(R_{c_1})}\,\big[E(R_{c_1}) - R_F\big]$$

把这个关系应用到每一只期权上、再代回去，最终就得到本文的招牌结论——一个多 beta 定价模型：

$$ \cssId{a1}{E(R_X) - R_F} = \cssId{a2}{\beta_{XC}\,\big[E(R_C) - R_F\big]} + \cssId{a3}{\sum_j \beta_{XO_j}\,\big[E(R_{O_j}) - R_F\big]} $$

这条式子的美感在于它的简约与嵌套：假设极其朴素，可一旦抽掉非负财富约束，期权重新变回冗余，期权 beta $\{\beta_{XO_j}\}$ 全部归零，整条式子就干净地退回到 CAPM。所以它不是在「推翻」CAPM，而是精确地告诉你：当人们会还不起债时，CAPM 究竟在哪里、被什么东西修正了。这与 Fama (1998) 关心的问题——除市场之外，还有哪些状态变量该被定价——直接对上了话：本文给出的答案是「市场组合 + 那些被交易的期权」。

Note

与那些把 SDF 写成市场收益多项式（共偏度、共峰度模型，见 Kraus and Litzenberger (1976)、Harvey and Siddique (2000)、Dittmar (2002)）或写成特征因子组合（Fama and French (1993, 1996)）的做法不同，这里的 SDF 显式地依赖一组零净供给衍生品的收益。期权第一次以「定价因子」而非配角的身份，被请进了定价核。关于把期权直接写进定价核的另一种思路，可参见《期权不该是配角：当衍生品第一次挤进「定价核」》。

6 实证：指数期权真的「有用」吗

理论说期权该有用，数据怎么说？本文第 2 节用已交易的指数期权（traded index options）去检验上面的多 beta 模型，结论是肯定的：期权收益确实能捕捉到「风险组合收益—市场收益」关系里被 CAPM 漏掉的显著不对称性。

更有意思的是各类组合的「期权风险画像」。在校正了市场代理（market proxy）与期权标的之间的错配之后，本文报告了如下的 beta 符号模式：

成长股（growth stocks） 平均而言有负的看跌期权 beta、正的看涨期权 beta；
价值股（value stocks） 的风险画像正好相反；
小盘股与大盘股 的看涨 beta 平均都为正，但大盘股的看跌 beta 为负、小盘股的看跌 beta 为正。

Warning

这里我只复述论文正文中明确给出的方向性（符号）结果。受所给正文截断的限制，我无法读到第 2 节具体的回归系数与 t 值，因此不在此罗列任何数字量级，以免编造。读者若要引用点估计，请回到原文表格核对。

这些符号本身已经在讲一个故事：不同风格的组合，对「市场下行时谁先还不起债」这件事的暴露方式是不一样的——而这正是期权 beta 想要捕捉的维度。期权的非冗余性，归根结底是不完备、且有约束的市场里，投资者异质性留下的痕迹。关于「在不完备市场里，每一张指数期权背后究竟站着怎样的投资者」，可参见《每一张期权背后，站着一个怎样的投资者？》。

7 文献脉络

把这条线索捋直，会看到一个很清晰的演进。

最上游是 CAPM 本身：Sharpe (1964)、Lintner (1965) 告诉我们，只有市场 beta 重要。紧接着，一批文章开始追问「约束」会怎样改写它——Black (1972) 的限制借贷、Ross (1977) 的卖空限制，都是在问：当人们不能随心所欲地融资时，定价会变成什么样。本文的非负财富约束比它们更温和（你仍可做空无风险资产），其经济基础来自 Dybvig and Huang (1988)。

另一条支流来自期权与市场完备性：Ross (1976) 指出期权是完备化市场的强大工具，Breeden and Litzenberger (1978) 则展示了一套完整的期权如何刻画 Arrow-Debreu 价格。本文与它们的差别在于——这里的市场对连续分布的 $C$ 是强不完备的，但有限的几份已交易期权有效地完备了市场，从而带来有效配置。

而把分享规则、线性风险容忍、聚合定理串起来的，是 Wilson (1968) 的辛迪加理论、Cass and Stiglitz (1970)、以及 Rubinstein (1974) 的聚合定理；二次效用下的期权定价则可回溯到 Rubinstein (1976) 与 Black and Scholes (1973)。最后，把「期权与股票收益存在一般性互动」这一点理论化的，是 Detemple and Selden (1991)。

本文（Vanden, 2004）正坐落在这两条支流的交汇处：用 Dybvig–Huang 式的财富约束，把期权的非冗余性内生出来，并由此给出一个可检验、且嵌套 CAPM 的多 beta 模型；而 Coval and Shumway (2001) 等人的实证发现，恰好为它提供了经验上的「需求」。

8 评论与延伸（Q&A + 研究方向）

Q：非负财富约束和经典的「借贷约束 / 卖空约束」到底有什么不同？

区别在于「约束作用在哪里」。Black (1972)、Ross (1977) 限制的是头寸（不能借、不能卖空）；本文的约束作用在终点财富上——你可以自由做空无风险资产去加杠杆，但走到 date 1 时财富不能为负。它更弱、更贴近「有界信贷」的现实，却足以让分享规则变成分段线性，从而催生期权的非冗余性。

Q：期权是零净供给，为什么还能影响定价？这不违背直觉吗？

直觉来自「冗余」假设：在光滑、可复制的世界里，零净供给资产确实只是配角。但非负约束让最优支付曲线出现拐点，而拐点无法用市场组合的光滑函数复制——必须靠期权。于是期权虽然净供给为零，却在均衡里被真实交易、不可替代，自然进入定价核。零净供给与「无关定价」是两回事。

Q：这个模型「证伪」了 CAPM 吗？

没有，恰恰相反。它把 CAPM 作为一个特例嵌套进来：抽掉财富约束，期权 beta 全部归零，多 beta 模型退回标准 CAPM。所以本文的贡献是「定位」而非「推翻」——精确地指出 CAPM 在何种摩擦下、被哪一项修正。

Q：为什么定价代理人偏偏持有「市场 + 期权空头」，而不是多头？

因为他是那个约束永不绑定的人。当别人因财富约束而「掉队」时，市场的下行风险被不成比例地转移给了仍在消费的人；定价代理人通过卖出看涨期权（在二次效用下，式 (19) 中系数为负）把自己的上行收益让渡出去、换取在坏状态下相对更平滑的消费。他的组合，正是经济体「谁来承担尾部」这一分担结构的镜像。

Q：用「指数期权」检验，会不会有标的错配的问题？

会，而且本文明确处理了它——市场代理（如某个股票指数）与期权标的之间存在错配，文中在校正这一错配后才报告各组合的 beta 符号。这也是为什么我对具体点估计保持审慎：错配校正的方式会直接影响系数大小。

Q：这套逻辑能不能搬到「市场组合不可观测」的现实里去？

这是它最脆弱的一环。模型把 $C$ 直接等同于市场组合的清算红利，而实证里市场组合本就难以测准（Roll 批判的老问题）。一旦市场代理有偏，期权 beta 的解释力有多少是「真实的额外维度」、多少是「市场代理误差的补丁」，就需要更小心地辨认。

几个可能的研究问题与提案

1. 把这套「约束→非冗余」逻辑搬到公司债与信用衍生品上。 - 【经济故事】公司债的支付天然带有「期权性」（股东对资产的看涨期权、债主写出的看跌期权）。如果投资者面临非负财富约束，信用违约互换（CDS）这类零净供给衍生品是否也会变成非冗余、并进入信用利差的定价核？这能为「为什么 CDS 收益能解释债券横截面」提供一个均衡基础。 - 【可行性】中。理论改造可行；实证需要 CDS 与公司债的配对收益（如 Markit + TRACE），识别上的难点仍是「市场组合」与约束的可观测性。

2. 用外资持有人的杠杆约束做横截面 beta 的来源。 - 【经济故事】不同国别、不同类型的投资者，其非负财富约束（保证金、监管资本）松紧不同。本文的拐点位置由「谁先掉队」决定——那么当某类受约束更紧的外资被动减仓时，期权 beta 是否会系统性地移动？ - 【可行性】中。需要投资者层面的持仓与杠杆数据（如各国托管/监管面板）；识别可借助监管冲击作为外生变化。

3. 检验定价核拐点与「有人还不起债」临界值的对应。 - 【经济故事】模型预言 SDF 的拐点正好落在临界财富 $K_j$ 处。能否从指数期权的风险中性密度里反推出这些拐点，并与宏观上「家庭/机构去杠杆」的时点对齐？这是对本文机制最直接的检验。 - 【可行性】中偏低。风险中性密度的估计成熟，但「临界财富」在数据里没有干净对应物，需要结构化假设来桥接。

4. 流动性约束 vs 财富约束：谁让期权非冗余？ - 【经济故事】本文把非冗余性归因于财富约束，但流动性/交易成本约束也能让市场不完备。两者对期权 beta 符号的预测是否可区分？ - 【可行性】低。两类摩擦在收益数据里高度纠缠，干净识别困难，更适合先做理论分离再设计实验。

9 我的判断

本文最漂亮的地方，是用一个极其朴素的假设——「人不能资不抵债」——把一个看似纯经验的现象（指数期权能定价）变成了一般均衡的必然推论，并且让结论以 CAPM 为特例干净地嵌套。它把「期权非冗余」从一句实证观察，提升成了一条有微观基础的定理；定价核出现拐点这一点，尤其有解释力——它一举说清了为什么光滑的市场函数模型（多项式 SDF、因子模型）总会在尾部「差一口气」。

对识别的担忧主要有两层。其一是市场组合不可观测：模型把 $C$ 钉死为市场清算红利，而实证中市场代理与期权标的的错配是核心难题，期权 beta 的增量解释力里，有多少其实是市场代理误差的「补丁」，需要更强的稳健性证据。其二是结构高度依赖效用假设：LRT + 谨慎系数相同 + 二次效用，这套组合换来了闭式解与强定价含义，但也意味着分段线性、拐点与期权空头这些结论，可能对偏好设定相当敏感；二次效用本身在无界支付下还可能引入套利（本文也坦承需要假定 $C$ 有界）。

后续我最想看到的，是把这条逻辑放进信用市场：公司债与 CDS 的期权性更直白、零净供给的衍生品更普遍，若能在那里同样观测到「定价核拐点」与「衍生品 beta」，本文的机制就不只是关于股票指数期权的一个特例，而会成为理解信用利差横截面的一块拼图。

参考文献

Bakshi, G., C. Cao, and Z. Chen (2000). Do Call Prices and the Underlying Stock Always Move in the Same Direction? Review of Financial Studies 13, 549–584.
Black, F. (1972). Capital Market Equilibrium with Restricted Borrowing. Journal of Business 45, 444–455.
Black, F., and M. Scholes (1973). The Pricing of Options and Corporate Liabilities. Journal of Political Economy 81, 637–659.
Breeden, D., and R. Litzenberger (1978). Prices of State-Contingent Claims Implicit in Option Prices. Journal of Business 51, 621–651.
Buraschi, A., and J. Jackwerth (2001). The Price of a Smile: Hedging and Spanning in Option Markets. Review of Financial Studies 14, 495–527.
Cass, D., and J. Stiglitz (1970). The Structure of Investor Preferences and Asset Returns, and Separability in Portfolio Allocation. Journal of Economic Theory 2, 122–160.
Coval, J., and T. Shumway (2001). Expected Option Returns. Journal of Finance 56, 983–1009.
Detemple, J., and L. Selden (1991). A General Equilibrium Analysis of Option and Stock Market Interactions. International Economic Review 32, 279–303.
Dittmar, R. (2002). Nonlinear Pricing Kernels, Kurtosis Preference, and Evidence from the Cross-Section of Equity Returns. Journal of Finance 57, 369–403.
Dybvig, P., and C. Huang (1988). Nonnegative Wealth, Absence of Arbitrage, and Feasible Consumption Plans. Review of Financial Studies 1, 377–401.
Fama, E. (1998). Determining the Number of Priced State Variables in the ICAPM. Journal of Financial and Quantitative Analysis 33, 217–231.
Fama, E., and K. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics 33, 3–56.
Fama, E., and K. French (1996). Multifactor Explanations of Asset Pricing Anomalies. Journal of Finance 51, 55–84.
Harvey, C., and A. Siddique (2000). Conditional Skewness in Asset Pricing Tests. Journal of Finance 55, 1263–1295.
Kraus, A., and R. Litzenberger (1976). Skewness Preference and the Valuation of Risk Assets. Journal of Finance 31, 1085–1100.
Lintner, J. (1965). The Valuation of Risk Assets and the Selection of Risky Investments in Stock Portfolios and Capital Budgets. Review of Economics and Statistics 47, 13–37.
Ross, S. (1976). Options and Efficiency. Quarterly Journal of Economics 90, 75–89.
Ross, S. (1977). The Capital Asset Pricing Model (CAPM), Short-Sale Restrictions and Related Issues. Journal of Finance 32, 177–183.
Rubinstein, M. (1974). An Aggregation Theorem for Securities Markets. Journal of Financial Economics 1, 225–244.
Rubinstein, M. (1976). The Valuation of Uncertain Income Streams and the Pricing of Options. Bell Journal of Economics 7, 407–425.
Sharpe, W. (1964). Capital Asset Prices: A Theory of Capital Market Equilibrium Under Conditions of Risk. Journal of Finance 19, 425–442.
Vanden, J. M. (2004). Options Trading and the CAPM. Review of Financial Studies 17(1), 207–238.
Wilson, R. (1968). The Theory of Syndicates. Econometrica 36, 119–132.