期权不该是配角：当衍生品第一次挤进「定价核」

[2006 RFS] Option Coskewness and Capital Asset Pricing

Jun He June 01, 2026

资产定价期权定价高阶矩随机折现因子

Note

本文读的是 Vanden (2006, Review of Financial Studies)：传统的「市场协偏度」三矩 CAPM 之所以把衍生品挡在门外，是因为它偷偷假设了一个代表性主体；一旦换成偏好异质的多主体，期权交易会内生地出现，随机折现因子里就不得不写进期权收益。由此得到的「期权协偏度模型」在实证上跑赢 CAPM、Fama–French 三因子以及市场协偏度/协峰度模型，而且它捕捉到的风险，竟与 SMB、HML 高度重叠。

1 一个被「踢出门外」的衍生品

先从一个几乎所有人都同意的事实说起：资本资产定价模型 (CAPM) 是错的——至少是「设定错误的」(misspecified)。

那怎么修？金融学过去三十年最常走的一条路，是往里加高阶矩。直觉很朴素：投资者不只在乎收益的均值和方差，还在乎它「歪不歪」（偏度）、「尾巴厚不厚」（峰度）。把代表性主体的边际效用做泰勒展开 (Taylor series)，保留到二阶，随机折现因子 (stochastic discount factor, SDF) 就是市场收益的二次多项式，于是市场协偏度 (market coskewness) 被定价；保留到三阶，SDF 是三次多项式，市场协峰度 (market cokurtosis) 被定价。前者是 Rubinstein (1973) 和 Kraus and Litzenberger (1976) 的经典三矩 CAPM，后者则被 Dittmar (2002) 系统分析过。

这条路看上去顺理成章。但它有一个被绝大多数人忽略的「副作用」——它把衍生品彻底赶出了定价舞台。

为什么？逻辑链其实只有三步。首先，代表性主体是「全市场」的化身；其次，衍生品是零净供给 (zero net supply) 的，多头和空头必然相互抵消；于是，代表性主体对任何衍生品的均衡持有量必然等于零。一个持有量为零的资产，自然不会进入他的边际替代率——也就不会进入 SDF。结论冷冰冰：在代表性主体的世界里，期权对股票定价毫无贡献。

Warning

这不是某个模型的小瑕疵，而是「代表性主体 + 零净供给」这对组合的必然推论。只要你坚持用一个主体代表整个市场，衍生品就一定是定价上的「配角」，甚至连配角都算不上。

2 可现实里，期权偏偏「不肯」当配角

接着，一个自然的问题是：现实真是这样吗？

证据指向相反的方向。Bakshi, Cao, and Chen (2000) 发现，S&P 500 指数的看涨期权价格，有时会在标的指数下跌时不降反升——这在「期权是标的的冗余资产」的世界里是不可能的。Coval and Shumway (2001) 直接度量了期权的预期收益，Buraschi and Jackwerth (2001) 与 Jones (2001) 也从不同角度确认：指数期权是非冗余 (nonredundant) 的资产，它们携带了标的现货里没有的信息。

而 Detemple and Selden (1991) 早就在理论上指出：如果期权真的非冗余，它就应该改变 SDF 的函数形式，就应该对股票横截面收益有发言权。

于是矛盾摆在面前：理论说衍生品无关紧要，数据说衍生品非冗余。本文要做的，就是把这道裂缝补上——而补的方式，是从根上拆掉那个制造矛盾的假设。

（关于把期权请进定价核这件事，本博客另有两篇可以对照着读：《定价核的「测谎仪」，为什么要请进期权？》和《期权太「短命」，因子模型怎么追得上它？》。）

3 真正关键的一步：让期权交易「自己长出来」

然后，本文的核心反转出现了：不要代表性主体。

设想经济里有两个或更多偏好异质 (heterogeneous) 的主体。如果他们的偏好都落在某个特定类里，那么——这是全文的题眼——市场组合上的看涨期权会内生地被最优交易出来。注意「内生」二字：作者既不像 Vanden (2004) 那样靠给主体加非负财富约束硬逼出期权需求，也不像 Glosten and Jagannathan (1994)、Agarwal and Naik (2004) 在业绩评估里直接假定期权就是定价因子。这里，期权交易是均衡的自然结果。

一旦每个人都在最优地持有期权，而均衡又是帕累托有效 (Pareto efficient) 的，那么任何一个主体的边际替代率都可以当作整个经济的 SDF——而这个 SDF，理所当然地依赖于被交易的期权。传统模型里那些「潜在波动率」之类的状态变量，不再直接进入 SDF，而是被期权收益及其高次幂吸收了进去。

最基本的版本只有两个主体、一份看涨期权合约。它的 SDF 长这样（论文记为 $\Lambda$）：

$$\Lambda = b_0 + b_1 R_M + b_2 R_O + b_3 R_M^2 + b_4 R_O^2 + b_5 R_M R_O$$

其中 $R_M$ 是市场收益，$R_O$ 是被交易期权的收益。

把它和老模型并排看，差别一目了然。因为 SDF 里有 $R_M$ 和 $R_M^2$，与市场的协方差、协偏度仍然重要——老模型的所有直觉都保留了下来。但因为 SDF 里多出了 $R_O$、$R_O^2$ 和 $R_M R_O$，与期权收益的协方差、与期权收益的协偏度 (coskewness with option returns)，以及市场和期权的交叉项，也都成了定价要素。正是后者，让这套模型被称为「期权协偏度模型」。

$$ \Lambda = \cssId{a1}{b_0} + \cssId{a2}{b_1 R_M + b_3 R_M^2} + \cssId{a3}{b_2 R_O + b_4 R_O^2} + \cssId{a4}{b_5 R_M R_O} $$

最妙的是它的嵌套结构：在期权需求为零的特殊情形下，$b_2$、$b_4$、$b_5$ 全部等于零，期权协偏度模型干净利落地塌缩回 Rubinstein (1973) 的市场协偏度模型。换句话说，老模型不是被推翻，而是被包含——它只是「没有人交易期权」时的一个角落。

4 模型推导：从风险分担到一份看涨期权

这是一篇不折不扣的模型论文，值得把关键几步拆开看。

第一步：帕累托最优的刻画。 经济里有 $i=1,2,\dots,I$ 个主体，两期。沿用 Wilson (1968)，帕累托最优的充要条件是存在一个函数 $\varphi(S)$，使得每个人的边际效用都被它「拉齐」：

$$U_i'(\hat W_i) = \lambda_i\, \varphi(S) \quad \text{for all } i, \qquad \sum_{j=1}^{I} \hat W_j = S$$

左式说所有主体的边际替代率相等，右式是资源约束（$S$ 是date 1 的总产出）。$\varphi(S)$ 正是 SDF 的雏形，$\{\lambda_i\}$ 是非负权重。难点在于：给定一般效用函数，要解出风险分担规则 $\hat W_i = g_i(S)$ 几乎是不可能的（Pratt, 2000）。

第二步：换一类偏好。 本文的技术心脏，是构造一类新的效用函数，用风险容忍度 (risk tolerance) 来定义：

$$-\frac{U_i'(W_i)}{U_i''(W_i)} = a\,W_i + h_i(W_i)$$

这里 $a$ 是所有主体共享的「谨慎」参数 (cautiousness)，而 $h_i(W_i)$ 是一个阶梯函数——在若干「转折财富水平」$\xi_n^i$ 上跳变。当 $h_i$ 取常数时，这退化为经典的线性风险容忍度类（Wilson 1968、Cass and Stiglitz 1970、Rubinstein 1974）；而它的阶梯结构，正是让分担规则「拐弯」的来源。$a=0$ 给出分段指数（CARA）效用，$a=1$ 给出分段对数效用，$a=-\tfrac12$ 给出分段三次效用。

第三步：定理 1。 如果所有主体都用这类效用、且共享同一个 $a$，那么帕累托最优的风险分担规则是总财富的分段线性 (piecewise linear) 函数。

为什么分段线性如此重要？因为分段线性的分担规则，恰恰是可以在证券市场里用市场组合上的期权来实现的那一类——分担规则的每一个「拐点」(kink)，对应一份期权的执行价 $K$。而这些执行价是内生决定的：它们取决于权重 $\{\lambda_j\}$、初始财富分配 $\{W_{0j}\}$ 和偏好参数。于是「谁更穷」会决定交易的是价内还是价外期权——若第二个主体相对初始财富越低，被交易的就越是价外 (OTM) 期权。

第四步：一个精确的例子。 取两个主体、$a=-\tfrac12$（三次效用），这正是 Rubinstein (1973) 那个经典三次效用经济的推广。求解 (1)–(2) 后，每个人的最优财富都包含三块：一项正比于 $S$、一个常数项、以及一项正比于 $\max(0, S-K)$——最后这块就是一份执行价为 $K$、零净供给的看涨期权。把最优财富代回，SDF 写成

$$\Lambda(S) = \big[\,d_0 - d_1 S - d_2 \max(0,\, S-K)\,\big]^{2}$$

其中 $d_0=(\eta+\beta_1)A^{-1}$，$d_1=(2A)^{-1}$，$d_2=(A-B)(2AB)^{-1}$。可以验证在 $S\le K$ 和 $S>K$ 两段上都有 $\Lambda>0$、$\Lambda'<0$、$\Lambda''>0$——这正对应两个主体都满足非饱和 ($U'>0$)、风险厌恶 ($U''<0$) 与正偏度偏好 ($U'''>0$)。

第五步：从赔付到收益。 把上式的平方展开，再从赔付换成收益，就精确地得到了第 3 节那个二次型 SDF（论文的方程 20）。注意「精确」二字：和泰勒展开式的三矩模型不同，这里不需要截断任何高阶项——期权协偏度模型本身就是一个 exact 的均衡结果，而不是近似。

这一点和本博客介绍过的《定价核的两副面孔》是同一种精神：SDF 的非线性形状本身，就是定价的关键，而不是可有可无的修正项。

5 实证：期权协偏度，跑赢了谁？

理论再漂亮，也要过数据这一关。本文用 S&P 500 指数期权构造期权收益 $R_O$，再去解释一组经典的测试资产。

作者先用近价 (near-the-money, NTM) 期权做多元回归，考察 $R_M$、$R_O$ 以及它们的高次幂在解释横截面收益时各自的贡献，如表 4 所示。

Table 4: summarizes the multivariate regression results for the NTM

随后是真正的「擂台赛」：拿 25 个 Fama–French 规模/账面市值组合做测试资产，让期权协偏度模型与 CAPM、Fama–French 三因子模型、市场协偏度模型、市场协峰度模型同台联合检验，如表 6 所示。

Table 6: summarizes the joint test results. For the 25 Fama–French

结论有两层。第一层意料之中：期权协偏度模型在多个基准上胜出——加入期权相关矩之后，定价误差被显著压缩。第二层才是真正耐人寻味的——期权协偏度捕捉到的风险，与 Fama and French (1993) 的 SMB（小减大）和 HML（高减低）高度重叠。这暗示着一件事：驱动非冗余期权定价的那些力量，和撑起规模、价值因子的力量，很可能是同一批。

作者还顺手把框架推广到「期权协峰度」模型（论文 Table 7），考察更高一阶的矩是否还有增量解释力——这是把 Dittmar (2002) 的市场协峰度思路，平移到期权世界的自然延伸。

6 文献脉络

把这条线索拉直了看，故事其实很清楚。

源头是 Sharpe (1964) 和 Lintner (1965) 的 CAPM。面对它的实证失败，第一波修补来自高阶矩：Rubinstein (1973)、Kraus and Litzenberger (1976) 用三次效用导出市场协偏度三矩 CAPM，Friend and Westerfield (1980)、Scott and Horvath (1980) 进一步讨论偏度偏好；再往后，Fang and Lai (1997)、Dittmar (2002) 把维度推到协峰度，Harvey and Siddique (2000a) 则引入条件偏度。这一支的共同基因，是「代表性主体 + 泰勒展开」。

与此同时，另一支文献在拆「代表性主体」这块基石。Wilson (1968) 给出了风险分担与线性分担规则的经典刻画；Ross (1976)、Breeden and Litzenberger (1978) 说明期权如何补全市场。进入新世纪，Bakshi, Cao, and Chen (2000)、Coval and Shumway (2001) 等用数据反复确认：指数期权是非冗余的。Vanden (2004) 迈出关键一步，用财富约束逼出期权交易、把期权收益写进 CAPM。

本文 Vanden (2006) 正站在这两支的交汇处：它继承了高阶矩传统里「协偏度被定价」的洞见，又接过「期权非冗余」的实证压力，用一类带阶梯风险容忍度的异质偏好，内生地把期权请进了 SDF。它既不靠财富约束，也不靠武断假定因子——这是它区别于 Vanden (2004) 和 Glosten and Jagannathan (1994) 的地方。

7 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：期权协偏度模型和老的市场协偏度模型，到底差在哪？

差在 SDF 多出了三项：$R_O$、$R_O^2$、$R_M R_O$。市场协偏度模型只看你与市场（及市场平方）的协动，期权协偏度模型还要看你与期权收益的协动。当期权需求为零（$b_2=b_4=b_5=0$）时，两者完全重合——老模型是新模型的一个角落。

Q：为什么「代表性主体」一定会把衍生品踢出定价？

衍生品零净供给，多空抵消，所以代表性主体（全市场的化身）的均衡持有量必为零。一个持仓为零的资产不进入他的边际替代率，也就不进入 SDF。这是「代表性主体 + 零净供给」的纯逻辑结论，与具体偏好无关。

Q：凭什么说「分段线性的风险分担」就等于在交易期权？

因为分段线性函数的每个拐点，都可以用一份执行价等于该拐点的期权来复制。定理 1 证明了在这类偏好下最优分担规则是分段线性的，而分段线性 = 市场组合 + 无风险债 + 若干看涨期权。执行价是内生的，取决于权重和初始财富。

Q：期权协偏度和 SMB/HML 重叠，是巧合还是有深意？

作者倾向于「有深意」：它暗示定价非冗余期权的风险，与规模、价值因子背后的风险是同源的。但要当心——重叠是统计相关，不等于结构上等同。两者可能只是对同一组潜在状态变量的不同投影，谁更「基本」还需更多结构性证据。

Q：只用一份 S&P 500 指数期权，去定价 25 个股票组合，外部有效性够吗？

这是个真问题。模型里「市场组合上的期权」是抽象对象，实证用单一指数期权近似。指数期权确实是关于整个市场的，但它能否承载所有横截面风险，尤其是个股层面的特质偏度，仍是开放的。多份期权、多个执行价的版本会更有说服力。

Q：这会不会只是「往 SDF 里多塞几个因子」的数据拟合？

不完全是。区别在于这些因子是内生推导出来的、有精确（非截断）的均衡基础，而非事后挑选。但平心而论，落到实证检验时，它仍然是一个把期权矩当解释变量的因子回归——理论的纪律性强，经验的可证伪性则和别的因子模型一样，得靠样本外表现说话。

(b) 几个可能的研究问题与提案

1. 把「期权协偏度」搬进公司债横截面。 【经济故事】按 Merton 的结构式视角，公司股权是公司价值上的看涨期权、公司债是「卖出看跌」。如果非冗余的指数期权携带了股票横截面的定价信息，那它对信用利差的横截面是否也有增量解释力？尤其在尾部，协偏度本就该咬人。【可行性】中。数据有（TRACE 公司债成交 + OptionMetrics 指数期权），识别上的难点是把「期权协偏度」与已知的信用因子（违约、流动性）干净分离，需要小心的多重共线性处理。

2. 谁在真正交易这些期权？——异质主体的「实名化」。 【经济故事】模型把期权交易归因于偏好异质，但没说清现实中扮演「第二个主体」的是谁。是散户、对冲基金，还是外资持有人？如果能把 $R_O$ 的定价贡献，对应到特定投资者群体的持仓变动上，就能给抽象的异质偏好一张「人脸」。【可行性】中偏低。需要细颗粒的期权持仓/成交分类数据（如 CBOE 的投资者类别、13F 的衍生品敞口），匹配难、口径粗，识别更多是相关性而非因果。

3. 非冗余期权的「流动性那一块」是否溢出到股票？ 【经济故事】如果期权之所以非冗余，部分是因为它难以被复制、交易成本高，那么期权市场的流动性冲击应当通过 SDF 渗入股票横截面。这把本文的「矩」维度，和流动性维度接上了。【可行性】中。指数期权的买卖价差、做市商库存可度量，关键是构造一个与市场协偏度正交的「期权流动性协动」，并验证它在股票上被定价。

4. 条件版本：从期权隐含矩里复原时变的协偏度。 【经济故事】本文是无条件检验，但偏度偏好和风险分担显然随状态变化。用期权价格直接反推隐含的高阶矩，构造条件期权协偏度，或许能解释 CAPM beta 在不同市场状态下的失灵（参见《跌的时候才显形：被 CAPM 漏掉的那半个 beta》）。【可行性】高。OptionMetrics 隐含波动率曲面成熟，Bakshi–Kapadia–Madan 式的模型无关矩提取是标准工具，识别清晰、可直接做样本外预测。

8 我的判断与参考文献

这篇文章最漂亮的地方，不在于「又加了一个矩」，而在于它改变了问题的提法。过去三十年，「衍生品和股票定价无关」几乎被当成公理；本文用一个干净的均衡论证指出，这条公理完全依赖于「代表性主体」这个建模便利——一旦承认人是异质的，期权交易会自己冒出来，SDF 里就必须给期权留位置。把老的市场协偏度模型作为零期权需求的特例嵌套进来，更是让这套理论既有新意又有传承。

对识别的担忧也很直接。其一，理论里的「市场组合上的期权」是抽象对象，实证落地为单一 S&P 500 指数期权，二者之间的距离没有被充分讨论；其二，期权协偏度与 SMB、HML 的重叠，究竟是「同源风险」还是「同一信息的不同投影」，本文给的是相关性证据，结构性身份仍未钉死；其三，高阶矩的估计天然嘈杂，联合检验对 SDF 的设定相当敏感（这也是 Hansen–Jagannathan 距离类检验的老问题）。

我接下来最想看到的，是多期权、多执行价的版本：既然定理 1 允许有限多份期权对应多个拐点，那么用一整条执行价格栅格上的期权去定价横截面，应当比单份期权更有力，也能把「期权协偏度到底捕捉了什么风险」这件事讲得更具体。

参考文献

Bakshi, G., C. Cao, and Z. Chen (2000). Do Call Prices and the Underlying Stock Always Move in the Same Direction? Review of Financial Studies 13(3), 549–584.
Coval, J., and T. Shumway (2001). Expected Option Returns. Journal of Finance 56(3), 983–1009.
Detemple, J., and L. Selden (1991). A General Equilibrium Analysis of Option and Stock Market Interactions. International Economic Review 32, 279–303.
Dittmar, R. (2002). Nonlinear Pricing Kernels, Kurtosis Preference, and Evidence from the Cross-Section of Equity Returns. Journal of Finance 57(1), 369–403.
Fama, E., and K. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics 33, 3–56.
Glosten, L., and R. Jagannathan (1994). A Contingent Claim Approach to Performance Evaluation. Journal of Empirical Finance 1, 133–160.
Harvey, C., and A. Siddique (2000). Conditional Skewness in Asset Pricing Tests. Journal of Finance 55(3), 1263–1295.
Kraus, A., and R. Litzenberger (1976). Skewness Preference and the Valuation of Risk Assets. Journal of Finance 31(4), 1085–1100.
Rubinstein, M. (1973). The Fundamental Theorem of Parameter-Preference Security Valuation. Journal of Financial and Quantitative Analysis 8(1), 61–69.
Sharpe, W. (1964). Capital Asset Prices: A Theory of Capital Market Equilibrium Under Conditions of Risk. Journal of Finance 19, 425–442.
Vanden, J. (2004). Options Trading and the CAPM. Review of Financial Studies 17(1), 207–238.
Wilson, R. (1968). The Theory of Syndicates. Econometrica 36, 119–132.