期权“快到期”那一刻，藏着跳跃的指纹

[2007 RFS] Approximation and Calibration of Short-Term Implied Volatilities Under Jump-Diffusion Stochastic Volatility

Jun He June 01, 2026

期权定价随机波动率渐进展开校准

Note

本文读的是 Medvedev & Scaillet (2007, Review of Financial Studies)：他们在一个带跳跃的两因子随机波动率模型下，推导出当到期时间趋于零时隐含波动率的渐进展开式，并由此给出一个不含未观测瞬时波动率的校准公式——于是横跨不同交易日的期权数据可以被一次性"汇总"进同一套校准里。一个反直觉的结论是：跳跃不改变隐含波动率的极限值，却改变了它逼近极限的速度（从 $\tau$ 变成 $\sqrt{\tau}$），而这恰恰可以用来检验跳跃是否存在。

1 引言：一个"既要又要"的老难题

选择一个期权定价模型，几乎永远是一场拉锯：你想要它够灵活，能解释市场上千奇百怪的波动率微笑（implied volatility smile）；又想要它够好算，最好有闭式解，不用每天去解一堆偏微分方程或者跑漫长的蒙特卡洛。

Black–Scholes 公式当然好算，但人尽皆知它解释不了真实的期权价格——波动率微笑就是它脸上抹不掉的那道裂痕。于是过去三十年，人们往里加了两样东西：随机波动率（stochastic volatility）和跳跃（jumps）。今天业界最常用的那一类——仿射跳跃扩散 (affine jump-diffusion)，由 Duffie, Pan & Singleton (2000) 奠定——之所以流行，正是因为它能给出闭式期权价格。代价呢？它必须接受很强的参数约束：方差走一个平方根过程（即 Heston (1993) 的设定），跳跃强度被规定成方差的线性函数。

Warning

问题是，这套"为了好算而强加的约束"，在实证里站不太住。Jones (2003)、Aït-Sahalia & Kimmel (2004) 一旦把模型放宽到更一般的恒定弹性方差 (constant elasticity of variance, CEV) 设定，平方根过程（Heston）就被数据拒绝了。

那么，有没有办法既不被仿射约束绑住，又不必硬解 PDE？本文的答案是：别去碰整条期限结构，先把镜头怼到"快到期"那一端。当到期时间 $\tau = T-t$ 很小时，隐含波动率会呈现出极其规整的渐进行为——规整到可以写成一个闭式展开。这条路，Lewis (2000)（假设小的波动率之波动率）和 Lee (2001)（假设波动率缓慢均值回复）都走过，但他们处理的都是没有跳跃的随机波动率。把他们的方法直接搬到跳跃情形，路并不通。本文真正的贡献，就是把这条展开推到了带跳跃的一般情形。

2 先把"价格"翻译成"波动率"的语言

约定一下记号。设股价 $S$、到期时间 $\tau$、行权价 $K$。Black–Scholes 隐含波动率 $IV(K,T)$ 的定义，就是让 BS 公式算出来的价正好等于市场实际价 $C(K,T)$ 的那个波动率参数：

$$C_t(K,T) = C^{BS}\big(X_t, K, \tau, IV_t\big)$$

这里有一个关键的中间量——moneyness（价内/价外的程度）：

$$X_t = \log\!\big[S_t\, e^{(r-\delta)\tau}/K\big]$$

作者证明了一件让分析大大简化的事：隐含波动率可以写成一个确定性函数

$$IV_t(K,T) = I(X_t,\tau;\sigma_t)$$

而且 $I$ 既不依赖无风险利率 $r$、也不依赖股息率 $\delta$。这意味着只要我们在"波动率"这个尺度上工作，就可以放心地令 $r=\delta=0$（在把行权价 $K$ 换算成 moneyness $X$ 时再把它们考虑回来即可）。一句话：隐含波动率是被"洗"过的期权价，干净得多。

3 一个看似自然的展开，为什么会"炸"

既然 $\tau\to0$ 时 $I$ 有极限——在无跳跃情形下，平价隐含波动率会收敛到瞬时波动率 $\sigma$（这是 Ledoit, Santa-Clara & Yan (2002) 早已指出的）——一个再自然不过的想法，就是把 $I(X,\tau;\sigma)$ 在 $X=\tau=0$ 处做泰勒展开。

可这里埋着一颗雷：一旦存在跳跃，这个关于 $X$ 的幂级数就不再良定义了。 函数 $I$ 在 $X,\tau$ 很小时不再"乖巧"。

怎么绕过去？这是本文第一个漂亮的技术动作——重新缩放 moneyness。定义一个叫"moneyness degree"的量 $\theta$：

$$\theta \equiv \frac{X}{\sigma\sqrt{\tau}}, \qquad \bar I(\theta,\tau;\sigma)\equiv I(\sigma\theta\sqrt{\tau},\,\tau;\,\sigma)$$

为什么是这个缩放？因为在无跳跃模型里，忽略 $\tau$ 及更高阶项，$\log(S_T/K)$ 近似服从均值为 $X_t$、标准差为 $\sigma_t\sqrt{\tau}$ 的正态分布。$\theta$ 正是"均值除以标准差"——它衡量的是这个期权到期时落在价内的可能性。换句话说，$\theta$ 才是"快到期"语境下天然的 moneyness 标尺。把 $X=\sigma\theta\sqrt\tau$ 代回去，原本会"炸"的幂级数，就被整理成了一个对 $\sqrt\tau$ 的良性展开。

4 模型与核心展开

先把舞台搭好。本文用的是一个两因子跳跃扩散随机波动率模型，定价测度下股价与波动率的联合动态为：

$$dS_t = \big[r-\delta-\eta(\sigma_t)\big]S_t\,dt + \sigma_t S_t\,dW_t^{(1)} + S_t\,dJ_t$$

$$d\sigma_t = a(\sigma_t)\,dt + b(\sigma_t)\Big[\rho\,dW_t^{(1)} + \sqrt{1-\rho^2}\;dW_t^{(2)}\Big]$$

其中 $W^{(1)},W^{(2)}$ 是两个独立标准布朗运动，$J_t$ 是独立的泊松跳跃过程，$r,\delta,\rho$ 为常数，期望跳跃幅度 $E(\Delta J)$ 为常数，而跳跃强度 $\lambda=\lambda(\sigma_t)$ 可以依赖于波动率；记期望跳跃 $\eta(\sigma)=\lambda(\sigma)E(\Delta J)$。这个设定足够一般，能容纳实务里几乎所有常用的参数模型。

Tip

注意 $\rho$ 把波动率的随机性与股价的随机性"绑"在了同一个布朗运动 $W^{(1)}$ 上——这就是著名的杠杆效应 (leverage effect)。下面会看到，正是这个 $\rho$，在一阶项里留下了微笑的斜率。

先看没有跳跃的纯扩散情形（Proposition 1）。作者证明，隐含波动率有如下渐进展开：

$$ I(\theta,\tau;\sigma) = \cssId{a1}{\sigma} + \cssId{a2}{I_1(\theta;\sigma)\sqrt{\tau}} + \cssId{a3}{I_2(\theta;\sigma)\,\tau} + O(\tau\sqrt{\tau}) $$

其中一阶项是 moneyness degree 的线性函数：

$$I_1(\theta;\sigma) = -\frac{\rho\, b}{2}\,\theta$$

这个式子干净得令人愉悦，而且意味深长：

一阶斜率只由相关系数 $\rho$ 乘以波动率之波动率 $b$ 决定。当 $\rho<0$（杠杆效应），斜率为正，低行权价（深度价外看跌期权）那一端的隐含波动率更高——这正是股指期权那个标志性的"冷笑"（smirk）。（关于这条微笑曲线背后到底是风险还是行为，可参见《为什么从期权里「读」出来的风险厌恶，会咧嘴一笑？》。）
更妙的是，波动率的漂移 $a$ 根本没出现在 $I_1$ 里，因此一阶项与定价测度的选择无关。直觉很朴素：到期时间足够短，波动率"还没来得及变多少"，所以波动率风险不可能对期权价产生一阶影响。

二阶项 $I_2(\theta;\sigma)$ 是 $\theta$ 的二次函数加一个常数，系数里揉进了 $a,\rho,b$ 以及 $b$ 的导数 $b'$——它刻画的是微笑的曲率。结构虽繁，逻辑是清楚的：一阶给斜率，二阶给弯度。

5 反转：跳跃留下的，是"速度"而非"水平"

现在把跳跃放回来（Proposition 4，先假设跳跃强度为常数）。展开式的形式不变，依旧是 $\sigma + I_1\sqrt\tau + I_2\tau+\cdots$，但一阶项里多出了两块跳跃的贡献：

$$I_1(\theta;\sigma) = -\frac{b\rho}{2}\theta - \eta\, g + \mu\, h$$

其中 $g=N(\theta)/n(\theta)$，$h=1/n(\theta)$（$n,N$ 是标准正态的密度与分布函数），$\eta=\lambda E(\Delta J)$ 是总期望跳跃，$\mu=\lambda E(\Delta J_+)$ 是期望跳跃的正部。

这里有一个乍看相当反直觉的结论：在 $\tau\to0$、$\theta$ 固定时，隐含波动率仍然收敛到瞬时波动率 $\sigma$——跳跃成分对极限值毫无贡献。

奇怪吗？很奇怪。因为对小的 $\tau$，收益率的方差近似是 $(\sigma^2+\lambda E\Delta J^2)\tau$，扩散与跳跃两块是同阶的、势均力敌。可一旦换到隐含波动率的语言里，两者的命运就彻底分岔了。作者用一个干净的对比讲透了这件事：

纯泊松跳跃模型下，平价看涨期权价格的主导项是 $(\lambda S E\Delta J_+)\tau$；而纯扩散下，主导项是 $\big(\sigma S/\sqrt{2\pi}\big)\sqrt\tau$。
这意味着纯跳跃模型下隐含波动率会收敛到零，主导项是 $\big(\lambda\sqrt{2\pi}\,E\Delta J_+\big)\sqrt\tau$；而纯扩散下，隐含波动率在极限处等于 $\sigma$。

于是真正关键的一句话浮出水面——跳跃改变的不是极限，而是逼近极限的速度。

在纯扩散模型里，平价隐含波动率以 $\tau$ 的速率收敛到 $\sigma$（因为 $\theta=0$ 时 $I_1(0)=0$，$\sqrt\tau$ 那一项消失了）。可一旦有跳跃，$\theta=0$ 处 $I_1(0)=-\eta\,g(0)+\mu\,h(0)\neq0$，$\sqrt\tau$ 那一项不再消失——平价隐含波动率改以 $\sqrt\tau$ 的速率收敛。

这正是检验跳跃的一把利器。Carr & Wu (2003a) 在研究期权价格的短期行为时指出，用平价期权价格无法检测跳跃（除非是纯跳跃情形）；而本文的 Proposition 4 说明，换成平价隐含波动率就能做到——你只需看它逼近瞬时波动率的速度，是 $\tau$ 还是 $\sqrt\tau$。

Note

在更一般的情形（Proposition 5，强度与跳跃分布都依赖于 $\sigma$），$I_1$ 与上面相同，只是二阶项要做一个修正：$\big[I_2(\theta;\sigma)-\tfrac12\rho b\,\eta'\big]\tau$，$\eta'$ 是期望跳跃 $\eta$ 对 $\sigma$ 的导数。跳跃强度随波动率变化的那部分信息，是从二阶项漏出来的。

6 真正关键的一步：把"看不见的"换成"看得见的"

到这里，理论很漂亮，但有一个实务上的拦路虎：展开式 (18) 里含着未观测的瞬时波动率 $\sigma$，而它每天都在变。结果就是，这个公式只能逐日校准——而逐日校准需要每天都有足够多的短期期权报价。可现实里常常做不到，比如 S&P 500 期权一个月才发行一次。

本文最实用的一招在此登场：用一个能观测到的隐含波动率，替换掉看不见的瞬时波动率。

具体地，设我们观测到某个 $\tau$ 下的平价隐含波动率 $\hat\sigma=I(0,\tau;\sigma)$。定义一个"修正的 moneyness degree"，把分母里看不见的 $\sigma$ 换成看得见的 $\hat\sigma$：

$$\hat\theta \equiv \frac{X}{\hat\sigma\sqrt{\tau}}$$

接着，对 $\hat\sigma=I(0,\tau;\sigma)$ 的渐进式做反演，把瞬时波动率写成 $\sigma=\sigma(\tau,\hat\sigma)$ 的形式，再代回展开式。Proposition 6 由此给出一个修正后的隐含波动率函数 $\hat I(\hat\theta,\tau;\hat\sigma)$——它完全不含任何隐变量。

这一步的意义怎么强调都不为过。因为公式里不再有那个"每天都在变"的 $\sigma$，它就可以被用来对模型 (1) 的任意参数设定，把横跨不同交易日的期权价格一次性、同时校准——也就是说，我们能在一步里同时拟合波动率微笑及其动态。

天下当然没有免费的午餐。代价是：波动率漂移 $a$ 从公式里消失了，无法再从数据里识别出来。但作者诚实地指出，这个损失是合理的——反正在我们的近似所适用的那批短到期期权上，波动率漂移本来也无法被充分识别。

Tip

由于近似只对近平价 (near-the-money) 期权才准，作者进一步对 $\hat I$ 里那些高度非线性的函数 $g(\theta)$、$h(\theta)$ 在 $\theta=0$ 处再做一次二次展开，以避免远离平价时的大数值误差。Zhang & Xiang (2006) 也用过类似的二次近似，但他们建立的是隐含波动率与风险中性密度的关系，没法从期权价反推出状态变量模型的设定，也无法摆脱逐日校准——这正是本文方法的两点不同。（从期权价格里"读"出风险中性分布这条路，另见《把概率从期权价格里「凭空」捞出来》。）

7 数据与实证：跳跃显著，平方根过程出局

作者把这套方法用到一组 S&P 500 期权价格上做校准，得到三个结论：

跳跃是显著的——这一点和正文反复呼应。
数据支持波动率之波动率的 CEV 设定，而拒绝仿射（平方根 / Heston）设定。
数据支持跳跃强度的仿射设定。

值得玩味的是，这些结论与既有文献高度一致——Jones (2003)、Aït-Sahalia & Kimmel (2004) 倾向于拒绝波动率的仿射设定；Bakshi, Cao & Chen (1997)、Bates (2000a) 主张在收益率里引入跳跃——但本文是用一套完全不同的方法得到了它们。从短期渐进出发，绕开了 PDE 与蒙特卡洛，却抵达了同一个结论。

8 文献脉络

把这条线索捋一捋。源头是两条平行的支流：一条是 Heston (1993) 的闭式随机波动率解，后来被 Duffie, Pan & Singleton (2000) 收编进仿射跳跃扩散的统一框架——这是"为好算而牺牲灵活"的代表。另一条则是短期渐进展开：Lewis (2000) 在小的波动率之波动率假设下、Lee (2001) 在缓慢均值回复假设下，分别推出了隐含波动率的渐进式；Fouque, Papanicolaou & Sircar (2000) 走的是快速均值回复；Hagan et al. (2002) 给出了 CEV 型模型下的 SABR 近似。

还有第三条更"无模型"的支流：Backus, Foresi & Wu (1997) 和 Zhang & Xiang (2006) 用密度函数的渐进、假设二次型微笑，建立了收益率分布与隐含波动率之间的关系——好处是不依赖模型设定，坏处是反推不出状态变量过程的动态。

本文恰好坐在这三条支流的交汇处：它继承了 Lewis–Lee 的渐进精神，却把它推广到带跳跃的一般情形（这是前人没做到的）；它又像 Zhang–Xiang 一样追求模型无关的可校准性，却能进一步复原出状态变量模型、并捕捉微笑动态里的信息。同时，它的实证结论（拒绝仿射波动率、肯定跳跃）又呼应了 Jones (2003)、Aït-Sahalia & Kimmel (2004) 这一路的发现。

评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：为什么跳跃不改变隐含波动率的极限，却改变收敛速度？这不矛盾吗？

不矛盾。极限值由"$\tau\to0$ 时方差的主导行为"决定，而扩散方差 $\sigma^2\tau$ 与跳跃的二阶矩贡献虽然同阶，但跳跃带来的是离散的、肥尾的分布形变。在 BS 这把"只认正态扩散"的尺子下，跳跃无法体现在零阶（极限）的 $\sigma$ 上，只能从 $\sqrt\tau$ 这一阶"漏"出来。所以极限相同、速度不同。

Q：moneyness degree $\theta=X/(\sigma\sqrt\tau)$ 和实务里常用的"标准化 moneyness"是一回事吗？

本质相同，但有微妙差别。实证文献（如 Bates (2000a)、Carr & Wu (2003b)）常用平价隐含波动率或平均波动率来做分母；本文一阶理论用的是瞬时波动率 $\sigma$。而第 6 节的校准公式正是把分母换成可观测的 $\hat\sigma$，从而既保留了 $\theta$ 的几何含义，又摆脱了隐变量。

Q：既然丢掉了波动率漂移 $a$，这套校准是不是少了重要信息？

作者的辩护是诚实且站得住的：在短到期期权上，$a$ 本来就无法被充分识别——波动率"没时间变",漂移的影响是高阶小量。所以丢掉的是一个本就识别不出来的参数，换来的是跨日期汇总数据的能力。这是一笔划算的交易。

Q：用 $\hat\sigma$ 替换 $\sigma$，会不会把测量误差带进校准？

会，这正是该方法的软肋。$\hat\sigma$ 是观测到的平价隐含波动率，本身含报价噪声；反演与代回会把这层噪声传导进结果。作者用近平价 + 二次展开来压住高度非线性函数 $g,h$ 的数值放大，但近似只在近平价、短到期那一小片区域才可靠。

Q：和仿射模型相比，本文方法的边界在哪里？

仿射模型给的是全期限的闭式价，本文只对短到期准。两者是互补而非替代：要给长期期权定价，仿射或数值方法仍不可少；要快速、稳健地校准短端微笑并检验跳跃/CEV 设定，本文的展开更轻便。

Q：这套方法能识别风险中性分布吗？

部分能。它比 Zhang–Xiang 那类"只到分布层面"的方法更进一步——能复原出状态变量过程的设定（CEV、仿射强度等）。但它牺牲了波动率漂移，所以无法刻画波动率本身在物理测度下的长期动态。

(b) 几个可能的研究问题与提案

1. 把"$\sqrt\tau$ vs $\tau$"的收敛速度做成一个正式的跳跃检验。 【经济故事】本文已经在理论上指出平价隐含波动率的收敛速率能区分跳跃，但论文重心在校准，没把它做成一个有显式临界值、有限样本表现可控的统计检验。【可行性】高。用 OptionMetrics 的短到期 SPX 期权，按到期日分桶，估计 ATM 隐含波动率对 $\sqrt\tau$ 与 $\tau$ 的拟合优度，构造一个非嵌套模型选择检验即可。数据现成，识别清楚。

2. 把这套短期渐进搬到公司债的信用利差期限结构上。 【经济故事】信用利差在极短期的行为同样由"扩散 vs 跳跃（违约）"主导，且结构模型里违约本质上是跳跃事件。短期利差逼近零的速度，或许同样能区分"纯扩散式信用恶化"与"跳跃式违约风险"。【可行性】中。需要 TRACE 的高频成交价拼出短期利差曲线，难点在于短到期公司债流动性差、报价稀疏，$\sqrt\tau$ 那一阶的信号容易被噪声淹没。识别思路可行，数据质量是主要约束。

3. 用跨日期汇总校准去刻画跳跃强度的时变性。 【经济故事】本文方法的最大卖点是能汇总不同交易日的数据、一步拟合微笑动态。一个自然的延伸是把 $\lambda(\sigma)$ 的形式与宏观/情绪状态变量挂钩，检验"恐慌期跳跃强度是否系统性抬升"。【可行性】中。需要把校准公式与状态变量（如 VIX、宏观不确定性指标）嵌套，识别上要小心 $\hat\sigma$ 与状态变量的内生共动。（情绪如何进入期权价格，可参见《情绪会给「微笑」加多少弧度？》。）

4. 散户主导时段的短期微笑斜率，是否偏离 $-\rho b/2$？ 【经济故事】本文给出微笑斜率的理论值 $-\rho b\theta/2$，纯由杠杆效应与波动率之波动率决定。若散户需求压力会系统性地推动微笑，那么在散户活跃时段，观测斜率应当偏离这个"基本面值"。【可行性】中。需要带交易者类型标签的期权订单流（如 CBOE/ISE 的分类数据），把观测斜率与理论 $-\rho b/2$ 的偏离回归到散户净需求上。（关于散户如何推歪波动率曲面，见《当波动率曲面被「散户」推歪》。）

我的判断

这篇论文的贡献是扎实且优雅的。它最漂亮的地方不在"又一个渐进展开"，而在于把两件看似无关的事缝在了一起：一个纯理论的观察（跳跃改变的是收敛速度而非极限）和一个纯实务的痛点（瞬时波动率看不见、被迫逐日校准）。前者给了检验跳跃的新工具，后者让横跨日期的数据第一次能被一次性榨干。能用"快到期"这一端的渐进，绕开 PDE 和蒙特卡洛，还反过来印证了主流实证文献关于跳跃和 CEV 的结论，这本身就说明这条近似抓住了问题的主结构。

对识别，我有两点保留。其一是近似的适用域：所有结论都建立在"$\tau$ 足够小、$\theta$ 足够接近零"之上，论文用数值实验划定了精度范围，但实务中真正的短到期、近平价期权往往也是流动性最差、报价最脏的那一批——理论最准的地方，恰恰是数据最不可靠的地方，这是个尴尬的张力。其二是 $\hat\sigma$ 替换带来的误差传导：用观测隐含波动率顶替瞬时波动率，是这套方法可行性的命门，也是它的脆弱点，论文对这层噪声如何影响参数估计的讨论略显单薄。

后续我最想看到的，是把"$\sqrt\tau$ 收敛速率"真正做成一个有限样本性质明确、有临界值的正式跳跃检验，并在不同资产类别（尤其信用市场）上检验它的稳健性。如果它真的稳，那就是一把比看期权价格更灵敏的"跳跃探测器"。

参考文献

Aït-Sahalia, Y., and R. Kimmel (2004). Maximum Likelihood Estimation of Stochastic Volatility Models. NBER Working Paper No. W10579.
Backus, D., S. Foresi, and L. Wu (1997). Accounting for Biases in Black–Scholes. Working Paper, Stern School of Business, NYU.
Bakshi, G., C. Cao, and Z. Chen (1997). Empirical Performance of Alternative Option Pricing Models. Journal of Finance 52, 2003–2049.
Bates, D. S. (2000a). Post-'87 Crash Fears in S&P Futures Options. Journal of Econometrics 94, 181–238.
Carr, P., and L. Wu (2003a). What Type of Processes Underlies Options? A Simple Robust Test. Journal of Finance 58, 2581–2610.
Duffie, D., J. Pan, and K. Singleton (2000). Transform Analysis and Asset Pricing for Affine Jump-Diffusions. Econometrica 68, 1343–1376.
Fouque, J.-P., G. Papanicolaou, and K. R. Sircar (2000). Mean-Reverting Stochastic Volatility. International Journal of Theoretical and Applied Finance 3, 101–142.
Hagan, P., D. Kumar, A. Lesniewski, and D. Woodward (2002). Managing Smile Risk. Wilmott Magazine, September, 84–108.
Heston, S. (1993). A Closed-Form Solution for Options with Stochastic Volatility with Applications to Bond and Currency Options. Review of Financial Studies 6, 327–343.
Jones, C. S. (2003). The Dynamics of Stochastic Volatility: Evidence from Underlying and Option Markets. Journal of Econometrics 116, 181–224.
Ledoit, O., P. Santa-Clara, and S. Yan (2002). Relative Pricing of Options with Stochastic Volatility. Working Paper, University of Arizona.
Lee, R. W. (2001). Implied and Local Volatilities Under Stochastic Volatility. International Journal of Theoretical and Applied Finance 4, 45–89.
Lewis, A. S. (2000). Option Valuation under Stochastic Volatility, with Mathematica Code. Newport Beach, CA: Finance Press.
Medvedev, A., and O. Scaillet (2007). Approximation and Calibration of Short-Term Implied Volatilities Under Jump-Diffusion Stochastic Volatility. Review of Financial Studies 20(2), 427–459.
Zhang, J. E., and Y. Xiang (2006). Implied Volatility Smirk. Working Paper, The University of Hong Kong.