对冲的下半场:不是「要不要」,而是「怎么对冲」

[2002 RFS] How Firms Should Hedge
Note

本文读的是 Brown & Toft (2002, Review of Financial Studies):当一家公司同时面对「可对冲的价格风险」和「不可对冲的数量风险」、又在坏状态下要付出死重成本时,作者用闭式解告诉你它到底该买远期、买期权、还是去定制一份「奇异」合约——答案的关键,藏在价格与产量的相关系数,以及数量风险相对价格风险的大小里。

1 引言:一个被问了二十年、却始终没人回答的问题

打开任何一本公司金融的教科书,关于「企业为什么要对冲」的论述都汗牛充栋。从 Modigliani 和 Miller (1958) 的无关性定理出发,人们发现:只要 MM 的假设被打破——凸的税收表、破产的死重成本、代理成本、外部融资的高昂——对冲就能凭空给股东创造价值。Smith 和 Stulz (1985) 把这套逻辑讲得最清楚:一个价值最大化的公司,只要面对凸的税收或者财务困境的死重成本,就应该对冲。

可是,如果你已经下定决心要对冲,下一个问题马上就来了:到底该怎么对冲?

令人意外的是,这个「怎么」几乎无人作答。文献从没认真讨论过:一家公司什么时候该用远期、什么时候该用期权、又或者干脆都不用,而是去和场外衍生品交易商签一份量身定制的合约?Brown 和 Toft 这篇 2002 年发表在 RFS 上的论文,正是冲着这个空白去的。他们的野心不是再添一条「为什么对冲」的理由,而是把那些理由统统当作既定前提,然后一路推到底——求出那个价值最大化公司的最优对冲策略

2 把问题逼到最简:两种风险,一种成本

要回答「怎么对冲」,先得把公司抽象到不能再简单。作者给了两个生动的例子。

一个是种小麦的农民:小麦的价格可以用期货、期权轻松对冲,但他今年到底能收多少蒲式耳——这个产量,却没法事先锁定。另一个是在本土生产、卖到海外的电脑厂商:以外币计价的销售额,短期内不难预测和对冲,可放到长期,海外究竟能卖出多少,谁也说不准。

于是两类风险被清清楚楚地分开了:

Tip

这正是这篇论文区别于「投资组合选择」那一支文献的地方。以往的模型(如 Svensson & Werner (1993))处理的是一个可加的、相关的非交易收入;而这里,价格和数量是相乘的(收入 = \(p\times q\))。这种乘性的数量风险,才真正刻画了一家实体企业的处境,也让解变得与既有文献迥然不同。

接着,一个自然的问题是:光有两类风险还不够,公司凭什么要花钱对冲?答案是第三块积木——死重成本 (deadweight costs)。作者假设公司在某些「坏状态」(利润低的时候)会承担额外的成本:直接和间接的破产成本、外部融资的代价、凸的税收表、代理成本……这些都被打包成一个只依赖于公司净利润 \(P\) 的函数 \(C(P)\)。

作者特别强调:这两个假设——代价高昂的坏状态不可对冲的风险——是得到非平凡对冲策略的「最低配置」。没有死重成本,公司根本没理由对冲;没有不可对冲的风险,最优策略不过是把全部敞口卖成远期、得到一个完美对冲,索然无味。正是「数量风险锁不住」这一条,让对冲策略一下子变得丰富起来。

3 模型:把「怎么对冲」写成一道最优化

有了三块积木,模型就呼之欲出了。设一家生产单一商品的公司,在未来 \(t=1\) 实现不确定的产量 \(q\) 和价格 \(p\)。经营利润是产量乘价格再减去成本:

$$f(p,q) = pq - s_1 q - s_2,\qquad s_1, s_2 \in \mathbb{R}_{+}$$

这里 \(s_1\) 是每单位的变动成本,\(s_2\) 是固定成本。作者假设 \((p,q)\) 服从二元正态分布,相关系数为 \(\rho\),期望分别是 \(\mu_p, \mu_q\),标准差分别是 \(\sigma_p, \sigma_q\)。

死重成本则取一个指数形式:

$$C(P) = c_1\, e^{-c_2 P},\qquad c_1, c_2 \in \mathbb{R}_{++}$$

这个函数的妙处在于:利润 \(P\) 低(坏状态)时成本高、利润高(好状态)时成本低,而且处处满足 \(C_{PP}(P) > 0\)(凸性)。参数 \(c_1\) 控制死重成本的整体水平,\(c_2\) 控制它的斜率与曲率——\(c_2\) 越大,坏状态相对于好状态的成本就越触目惊心。

公司能做的,是在 \(t=0\) 签一份在 \(t=1\) 支付 \(x(p,a)\) 的合约,\(a\) 是合约参数(远期张数、执行价等)。在无风险利率为零的设定下,这份合约今天的公允成本是 \(X(a) = \int_p x(p,a)\, g^*(p)\, dp\),其中 \(g^*(p)\) 是 \(p\) 的风险中性定价密度。公司的净利润(扣死重成本前)就是

$$P(p,q,a) = f(p,q) + x(p,a) - X(a)$$

于是,整个「怎么对冲」的问题,被压缩成了一道干净的最优化:

$$ \max_{a}\; \Pi(a) = \int\!\!\int \Big[ \cssId{a1}{f(p,q)} + \cssId{a2}{x(p,a)} - \cssId{a3}{C(P(p,q,a))} \Big] h(p,q)\,dq\,dp - \cssId{a4}{X(a)} $$

如果 \(\partial^2\Pi/\partial a\,\partial a'\) 负半定,价值最大化就等价于求解一阶条件。而当 \(p\) 的边际密度 \(g(p)\) 恰好等于风险中性密度 \(g^*(p)\) 时(即公司不带任何对未来价格的「观点」),一阶条件可以漂亮地简化为:

$$\int\!\!\int -\frac{\partial C(P)}{\partial P}\,\frac{\partial P(p,q,a)}{\partial a}\, h(p,q)\,dq\,dp = 0$$

这个式子的直觉极其重要:公司在权衡每多签一份合约带来的边际收益时,用死重成本的边际值 \(-\partial C/\partial P\) 作为权重去加权。换句话说,对冲不是为了把方差压到最小,而是为了把钱「搬」到死重成本最咬人的那些坏状态里去。这一点,正是后面所有反直觉结论的源头。

4 香草对冲:为什么有时该「少对冲」

先从最朴素的工具说起——远期。线性收益的远期合约 \(x(p,a) = a(p-\mu_p)\) 是现实中最主流的风险管理工具(Hentschel & Kothari (2001) 的样本里,远期和互换占了一家公司衍生品头寸的约 90%)。\(a\) 是买入的远期张数,\(a<0\) 就是卖出。这份合约今天的成本 \(X(a)=0\)。

把它代入一阶条件,作者得到了最优远期张数的闭式解

$$a^* = -\mu_q \;-\; \rho\,\frac{\sigma_q}{\sigma_p}\,(\mu_p - s_1) \;+\; c_1\,\sigma_q^2\,(1-\rho^2)\,(\mu_p - s_1)$$

这个式子值得逐项品味:

作者还顺手证明了一件让人心服口服的事:教科书里大名鼎鼎的最小方差对冲 (minimum-variance hedge),不过是他们模型的一个特例;而且由于最小方差对冲无视了生产技术、也无视了公司对冲的根本理由,它带来的死重成本总是不低于这个最优对冲。换句话说,盯着方差最小,往往不是在替股东省钱。

Warning

这里藏着一个微妙但要命的区分:在完全市场下,一个面临坏状态死重成本的公司会把风险资产敞口完全对冲掉;而一个风险厌恶的投资者却会出于投机目的保留一部分敞口。Froot 和 Stein (1998) 指出过这个区别,Brown 和 Khokher (2001) 做了细致考察——别把公司的对冲问题,错当成个人的组合选择问题。

5 真正关键的一步:定制一份「奇异」合约

远期只是热身。这篇论文最重要的贡献,是把对冲工具的空间彻底放开——不再限定远期或期权,而是问:在所有公允定价的合约里,那个最优的收益函数 \(x(p)\) 长什么样?

作者把这个最优解称为奇异衍生品 (exotic derivative),因为它通常无法用远期加有限个香草期权复制出来。而它与最优远期之间,存在一种极其优雅的关系:

在标的商品的远期价格处,最优远期合约与最优定制合约拥有完全相同的「delta」;而在偏离远期价格的地方,奇异合约通过增加(或减少)凸性来对公司的敞口做精细微调。

这句话值得反复咀嚼。它告诉你:最优定制对冲并不是把远期推翻重来,而是以最优远期为切线,再在两翼按需弯曲。弯向哪边、弯多大,全看公司在那些价格区间里的死重成本有多陡。下图就画出了负相关情形下,这条最优奇异收益曲线的样子。

Figure 5: shows optimal exotic hedges for the negative correlation case

Figure 5: shows optimal exotic hedges for the negative correlation case

那么,公司该往哪个方向弯?作者给出了一条干净的判据:

6 谁最该掏钱买这份奇异合约?

因为解是闭式的,作者得以反过来回答一个对实务极有价值的问题:哪类公司从非线性的奇异对冲里获益最多?

答案落在三个量上:价格与产量的相关性、价格与数量的波动幅度、以及这两种风险的比值。具体而言:

一个值得记下的量级感:在作者的基准参数下(价格和数量波动率各 20%、\(\rho=-0.5\)、\(\mu_p=\mu_q=1\)、\(s_1=0.25\)、\(s_2=0.4\)),若完全不对冲,\(c_2\in\{2,5,8\}\) 分别对应约 \(\{1.3\%, 2.9\%, 4.2\%\}\) 的预期死重成本——注意这是占预期收入而非利润的比例。对一家有 $\$1$ 十亿海外销售的公司,这意味着 $\$13$ 百万到 $\$42$ 百万的真金白银。对冲设计得好不好,差的就是这个数。

(关于现实中公司到底用衍生品对冲掉了多大比例的风险——答案小得令人尴尬——可参见《公司到底用衍生品对冲了多少风险?》。把那篇的实证窘境,和这篇的规范处方对照着读,别有意味。)

7 文献脉络:从「为什么」到「怎么」

把这篇论文放进它所在的脉络里,故事就更清楚了。

最上游是 Modigliani 和 Miller (1958)——在他们的世界里,对冲与公司价值无关。整条「为什么对冲」的研究,本质上都是在罗列 MM 假设被打破的各种方式:Smith 和 Stulz (1985) 给出凸税收与困境成本;Stulz (1984)、DeMarzo 和 Duffie (1991, 1995)、Breeden 和 Viswanathan (1996) 从经理激励与信息不对称切入;Froot、Scharfstein 和 Stein (1993) 则把对冲与「代价高昂的外部融资」连起来,Froot 和 Stein (1998) 进一步把它整合进金融机构的资本预算框架。

而「怎么对冲」这一支,其实早有另外几条暗流:Leland (1980)、Brennan 和 Solanki (1981)、以及 Carr、Jin 和 Madan (2001) 研究的是投资者在给定偏好与信念下的最优收益函数;Duffie 和 Richardson (1991) 在连续时间里求解了用相关期货对冲非交易敞口的动态策略;而农业经济学那一支——Rolfo (1980)、Moschini 和 Lapan (1995)——早就在啃「不确定产量」下的最优期货/期权对冲。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

Brown 和 Toft (2002) 的位置,恰好是把这两条线接上:他们承接了「为什么对冲」积累下来的死重成本动机,又借鉴了「最优收益函数」的求解思路,第一次系统地为一个带不可对冲数量风险的、价值最大化的非金融企业,给出了从远期到奇异合约的完整、闭式的对冲处方。

8 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:最小方差对冲不是风险管理的标准答案吗,为什么这里说它「次优」?

因为最小方差对冲只盯着终端财富的方差,而完全无视公司对冲的理由——死重成本只在某些坏状态里咬人,且咬的力度(\(C_{PP}>0\))随利润非线性变化。最优对冲是用死重成本的边际值去加权敞口,把保护精准地堆到坏状态。作者证明了,正因为最小方差对冲丢掉了生产技术与成本结构这些信息,它带来的死重成本总是不低于最优对冲。

Q:「负相关时该少对冲、甚至买看跌期权」,这个反直觉结论从哪来?

关键在于价格和产量是相乘的。当 \(\rho<0\),价格本身就是产量的天然对冲(歉收时价格上涨补回一部分收入),所以公司不必、也不应把全部预期产量卖成远期——这就是 \(a^*\) 公式里那个正的 \(-\rho(\sigma_q/\sigma_p)(\mu_p-s_1)\) 项。进一步,看跌期权只在价格下跌(往往伴随坏状态)时提供保护,比对称的远期更贴合死重成本的非对称结构。

Q:这和投资者的最优组合选择问题(如 Svensson & Werner)有何本质不同?

两点。第一,那一支解的是单个(或代表性)投资者的效用最大化,而这里是价值最大化的公司——完全市场下公司会把敞口对冲到底,投资者却会出于投机保留敞口。第二,那一支处理的是可加的相关非交易收入,这里是乘性的数量风险(收入 \(=p\times q\)),后者才是实体企业的真实处境,解的形态也因此不同。

Q:「奇异合约的 delta 在远期价格处等于最优远期」这件事,为什么重要?

它给了实务一个极简的落地路径:先按闭式解算出最优远期张数,把它当作切线斜率;再根据相关性符号和数量风险,决定在两翼「买」还是「卖」凸性。换句话说,复杂的定制合约可以被分解成「一个你已经会算的远期 + 一层凸性修正」,而不必从零设计一条曲线。

Q:结论对「二元正态」这个分布假设有多敏感?

作者明确表示,他们的结论对具体的分布假设相对不敏感。正态只是为了得到漂亮的闭式解;定性的处方(负相关买凸性、数量风险大加期权性)依赖的是相关性结构和死重成本的凸性,而非正态尾部本身。

Q:模型把投资、资本结构都当作既定,这个简化会不会太强?

这是作者自觉的取舍。他们把模型定位为「下一期的最优对冲」:工厂已建、研发已投、资本结构已定,这些既昂贵又费时调整的变量在短期内锁死,恰恰是死重成本的来源之一。长期里它们当然与对冲政策联合决定,但把它们固定下来,才能干净地聚焦「短期该怎么对冲」这一问。

(b) 几个可能的研究问题与提案

1. 把这套处方搬到公司债与信用风险上。 【经济故事】这篇的死重成本是个抽象函数,而违约本身就是最典型的「坏状态死重成本」。如果把 \(C(P)\) 显式地由公司资本结构与违约边界生成(呼应《公司随时都可能倒下,期权定价却只盯着还债那一天》的障碍期权思路),就能内生地推出「高杠杆公司该买多少凸性」。 【可行性】中。理论端 doable,需把结构化信用模型与本文的最优收益函数嫁接;实证检验需要公司层面的衍生品头寸与杠杆数据,识别上较难。

2. 外资持有人的「货币 + 数量」联合对冲。 【经济故事】跨国投资者持有的外国公司债,同时暴露在汇率(可对冲)与发行人基本面/赎回(不可对冲的「数量」)之下,正是本文「乘性风险」的现实翻版。 【可行性】中。需要持仓层面的外资数据与货币衍生品使用记录;机制清楚,但「数量风险」的代理变量难找。

3. 危机期间公司债流动性当作不可对冲的数量风险。 【经济故事】把「能不能按需卖出债券」看成一种数量风险,本文框架预测:当价格风险与流动性数量风险负相关、且后者很大时,机构应「买入凸性」(如流动性期权、信用违约互换的非线性头寸)。 【可行性】中。可借 2020 年公司债流动性危机的自然实验(参见《差点死掉的那个市场》),数据可得,但把流动性映射成「数量」需要谨慎建模。

4. 用机器学习从交易商报价里反推「最优奇异收益」。 【经济故事】本文给出的是闭式最优收益函数;现实中场外交易商提供的结构化产品,是否在向这条曲线靠拢?可以把观测到的定制合约收益结构与模型预测对比,量出「实务与最优的差距」。 【可行性】低到中。结构化产品的逐笔条款数据极难获取,识别「公司面对的 \(\rho\) 与 \(\sigma_q/\sigma_p\)」也充满噪声。

9 我的判断

这篇论文的贡献,在于把一个被问了二十年却始终悬空的「怎么」问题,第一次给出了闭式、可操作、且直觉清晰的答案。它最漂亮的地方不是某个公式,而是那句「在远期价格处 delta 相等、两翼增减凸性」——它把一个原本无穷维的合约设计问题,降维成了「远期 + 凸性修正」两个旋钮,并用相关性符号和数量/价格风险比值,告诉你每个旋钮往哪拧。对实务而言,这比任何一个关于「为什么对冲」的定理都更有用。

担忧也是有的,而且主要不在「识别」(这是一篇规范性的理论文,不靠因果识别),而在前提的可观测性。整套处方的输入——价格与产量的相关系数 \(\rho\)、数量波动率 \(\sigma_q\)、以及死重成本函数的形状 \((c_1,c_2)\)——在现实中都极难估准,尤其是「不可对冲的数量风险」本身就因为不可交易而缺乏市场价格作为锚。模型说数量风险越大越该买凸性,可恰恰是数量风险最大的公司,最难知道自己的 \(\sigma_q\) 到底是多少。此外,把投资与资本结构外生固定,虽是合理的短期近似,却也回避了「对冲反过来改变最优杠杆」这层反馈。

我接下来最想看到的,是把这套闭式处方与真实的衍生品头寸数据对账:实务中的公司,究竟是在「负相关时买凸性」,还是被最小方差对冲的直觉带偏了?以及,那些为非金融企业定制奇异合约的交易商,给出的曲线离这条理论最优有多远——那个差距里,藏着风险管理这门手艺真正的水位线。

参考文献