换一把尺子,一半的动量利润就消失了

[2003 RFS] Risk Adjustment and Trading Strategies
Note

本文读的是 Ahn, Conrad & Dittmar (2003, Review of Financial Studies):他们不再用 CAPM 或 Fama–French 这类「需要先认定一个模型」的尺子去量动量利润,而是从一组行业组合里非参数地「捞」出一个随机折现因子(pricing kernel)来做基准。结果出人意料——大约 一半 的动量利润被这把尺子消化掉了(风险调整后的业绩约为原始利润的 51%)。更耐人寻味的是:动量组合相对市场组合的 beta 是 负的,可它相对这个非参数定价核的风险测度却乖乖地「该正就正」。换句话说,问题也许不在动量,而在我们一直用错了量风险的工具。

1 一个被「尺子」放大的异象

先把场景摆出来。

自从 Jegadeesh and Titman (1993) 那篇经典之作问世,金融学界就一直被一个简单到近乎挑衅的事实折磨着:买入过去 3 到 12 个月里涨得最好的「赢家」、卖空跌得最惨的「输家」,这个 动量 (momentum) 策略居然能稳定地赚到正的「异常收益」。它简单、它顽固、它在世界各地的市场里反复出现——它看上去就像是一张写在脸上的「市场无效」的判决书。

于是,理性派和行为派吵成一团。一边,Fama and French (1996) 试图用风险因子去解释它;另一边,Barberis, Shleifer, and Vishny (1998) 搬出「代表性偏差」和「保守主义」,Daniel, Hirshleifer, and Subrahmanyam (1998) 搬出「过度自信」与「自我归因」,要把动量利润钉死在投资者的心理偏差上。

但这场争吵里,藏着一个所有人都默认、却很少有人正面拷问的前提。

你说动量是「异常收益」——异常,是相对于「正常」而言的。可「正常」是谁定的?是 CAPM。是 Fama–French 三因子。是某一个被你事先选定的参数化定价模型。Jegadeesh and Titman (1993) 用的是 CAPM,Grundy and Martin (2001) 用的是市场加规模的双因子模型。问题是——如果这些模型本身就是错的呢?

这正是 Fama (1998) 那句著名的警告:长期收益的研究,统统逃不过一个 「坏模型」问题 (bad model problem)。你拿一把刻度本身就歪的尺子去量东西,量出来的「异常」,到底是东西真的异常,还是尺子在撒谎?

Ahn, Conrad, and Dittmar (2003) 这篇文章,做的就是这件事:把那把可能歪掉的参数化尺子先扔掉,换一把不依赖任何具体资产定价模型的、非参数的尺子,再来重新量一遍动量利润。

2 那把「无模型」的尺子:随机折现因子

要理解他们的做法,得先回到资产定价最朴素的那块基石。

在没有套利机会的市场里,Harrison and Kreps (1979) 证明,必然存在一个 随机折现因子 (stochastic discount factor, SDF),也叫 定价核 (pricing kernel)。它满足这样一条定价关系:

$$E[m_{t+\tau}\, x_{i,t+\tau}\mid \mathcal{F}_t] = 1 \quad \forall\, i, t, \tau$$

这里 \(x_{i,t+\tau} = 1 + R_{i,t+\tau}\) 是资产 \(i\) 的总收益(gross return),\(\mathcal{F}_t\) 是 \(t\) 时刻公众可得的信息集,\(m_{t+\tau}\) 就是那个全市场共用的定价核。如果市场上还有一个无风险资产,那么对任意的超额收益(excess return)\(r_{i,t+\tau} = R_{i,t+\tau} - R_{f,t}\),上式就化成更干净的一条:

$$E[m_{t+\tau}\, r_{i,t+\tau}\mid \mathcal{F}_t] = 0$$

别被符号吓到,这一行其实在说一件很直观的事。把它改写一下:

$$E[r_{i,t+\tau}] = -\frac{1}{E[m_{t+\tau}]}\,\mathrm{cov}(r_{i,t+\tau},\, m_{t+\tau})$$

一个资产的期望超额收益,完全由它和定价核的 协方差 决定。直觉是这样的:定价核 \(m\) 在「坏日子」里取值高(你在那时多拿一块钱格外宝贵),在「好日子」里取值低。如果某个资产偏偏在好日子(\(m\) 低)才给你高回报、坏日子里掉链子,那它就是「火上浇油」式的风险资产,市场会要求它给出更高的风险溢价作为补偿。风险,就藏在这个协方差里。

接着,一个自然的问题是:这个 \(m\) 到底长什么样?

参数化的做法,是直接给它一个函数形式。比如 CAPM 就等价于断言定价核是市场收益的线性函数:

$$m_{t+1} = \theta_0 + \theta_1 R_{M,t+1}$$

但这恰恰是「坏模型」风险的来源——你赌的是这个线性形式是对的。

Hansen and Jagannathan (1991) 给出了另一条路:不假设 \(m\) 的形式,而是从一组可交易的「基础资产 (basis assets)」里把满足定价关系、且范数最小的那个 \(m\) 直接「反解」出来。这就是本文方法的源头。他们给出两个解。第一个落在基础资产收益的线性张成空间里,Chen and Knez (1996) 称之为 一价定律折现因子 (law of one price, LOP)

$$m^{LOP}_{t+\tau} = x'_{t+\tau}\lambda$$

它的存在只需要「一价定律」成立。第二个更严格,要求定价核非负,从而排除掉「正收益、非正价格」这种白捡钱的套利机会,称为 无套利折现因子 (no-arbitrage)

$$m^{NA}_{t+\tau} = (x'_{t+\tau}\lambda)_+$$

其中 \((\cdot)_+ \equiv \max(\cdot,\,0)\)。

Tip

这两个 SDF 的区别,正是「一价定律」与「无套利」这两个条件的强弱之分。LOP 只要求「同样的现金流卖同样的价」;无套利则进一步要求定价核处处非负,是更苛刻、也更接近真实市场均衡的条件。本文两套条件都做了一遍。(关于定价核如何在「好日子/坏日子」里取不同的值、又如何被请进期权来检验,可参见《定价核的两副面孔:为什么同样跌 10%,在「平静市」里更让人心痛?》。)

3 把动量利润,按在这把尺子下审问

有了 \(m\),检验就水到渠成了。

动量策略买赢家、卖输家,本身就是一个零成本的超额收益组合 \(r_{TS,t+\tau}\)。如果这个定价核 \(m^*\) 真能给基础资产和它们的所有线性组合定价,那它也必须能给动量组合定价。于是 Chen and Knez (1996) 指出,一个最自然的业绩测度就是:

$$ \delta_\tau = E[\delta_{t,\tau}] = E[\cssId{a1}{m^*_{t+\tau}}\; \cssId{a2}{r_{TS,t+\tau}}] \cssId{a3}{= 0} $$

这个 \(\delta_\tau\),本质上就是一个不依赖任何均衡模型的「异常业绩」。它和 Jensen (1968) 的 alpha 是近亲——事实上 Jensen alpha 只是它在「定价核是市场收益线性函数」这个特例下的样子。区别在于,\(\delta_\tau\) 不需要你事先认定哪个模型是对的。如果 \(\delta_\tau\) 显著大于零,说明这把「最小限度」的尺子也量不平动量利润,那它更可能真的是错误定价;如果 \(\delta_\tau \approx 0\),那动量的成功就可以被「理性的风险补偿」所容纳。

估计它,用的是 Hansen (1982) 的 广义矩估计 (generalized method of moments, GMM)。把 \(x'\lambda\)(或无套利情形下的 \((x'\lambda)_+\))代入,收集误差向量,构造样本矩条件 \(g_T(\lambda)\),再最小化二次型:

$$J_T = T\, g'_T(\lambda)\, W_T\, g_T(\lambda)$$

其中权重矩阵 \(W_T\) 取矩条件协方差的逆。Hansen (1982) 告诉我们,在「无异常业绩」的原假设下,\(J_T \sim \chi^2_{n-k}\)。每个基础资产贡献一个矩条件,动量组合再加一个,于是针对单个策略的检验就服从 \(\chi^2_1\)。

这套机器还能往前推一步。前面假设的是「买入持有」式的静态权重,等于在问:动量利润能不能被基础资产的固定权重线性组合复制出来?但 Chordia and Shivakumar (2000) 提出过一个尖锐的反驳:动量利润其实和商业周期挂钩,是时变的期望收益在作祟,而非什么定价错误。为了回应这一点,本文跟随 Hansen and Singleton (1982),假设条件期望对一组公开的工具变量 \(Z_t\) 是线性的,把定价关系扩展成 \(x \otimes Z\) 的形式,做了条件检验

Note

这里有个关键的「公平性」设计:Chordia and Shivakumar (2000) 那套时变期望收益模型,没有施加任何横截面约束。而本文的框架可以一边允许期望收益时变、一边仍然要求这些收益满足「一价定律」这样的均衡约束。也就是说,它问的是一个更严格的问题:在均衡约束之下,时变的期望收益还能不能解释动量?(动量到底是不是商业周期在背后操盘,亦可参见《会「看天」的 beta:当风险收编了价值与规模,动量却躲进了商业周期》。)

4 数据:用 20 个行业组合,去丈量 16 个动量策略

故事的两端都需要数据。

动量这一端,作者严格照搬 Jegadeesh and Titman (1993):取 CRSP 上 1962 年 12 月 31 日到 1997 年 12 月 31 日的全部纽交所(NYSE)与美交所(AMEX)公司,共 420 个月度观测。每个月按过去 \(J = \{3,6,9,12\}\) 个月的累计收益把股票分成 10 档,最高的是「赢家」,最低的是「输家」,再持有 \(K = \{3,6,9,12\}\) 个月。\(J \times K\) 一共 16 个策略。由于 \(J=12, K=12\) 的策略需要 24 个月才能落地,时间序列被压到 396 个月(1965 年 1 月到 1997 年 12 月)。

尺子这一端,也就是基础资产,作者选的是 行业组合 (industry portfolios)。这背后有讲究。理想中,基础资产应当张成投资者面对的整个机会集,否则就可能错误地拒绝原假设。但动量是从所有 NYSE/AMEX 股票里挑出来的,你没法把全市场都塞进基础资产。怎么办?King (1966) 的经典发现给了答案:在决定股票收益的诸多因子里,市场因子和行业因子几乎捕捉了全部的共同变动——大的正协方差强烈地聚集在行业内部,负协方差则只出现在行业之间。于是作者每年用两位数 SIC 码,构造 20 个等权的行业组合,作为反解定价核的原料。

值得一提的是,这和 Moskowitz and Grinblatt (1999) 的「行业动量」是两回事。后者用行业组合去构造一个买赢家行业、卖输家行业的策略,再用 Fama–French 因子去做参数化风险调整;而本文里行业组合的唯一作用,是反解出定价核 \(m^*\),权重在无条件检验里是固定的(条件检验里只随三个公开信息变量变动)。

先看原始的动量利润有多大。如表 1 所示,赢家减输家的月均收益,随 \(J\)、\(K\) 不同从约 0.06% 一直到 1.16%(\(J=12, K=3\))不等,全 16 个策略平均下来约 70 个基点/月——这是一个相当可观、足以让无数人前赴后继的数字。

Table 1: The “average” profit across all 16 strategies is 70 basis points per

Table 1: The “average” profit across all 16 strategies is 70 basis points per

5 反转:一半的利润消失了,而 CAPM 反而在「火上浇油」

现在,把这 16 个策略,分别按三把不同的尺子量一遍。请盯住三组数字的对比,反转就藏在这里。

第一把尺子,本文的非参数定价核(LOP 条件)。 风险调整之后,动量策略的平均业绩 \(\delta\) 只剩下原始利润的 51%——整整一半被消化掉了。在要求「一价定律」成立时,16 个策略里只有 8 个(10% 水平上是 9 个)的残余利润在 5% 水平上仍然显著。更关键的是,对全部 16 个策略做的联合检验,无法拒绝「无异常业绩」的原假设。如果换上更严格的无套利条件(要求定价核非负),平均异常利润进一步大幅下降,但仍有 8 个策略的利润在 5% 水平上没被解释掉。

第二把尺子,CAPM。 结果完全是另一幅光景:16 个策略里有 9 个的风险调整后业绩比原始利润还高13 个在 5% 水平上依旧显著。也就是说,用市场 beta 去「调整」,非但没削掉动量利润,反而把它放大了。

第三把尺子,Fama–French 三因子。 更夸张——全部 16 个策略不仅都保留了显著的正利润,而且 所有 16 个风险调整后的利润都相对原始水平被放大了

你看出这里的怪异了吗?同一批动量策略,换三把尺子,量出三种结论:非参数尺子说「一半是风险补偿」,CAPM 和 FF 却说「风险调整后利润更高了」。到底是动量本身有问题,还是尺子有问题?

本文最漂亮的一击,就落在这个问题上。

6 真正关键的一步:动量组合的风险,本该随风险溢价上升

作者做了一件大多数实证论文不会做的事——他们停下来,写了一个简单的理论,去推断极端赢家和输家组合的风险测度,相对「真实的」定价核,应该长什么样

结论是:动量组合(赢家减输家)的风险测度,应当随真实的市场风险溢价递增。直觉并不难:当风险溢价升高时,高风险资产的预期收益被推得更高,更容易在近期跑成「赢家」;于是赢家组合天然地装载了更高的风险敞口。所以一个会「装风险」的动量组合,它的风险测度本就该是正的、且随风险溢价水涨船高的。

那么实证里看到了什么?

相对 市场组合 估计时,动量组合的 beta 是 负的——这和「风险测度应当随风险溢价递增」的预测完全相反。这正是为什么用 CAPM 量动量会「越量利润越大」:一个负 beta 的组合,CAPM 会认为它本该要求更低的收益,于是它实际赚到的钱全被记成了「异常」,甚至被放大。

但当作者改用自己反解出的那个非参数定价核去估计动量组合的 beta 时,这些风险测度 更接近理论预测的行为:该正的正了,该随风险溢价动的也动了。

于是反转完成了。问题从来不在动量利润「凭空冒出来」,而在于我们一直用的市场 beta 是被错误设定的。动量策略之所以在 CAPM/FF 这些基准下显得如此「超凡脱俗」,与其说是因为它从过去价格里榨取了什么信息,不如说是因为风险调整这件事本身被做歪了。CAPM 类的尺子刻度是反的;换上一把刻度正确的尺子,一半的「神话」当场蒸发。

Warning

必须老实交代一个前提:这把尺子的「正确」,建立在一个未经检验的假设上——那 20 个行业组合本身是被正确定价的。如果行业组合自己就不在均衡里,那本文充其量只是把定价之谜从「动量」搬到了「行业组合」头上。作者对此直言不讳。这也是为什么他们反复强调:非参数调整解释了大约一半,剩下的一半,无法排除是真正的错误定价

7 文献脉络

把这条线索理一理,会看到一个很清晰的「方法论接力」。

最上游,是两块定价理论的基石:Harrison and Kreps (1979) 用无套利推出了随机折现因子的存在性,Hansen (1982) 给出了估计它所需的 GMM 工具。真正把「从一组基础资产反解出 SDF」变成可操作技术的,是 Hansen and Jagannathan (1991)——最小范数折现因子、非负性条件,都出自这里。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

与此同时,动量这条实证线在另一头独立生长:Jegadeesh and Titman (1993) 确立了动量这一事实并用 CAPM 量它;Fama and French (1996) 试图用因子风险收编它;Barberis, Shleifer, and Vishny (1998) 等行为派则把它解读为心理偏差的产物。Moskowitz and Grinblatt (1999) 把动量延伸到行业层面,Grundy and Martin (2001) 用条件双因子模型,Chordia and Shivakumar (2000) 主张时变期望收益就能解释它。

Chen and Knez (1996) 是承上启下的关键一环——他们把 Hansen–Jagannathan 的非参数 SDF 改造成了业绩评价的工具,原本是用来评共同基金的。Ahn, Conrad, and Dittmar (2003) 的贡献,正是把这把「无模型业绩尺」第一次系统地对准了动量这个最顽固的异象,并由此指出:参数化基准之所以解释不了(甚至放大)动量,根子在风险调整的设定误差。

8 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:「非参数」到底非参数在哪?它不还是要选基础资产、选工具变量吗?

准确地说,它非参数在不假定定价核的函数形式——不像 CAPM 断言 \(m\) 是市场收益的线性函数。但它确实有两处「人为选择」:基础资产(这里是 20 个行业组合)和条件检验里的工具变量。所以它不是「无假设」,而是把假设从「模型形式」转移到了「基础资产张成机会集」上。这也正是文章最大的软肋所在。

Q:解释掉一半,到底算成功还是失败?

取决于你站哪一队。对行为派,这是好消息——剩下的一半 5% 水平上仍显著,错误定价无法被排除。对理性派,这也是好消息——一把最小限度的均衡尺子,无需任何特定模型,就抹掉了一半利润,而且联合检验拒绝不了「无异常业绩」。文章的克制恰恰在于:它不替你站队,只把「尺子坏了」这件事钉死。

Q:为什么 Fama–French 反而把利润放大了?这不是更好的模型吗?

「更好」是相对于解释规模和价值而言的。对动量,FF 三因子里的 HML 恰恰站错了边——动量赢家往往是「成长」而非「价值」,于是 FF 模型预测它们该有更低收益,结果实际收益全被记成 alpha 并被放大。这正是「坏模型问题」的鲜活样本:一个在别处很好用的模型,换个对象就把信号读反了。

Q:动量组合的市场 beta 为负,这本身可信吗?

这是个被反复记录的稳健事实,不是本文的统计噪声。赢家和输家在不同的市场状态下被选出来,使得多空组合的市场暴露天然偏负。本文的贡献不是发现这个负 beta,而是论证了它与理论预测相悖,从而把矛头指向 CAPM 的设定误差,而非动量本身。

Q:条件检验为什么只「略微」降低利润,这是否打了 Chordia–Shivakumar 的脸?

不能这么说。本文的条件检验只用了一组有限的公开信息变量,且额外施加了均衡约束,与 Chordia and Shivakumar (2000) 无横截面约束的设定不可直接比较。结果是:在均衡约束下,时变期望收益对动量的「补充解释力」相当有限,尤其对短持有期。这是对那条解释的一个边界性约束,而非彻底否定。

Q:把谜题从动量搬到行业组合,是不是一种「循环论证」?

这是最致命的质疑,作者也承认。整个推断的有效性,押在「20 个行业组合被正确定价」这一未经检验的前提上。如果行业组合本身有定价误差,那「一半利润是风险」的结论就站不住。所以严格地说,本文证明的是一个相对命题:相对于被正确定价的行业组合,动量利润有一半是风险补偿。

(b) 几个可能的研究问题与提案

1. 把这把「无模型尺子」搬到公司债动量上

【经济故事】公司债同样有动量,但信用市场的风险结构(违约、流动性、利率)远比股票复杂,参数化模型更不可信,「坏模型问题」更严重。用非参数 SDF——基础资产换成评级×久期分组的债券组合——重新量公司债动量,能直接检验「债券动量是风险还是错误定价」。 【可行性】中。数据上 TRACE + 评级/久期分组组合可得;难点在债券收益的非同步成交与流动性噪声会污染 GMM 矩条件,需要先做干净的收益度量。识别依赖「基础组合被正确定价」这一老问题,在信用市场尤其脆弱。

2. 外资持有人会改变定价核吗?

【经济故事】当一个市场的边际投资者从本地人变成外资时,「真实的」定价核可能随之改变。可以用同一套非参数框架,在外资持股比例不同的市场(或同一市场不同时期)分别反解 SDF,看动量/价值利润被解释的比例是否随外资进入而系统性变化。 【可行性】中偏低。需要跨国或可投资度(investability)变动的自然实验来制造外资比例的外生变化;SDF 的跨市场可比性是技术难点。但这是把「定价核」与「投资者结构」直接挂钩的少见角度。

3. 流动性中性化之后,动量的风险测度还成立吗?

【经济故事】动量利润已被指出与「最难交易的股票」高度重叠(参见《动量利润的「纸面富贵」》)。若在基础资产里加入流动性分组组合,反解出的 SDF 是否会进一步吃掉动量利润?这能区分「动量是风险」与「动量是流动性补偿」。 【可行性】高。Amihud 非流动性分组 + 行业组合作为联合基础资产,GMM 框架几乎可以直接复用,数据全部公开可得。是本文一个低成本、高价值的直接延伸。

4. 用现代机器学习的 SDF 替换 Hansen–Jagannathan 的线性张成

【经济故事】本文的 LOP 折现因子落在基础资产的线性张成空间里。如果真实定价核是非线性的,线性 SDF 会系统性低估其解释力。用神经网络/核方法估计一个非线性的非负 SDF,再量动量,被解释的比例可能远超 51%。 【可行性】高。近年条件 SDF 的机器学习估计已相当成熟,本文的检验统计量(\(\delta\)、\(J_T\))可平移使用,唯一要小心的是过拟合与样本外验证。

9 我的判断

这是一篇方法论价值远大于结论价值的论文,而它最聪明的地方,恰恰在于它清楚这一点。

它的真正贡献不是「动量利润少了一半」这个数字——这个数字依赖于行业组合被正确定价的强假设,换组基础资产很可能就变。它的贡献,是把整个关于动量的争论,从「它是不是异象」拽回到一个更前置、也更被忽视的问题上:你凭什么相信你量风险的那把尺子? 当 CAPM 把动量的 beta 量成负、FF 把利润越调越大,而一把不依赖任何模型的尺子却让动量组合的风险测度「乖了」时,最朴素的奥卡姆剃刀指向的,是参数化基准的设定误差,而非投资者的集体非理性。这是对 Fama (1998)「坏模型问题」最具操作性的一次回应。

对识别的担忧,我最在意两点。其一,是那个反复出现的「行业组合被正确定价」前提——它把谜题搬了家,却没消灭它,文章对此足够诚实,但读者不该忘记。其二,是基础资产「张成机会集」的程度无法验证:若 20 个行业组合张成不足,就会错误地拒绝原假设,从而高估残余的异常利润;反过来,若过度拟合,又会人为消化掉真实的错误定价。这两个方向的偏差,作者用 Monte Carlo 做了部分缓解,但终究无法根除。

后续我最想看到的,是把这套「无模型业绩尺」配上更灵活的非线性、非负 SDF(机器学习是天然的工具),并系统地检验「基础资产选择」对结论的敏感性——到底是行业组合这把尺子的功劳,还是任何一组合理的基础资产都能消化掉一半动量?回答了这个问题,我们才能知道:被解释掉的那一半,究竟是风险,还是又一次「换错了尺子」。

参考文献