技术,是市场最被忽视的「预报员」

[2009 JFE] Technological Innovations and Aggregate Risk Premiums
Note

本文读的是 Hsu (2009, Journal of Financial Economics):把整个国家的专利和研发支出聚合起来,做成两个「技术冲击」指标,它们能正向地、且彼此独立地预测下一个季度的美股真实收益与风险溢价——一个标准差的专利冲击,对应下季 S&P500 收益约 +2.3%,比 cay 还猛。这条规律不只在美国成立,在中国、印度和大多数 G7 国家也能看到。

1 引言:预测市场,为什么总在「老地方」找钥匙

研究市场收益可预测性 (return predictability) 的文献,已经像一座越堆越高的仓库。人们试过了几乎所有能想到的宏观与金融变量:滞后收益、股息率、期限利差、违约溢价、相对短期利率、账面市值比、股息盈余比、消费财富比 cay、劳动收入消费比……(关于「贴现率会变、所以收益可预测」这件事本身,可参见《贴现率:资产定价的中心议题》)。

但你有没有发现,这一长串候选变量,几乎全是金融与宏观总量——价格、利率、消费、产出。它们描述的是经济这台机器运转得快不快,却很少有人去问:这台机器有没有换上更好的零件

而经济学里有一个几乎不需要争辩的共识:自 Solow (1957) 以来,技术进步被公认为长期经济增长与波动的首要驱动力。既然技术是推动总财富的根本力量,那么一个自然的问题是——

技术创新里,会不会藏着关于未来市场收益的、别人都没读到的信息?

这正是 Hsu (2009) 要回答的。它的核心主张一句话就能说清:技术创新会抬高总量层面的预期股票收益与风险溢价。听上去像常识,但要把它做成一个干净、可检验、且经得起折腾的实证命题,难点全在「怎么度量技术」。

2 怎么把「技术」装进一个数字里

度量技术,作者用了两样东西:专利 (patents)研发支出 (research and development, R&D)

为什么是专利?这是本文一个相当有想法的选择。在金融文献里,R&D 用得多,专利却几乎没人碰(作者数下来,此前只有 Pakes (1985)、Rossi (2005)、Seru (2007)、Acharya & Subramanian (2008) 四篇,且后三篇都在做公司金融)。但作者认为,专利在很多方面比 R&D 更信息丰富:第一,专利是已经实现、随时可投入商用的创新,而 R&D 只是投入;第二,专利法的属地原则,让专利数据更能精确刻画一国的技术进步;第三,专利是知识产权市场上交易最活跃的无形资产——他甚至提到,第一只基于专利的 ETF(Claymore/Ocean Tomo Patent ETF)在 2006 年 12 月 15 日才刚刚上市。

接着是构造。作者先把流量累积成存量:

然后取对数增长率,记为 rpat(专利增长)与 rrd(R&D 增长)。

但真正关键的一步在于:增长率本身是高度持续 (persistent) 的,直接拿去做预测会被趋势污染。于是作者借鉴 Griliches (1984) 与 Campbell (1990, 1991) 的做法,对增长率做随机去趋势 (stochastic detrending)——用当期值减去过去四个季度的移动平均,得到两个「冲击」:

$$\text{Tech1}_t = \ln\!\left(r^{pat}_{t}\right) - \frac{1}{4}\sum_{h=1}^{4}\ln\!\left(r^{pat}_{t-h-1}\right)$$

$$\text{Tech2}_t = \ln\!\left(r^{rd}_{t}\right) - \frac{1}{4}\sum_{h=1}^{4}\ln\!\left(r^{rd}_{t-h-1}\right)$$

Tech1专利冲击 (patent shocks)Tech2R&D 冲击 (R&D shocks)。这一步看似平淡,却是全文识别的支点:它把「技术增长里那部分出乎意料的成分」单独拎了出来——而预期收益要响应的,恰恰是意外,而非可预见的趋势。移动平均法还有两个好处:简单、不依赖主观的模型选择,且天然没有前视偏误 (forward-looking bias)。

Tip

作者特意强调,这里用的是单变量去趋势——因为他找不到任何经济变量能预测专利增长和 R&D 增长本身(呼应 Chen, Roll & Ross (1986) 的做法)。换句话说,技术冲击是「干净」的新息,不是别的预测变量的影子。

值得记住两个数字:专利冲击的一阶自相关是 0.622,R&D 冲击是 0.808——这低于文献里大多数预测变量。也就是说,这两个指标不像股息率那样「黏」得吓人,后面我们会看到,这一点很要紧。

3 它和 Solow 残差,是两回事

读到这里,做宏观的人一定会嘀咕:这不就是 Solow (1957) 残差吗?作者预判了这个问题,并花笔墨把两者划清界限——这恰恰是理解本文的钥匙:

于是悬念变得清晰:如果技术冲击真的有独立的、正向的预测力,那它就不是 Solow 残差的马甲,而是一类被忽视的全新信息。

4 为什么技术创新会抬高预期收益

在亮出回归结果之前,先把经济直觉摆出来。作者给了三条理由,把技术和预期收益连起来:

第一, 技术创新提高了代表性企业的预期生产率与盈利能力。 第二, 技术创新改善整体效率、降低投资成本。 第三,——这条最有意思——技术创新像期权 (options),其收益比实物投资更波动。

把这三条串起来的,是投资基础资产定价里的一个经典等式:企业的预期股票收益 = 预期投资收益(Cochrane (1991)、Restoy & Rockinger (1994) 证明,Liu, Whited & Zhang (2008)、Chen & Zhang (2009) 进一步用它刻画截面)。既然技术创新推高了投资收益,那么股票收益也会随之上行。(投资基础资产定价究竟靠不靠谱,可参见《一个「成功」的模型,为什么经不起逐年对账?》。)三条理由都指向同一个方向:技术创新越多,预期市场收益与风险溢价越高。

5 识别策略与主要结果

5.1 测试设计

作者用的是最朴素也最透明的工具——无条件预测回归 (unconditional predictive regression):把市场组合下一期的真实收益或超额收益,回归到本期的技术冲击和其它预测变量上。

$$r^{s}_{t+1} = \text{const.} + b\,\text{Tech}_t + u_{t+1}, \qquad r^{e}_{t+1} = \text{const.} + b\,\text{Tech}_t + u_{t+1}$$

这里 \(r^{s}\) 是 S&P500 真实收益(指数对数收益减通胀),\(r^{e}\) 是市场溢价(减一月期 T-bill 收益)。因为是无条件回归,系数 \(b\) 可以直接解读为市场收益对技术创新的「平均响应」。如果本文的假说为真,\(b\) 应当显著为正。控制变量则是文献里那一长串老面孔:滞后收益、d2pTermDefaultRReld2ecaySW。标准误同时报告 Newey & West (1987) 与 Hodrick (1992) 两套 t 值——后者对预测回归里的小样本问题更稳健。

5.2 结果:经济上和统计上都站得住

先看单变量回归(Table 2)。一季度向前看:

把冲击标准化后,经济含义一目了然:当本季专利冲击比常态高出一个标准差,下一季 S&P500 的预期收益就上升 2.3%;R&D 冲击高一个标准差,对应 2.2%。作为对照,同样口径下 cay 高一个标准差只带来 1.2%。也就是说,技术冲击的「拳头」比公认有效的 cay 还要硬。

接着,一个自然的问题是:会不会这只是某个已知预测变量的伪装?作者用两两赛马 (pairwise horserace) 回答——把技术冲击和每一个其它预测变量同时塞进回归(Table 3)。结果是:专利冲击的 Newey-West t 值全部在 3.0 以上,远高于其它变量;R&D 冲击在控制其它变量后也依然显著。更扎眼的是,在这个样本期里,其它预测变量大多失灵了——只有 cayRRel 还算显著。这和 Goyal & Welch (2008) 关于「样本外可预测性其实很弱」的发现是一致的(作者把它归因于 1970 年代以来的技术革命浪潮造成了状态均值漂移,呼应 Lettau & Van Nieuwerburgh (2008))。

Note

一个贯穿全文的细节:专利冲击始终跑赢 R&D 冲击。这与作者一开始的论证一致——专利是「已实现」的创新,比作为投入的 R&D 更接近真实的技术进步。

5.3 走出美国

如果这真是一条普遍规律,它就不该只在美国成立。作者把分析推向国际:用中国的专利数据,发现中国专利冲击显著预测中国股指的真实收益与超额收益;用 G6 加印度的国别 R&D 冲击,发现除法国外,所有国家的 R&D 冲击都与未来市场收益和溢价正相关,混合回归 (pooled regression) 里更是显著。技术驱动的可预测性,看来是跨国界的。

6 文献脉络

把这篇论文放回它生长的土壤,脉络其实很清楚。

源头是 Solow (1957):技术进步第一次被正式写进增长核算。但 Solow 残差混入了太多与技术无关的噪声,于是后来者要把「技术」从「残差」里剥出来。

在公司层面,Pakes (1985)、Griliches (1984, 1990) 这一脉,用专利与 R&D 数据去解释企业价值与生产率,奠定了「专利可以当经济指标」的方法论。沿着 firm-level 走下去,是 Austin (1993)、Lev & Sougiannis (1996)、Chan, Lakonishok & Sougiannis (2001) 等对创新与股票收益的横截面研究。

另一条线是收益可预测性:从 Campbell (1990, 1991) 的随机去趋势与预期收益持续性,到 Lettau & Ludvigson (2001) 的 cay,预测变量的「动物园」越建越大。本文恰好站在这两条线的交汇处——把 Pakes 那套测度技术的工具,搬进 Campbell 那套预测收益的框架,第一次在总量层面做出了技术驱动的时序可预测性。

与它最近的邻居是 Pastor & Veronesi (2008):他们论证不确定的技术革命会催生股价泡沫。两者都把技术放进资产定价,但本文谈的是预期收益的可预测性,而非泡沫。(关于创新如何被市场反复错误定价,亦可参见《泡沫里,市场给创新贴错了两次价签》。)

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

7 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:技术冲击和 Solow 残差到底差在哪?这是不是新瓶装旧酒?

不是。三点区别:Solow 残差混入了战争、油价、财政、灾害等非技术扰动;它同时含暂时与永久冲击,而技术创新主要是永久性的;最致命的是符号——Solow 残差对未来收益是负向的,技术冲击却是正向的。符号相反,说明两者捕捉的根本不是同一样东西。

Q:专利冲击的自相关高达 0.622,会不会让「可预测性」只是统计假象?

这是最该警惕的点。Shephard & Harvey (1990) 早就证明,在有限样本里很难把「含自相关成分的过程」和「i.i.d. 过程」区分开(Bansal & Lundblad (2002)、Bansal & Yaron (2004) 都援引过)。作者的辩护是:技术冲击的自相关其实低于文献里大多数预测变量(cay 是 0.880,d2p 是 0.986),而且同时报告了 Hodrick (1992) 这套对持续回归子更稳健的 t 值。所以问题存在,但相对而言并不算严重。

Q:用专利「申请日」而不是「授权日」当生效日,合理吗?

作者坦承这是 Abel (1984) 指出过的强假设。他的理由是:新技术一旦出现就开始影响实体生产——消费者常看到标着「patent pending」的新产品,说明从申请之日起知识产权就已在保护、技术已在起作用。这是个可辩护但非铁板钉钉的选择。

Q:为什么专利冲击的预测力比 R&D 冲击更强?

因为专利是已实现的创新,R&D 只是投入——不是每一美元 R&D 都能变成发明,且不同专利价值悬殊。专利更贴近真实的技术产出,自然信息含量更高。作者用「大数定律」(Scherer、Griliches)为加总辩护:把所有专利和 R&D 加总,特质噪声会被平均掉,留下的是总量技术增长的好测度。

Q:长期(多季度累积)回归里的可预测性,可信吗?

这是预测回归文献的老雷区。长期累积收益回归极易制造虚假显著(Boudoukh, Richardson & Whitelaw (2008) 称之为「长期可预测性的神话」,Stambaugh (1999) 的偏误也在此放大)。本文确实做了 k 季度累积回归,结论应当谨慎对待——短期(一季度)结果比长期结果更可信。(这类小样本陷阱的细节,可参见《用更多的数据,买来更大的偏差》。)

Q:这到底是「风险溢价」还是「错误定价」?

本文止步于记录可预测性,并诚实地在摘要里写「呼吁进一步的理论解释」。它给了三条直觉(生产率、效率、期权性),但没有结构模型把风险价格内生出来。所以严格说,它证明的是「技术创新能预测收益」,而非「技术创新是一个被定价的风险因子」——这是它最大的留白,也是后续工作的入口。

(b) 几个可能的研究问题与提案

1. 技术冲击能预测公司债超额收益与信用利差吗?

【经济故事】既然技术创新抬高预期股票收益,它对信用市场应当也有镜像含义:技术进步降低违约概率、抬高企业资产价值,理应压低信用利差、影响公司债的预期超额收益。股与债对同一束技术新息的反应是否一致,本身就是个有意思的资产定价问题。 【可行性】。专利/R&D 冲击的构造可直接复用;公司债端用 TRACE + Mergent FISD 算月度超额收益,回归框架现成。难点在于公司债样本起于 2002 年,时序偏短,且要小心利差里流动性成分的干扰。

2. 把技术冲击拆到行业层面,去预测行业组合收益。

【经济故事】总量加总掩盖了大量结构信息——半导体的专利冲击和制药的专利冲击,对各自行业组合的预测力很可能天差地别。用行业级专利数据,可以检验「技术驱动可预测性」究竟集中在哪些高技术行业,并把识别做得更干净(行业固定效应 + 时间固定效应)。 【可行性】。USPTO 专利可按技术分类映射到行业,Compustat 的 R&D 本就是公司级、可向上加总到行业。这是本文最自然、最 doable 的延伸。

3. 外资持有人会不会改变技术信息的国际传导?

【经济故事】本文发现技术可预测性跨国成立,但没问在把这条信息定进价格。如果一国股市的外资可投资度更高,全球投资者是否让该国的技术冲击更快、更充分地反映到收益里?这把「技术可预测性」和「投资者结构」连了起来。 【可行性】。可借 MSCI 可投资度变化做准自然实验(思路类似《外资来了,全球新闻就传得更快吗?》),但跨国专利数据的可比性和频率是硬约束。

4. 技术冲击与市场流动性:创新浪潮里,流动性溢价怎么动?

【经济故事】技术革命往往伴随估值不确定性飙升(Pastor & Veronesi 的泡沫故事),不确定性又直接喂给流动性溢价。技术冲击是否系统性地预测了未来的市场流动性与流动性风险定价,是一个把「实体技术」与「市场微观结构」打通的方向。 【可行性】中低。流动性度量(Amihud、买卖价差)易得,但要把因果从「技术冲击 → 不确定性 → 流动性」这条链上识别出来很难,更像是相关性描述而非干净识别。

8 参考文献与我的判断

我的判断。 这篇论文的贡献是扎实而克制的:它第一个把专利这种被金融学冷落的数据,和 R&D 一起,做成总量技术冲击,并证明它们对市场收益与溢价有独立、正向、且经济量级可观(一个标准差约 2.3%)的预测力,还把它和 Solow 残差干净地区分开,最后用国际数据加固。在「预测变量动物园」里,它确实带进了一只新物种。

对识别的担忧也很清楚。第一,这是无条件预测回归,所有「样本内可预测性 ≠ 样本外可用性」的批评都适用,作者自己也承认其它变量在该样本期普遍失灵,那凭什么相信技术冲击不会重蹈覆辙?我更想看到一个诚实的样本外(out-of-sample)检验。第二,文章止于「记录现象」,没有把技术创新内生为一个被定价的风险因子——三条直觉很动人,但没有结构模型,就无法回答「这是风险补偿还是定价错误」。第三,长期累积回归的结果需打折扣。

后续最想看到的,是把这条规律推进信用市场和横截面:如果技术冲击真是关于总财富动态的新信息,它就不该只在股指上留下脚印,而应当在公司债利差、在跨技术行业的截面收益上,留下一致而可识别的痕迹。那时,「技术是市场的预报员」才算从一个引人入胜的相关性,走向一个可被定价的机制。

参考文献