「认证」的反面:原来风投把新股「打折」得更狠

[2004 JFE] Grandstanding, Certification and the Underpricing of Venture Capital Backed IPOs
Note

本文读的是 Lee & Wahal (2004, Journal of Financial Economics):在纠正了「拿不拿风投钱」这个内生选择之后,结论翻了个个儿——有风险投资 (venture capital, VC) 背书的 IPO,首日回报反而更高,1980–2000 年间平均高出 5.010.3 个百分点。作者把这笔「自愿多让的钱」归因于 Gompers (1996) 的「抢风头假说」(grandstanding):年轻的风投基金愿意忍受更深的抑价,因为把公司送上市这件事本身,能替它换来下一轮更大的募资。

1 一个被讲反了的故事

先讲一个几乎写进了所有公司金融课本的「常识」。

一家创业公司要上市,新股的发行价往往定得低于它在二级市场第一天收盘的价格——这个差额,就是所谓的 IPO 抑价 (underpricing),也叫首日回报 (first-day return)。钱就这么白白「留在了桌上」(money left on the table),从老股东流向了打新的人。那么,有没有什么办法能让发行价定得更准、把这笔损失压下去?

一个很自然、也很动听的答案是:找个风险投资人来背书。Megginson and Weiss (1991) 给出了这套逻辑的经典版本,他们称之为认证假说 (certification hypothesis):风投是市场上的老手,反复跟承销商、机构打交道,声誉是它吃饭的本钱;它愿意用自己的声誉替这家公司「担保」真实价值,于是信息不对称下降,发行价可以定得更靠谱,抑价自然就更低。他们在 1983–1987 年的样本里确实看到,VC 背书的 IPO 首日回报比配对的非 VC 公司 4.8 个百分点(t = 3.6)。Barry et al. (1990) 从监督的角度也给出了相互印证的相关性:风投持股越多、董事会服务越久、参与的风投家数越多,抑价越低。

故事到这里很完美:风投是好东西,它让新股定价更公道。

但真正关键的一步在于——这套故事的前提,本身可能就是错的

2 为什么不能直接比?——选择,而不是处理

问题出在「拿不拿风投的钱」这件事,根本不是天上掉下来的随机分配。

Sahlman (1990) 报告过一个数字:一家典型的大型风投每年会收到上千份商业计划书,最后只投十来家。Kaplan and Stromberg (2002) 则用细颗粒的数据描绘了风投在掏钱之前做的尽职调查有多繁琐——风险怎么映射成合约条款、现金流权与控制权怎么在创业者和投资人之间分配(Sahlman, 1990;Gompers and Lerner, 1996;Black and Gilson, 1998;Hellman, 1998)。换句话说,接受风投融资是一场漫长讨价还价的结果,是一个内生选择 (endogenous choice),绝非随机。

这意味着什么?意味着 VC 背书的公司和非 VC 公司,在被风投挑中之前就已经长得不一样了。Lee and Wahal 在 6,413 家 1980–2000 年的 IPO(其中 2,383 家、约 37% 是 VC 背书)里看得很清楚:风投的钱高度集中地流向了软件、生物等技术密集型行业,一半以上的 VC 背书公司总部扎在加州、马萨诸塞和德州;而且风投带上市的公司普遍更小、更年轻、收入更低、更不容易盈利,但承销商质量却更高。

于是问题来了:你拿一家「被风投千挑万选出来的科技初创」去和一家「随便一家上市公司」比首日回报,比出来的差异,到底是风投这个「处理」(treatment) 的效果,还是这两类公司本来就不同所带来的选择性偏差 (selectivity bias)

Warning

这正是 LaLonde (1986) 的著名教训:忽略内生选择的传统计量手段,给出的估计可能不仅是「不准」,而是符号都反了。Lee and Wahal 引的另一个例子来自 Ackerberg and Botticini (2002)——文艺复兴时期托斯卡纳地主与佃农之间的合约选择若是内生的,就会严重扭曲那些本想刻画风险厌恶的系数。

所以,认证假说的旧证据未必是「认证在起作用」,很可能只是「风投挑走了那些本来抑价就低的公司」。要把这两件事掰开,必须先把「选择」这一关过了。

3 识别策略:用「倾向得分」给反事实找替身

Lee and Wahal 没有沿用「OLS 加一个 VC 虚拟变量」或「按行业、规模一对一配对」的老路——那两种做法都默认了只要控制住可观测特征,剩下的差异就能归给风投。他们转而借用了项目评估文献里处理内生处理的整套工具:Rubin (1974, 1977)、Rosenbaum and Rubin (1983)、以及把它发扬光大的 Dehejia and Wahba (1999)。

核心直觉分两步。

第一步,把「是否接受风投」这件事显式地建模。 用一个第一阶段回归(probit/logit)去预测每家公司拿到风投融资的概率,这个概率就是 Rosenbaum and Rubin (1983) 提出的倾向得分 (propensity score)。它把「公司在被挑中前就不一样」的那些维度——规模、年龄、行业、盈利能力、承销商质量等——压缩进了一个单一的数。

第二步,按倾向得分给每一家 VC 背书公司找「替身」。 在非 VC 公司里,挑出那些倾向得分最接近、也就是「本来同样有可能被风投相中、但实际没被相中」的公司,作为它的反事实 (counterfactual)。两者首日回报之差,才是更干净的「风投效应」。这套方法的好处是不强加线性或函数形式:你不是在拟合一条直线,而是在可比的样本里做差。

Tip

想象一个理想世界:同一家公司,我们既能看到它「拿了风投」时的抑价,又能看到它「没拿风投」时的抑价。两者相减就是因果效应。现实里我们永远只能看到其中一个,所以匹配法的全部努力,就是给那个看不见的「平行世界」找一个尽可能像的真人替身。

把这一步做扎实之后,结论彻底反转了。

4 反转:风投让新股「打折」得更狠

先看一个最朴素、还没做内生纠正的对照(论文表 1)。整个 1980–2000 样本里,VC 背书 IPO 的平均首日回报是 26.8%,而按 Megginson and Weiss 方法配对的非 VC 公司只有 19.4%,差出 7.45 个百分点,t 值 5.99方向已经和认证假说相反了。

更有意思的是,作者复刻了 Megginson and Weiss 的 1983–1987 窗口:在这个子样本里,差异变成 −1.5 个百分点(t = 1.1)——风投确实「看起来」降低了抑价。1980 年代整个十年,差异是 −0.6 个百分点(t = 0.6);1990 年代(剔除 1999)是 −0.5 个百分点(t = 0.5)。也就是说,早期文献的结论并没有错,错的是把一个特定年代、特定方法下的结果,当成了普世规律。Ritter and Welch (2002) 早就提醒过,IPO 的很多现象都是非平稳的。

那 1999–2000 呢?这两年是另一个星球。1999 年 VC 背书 IPO 的首日回报比非 VC 高出 46.9 个百分点(t = 6.2),2000 年高出 32.2 个百分点(t = 4.6)。互联网泡沫把一切都放大了。

于是一个自然的担忧是:会不会整个结论都是泡沫两年撑起来的? 作者把样本切开回答:

注意,1980–1998 全样本的平均抑价只有 11.0%,所以这 2.0 个百分点相当于总抑价的近 20%。换个口径——用 Loughran and Ritter (2002b) 的「桌上留钱」度量:样本里非 VC 公司平均在桌上留了 $27 百万,用最保守的 5.0 个百分点估计,VC 公司平均多留了约 $10 百万;即便剔除泡沫,也还多留了约 $4 百万。

这就把问题逼到了墙角:风投上市后通常仍持有大量股权(Megginson and Weiss 报告 IPO 前平均持股 36.6%,上市后仍有 26.3%),更深的抑价对风投自己是实打实的财富损失。一个精明的、声誉至上的金融老手,为什么甘愿主动多让出这笔钱?

5 为什么甘愿吃亏:抢风头

作者排除了几个候选解释。

「投行拿热门新股的份额作交换」这种 quid pro quo?Loughran and Ritter (2002a) 确有此类例子,但主要发生在 1999–2000,而抑价差在更早的年份就存在了,解释不了全样本。

真正的答案,作者认为,是 Gompers (1996) 提出的抢风头假说 (grandstanding)

逻辑链是这样的:风投以有限合伙基金的形式募资,每只基金寿命有限(通常十年),到期必须清盘、把钱还给养老金、捐赠基金这些有限合伙人 (limited partners)。而风投绝大部分回报来自把公司送上市。于是「能不能把组合公司带上市」就成了募下一只基金的命根子——Gompers 描述过:带不出 IPO 的风投募不到新钱,而一旦成功 IPO,往往很快就能再募一笔。

关键在于这件事对不同风投的分量不一样。对老牌、声誉已立的风投,募资不成问题;但对年轻、低声誉的风投,它急需一个「我能带公司上市」的信号,所以它更愿意忍受更深的抑价——把公司尽快推上市,哪怕便宜卖,也要把这块招牌挂出去。Gompers (1996) 因此发现年轻风投「抢风头」:带更年轻的公司上市、容忍更高的抑价,以此换取未来更多的募资。

如果这套机制成立,那么数据里应该出现两个可检验的含义:(一)抑价对低声誉风投的未来募资能力影响更大;(二)低声誉风投更倾向于带更小、更年轻的公司上市。

6 把机制钉死:募资回归

为检验含义(一),作者先给每个 IPO 认定一个「领投」风投——分别用「最早投资」和「投资额最大」两种定义做了两个子样本(稳健性)——然后跑 Gompers (1996) 式的募资回归:被解释变量是领投风投在该 IPO 之后募的下一只基金的规模;解释变量是风投声誉的代理(风投年龄此前做过的 IPO 数)、IPO 抑价,以及二者的交互项

结果有三层:

  1. 未来流入的资本与风投年龄、过往 IPO 数正相关——更有声誉的风投能募到更多钱;
  2. 未来资本也与抑价正相关——忍受抑价是有回报的,这正是「自愿吃亏」的经济动机;
  3. 最关键的是交互项为负:风投年龄 × 抑价、过往 IPO 数 × 抑价都是负的。也就是说,抑价对年轻、做过 IPO 少的风投的募资帮助更大。这正是抢风头假说的核心预言。

为检验含义(二),作者把两个声誉度量分别对 IPO 特征回归,发现年轻的、过往 IPO 少的风投,确实更倾向于带更小、更年轻的公司上市

还有一个时代切口。1980–1996 年平均每年只有 33 家新风投入行,1997–2000 年猛增到每年 106 家。竞争加剧会不会改变在位风投「自愿吃亏换募资」的意愿?分子样本看:未来资本流对抑价的敏感度在后半段更高;而声誉与抑价的交互效应在两个时期都显著——横截面上的「年轻风投更肯吃亏」并没有变。

7 还有一道坎:抑价效应,还是 IPO 效应?

读到这里,一个挑剔的读者会立刻发难:抑价和「成功做成一单 IPO」是绑在一起出现的。你看到「抑价 → 未来募资上升」,会不会其实是「做成 IPO → 未来募资上升」,而抑价只是搭了顺风车?Loughran and Ritter (2002b) 的前景理论解释正指向这一点:发行人把抑价的损失和 IPO 整体的收益加总着看,于是干脆忽略了这块损失。

要把「抑价效应」从「IPO 效应」里剥出来,作者祭出了 Heckman (1979) 两阶段选择模型。他们编了一个覆盖 21 年、每年所有在世风投(包括做了 IPO 的没做 IPO 的)的样本——抑价这个变量只有在公司被带上市时才观测得到,这本身就是一种可观测性偏差 (observability bias)。第一阶段预测某风投在某年是否做了 IPO,并把这个选择喂进第二阶段,第二阶段用 IPO 抑价去解释资本流入。结果:第二阶段里 IPO 抑价的系数为正且显著——即便纠正了「只在做成 IPO 时才看得到抑价」这层偏差,抑价对未来资本流入仍有独立的正向作用。Gompers (1996) 提过的另一个「回收假说」(recycling hypothesis)——老基金的盈利被同一家风投滚进新基金——则解释不了「为什么有些风投能拿到更多钱」「为什么抑价对低声誉风投影响更大」,因此被排除。

至此,抢风头假说不仅在符号上对得上,还顶住了内生性、可观测性、以及若干替代解释的轮番拷问。

8 文献脉络

把镜头拉远,这篇论文站在两条线的交汇处。

一条是 IPO 抑价这条主干:从 Ibbotson and Jaffe (1975)、Ritter (1984) 对「热发行市场」(hot issue market) 的刻画,到 Ritter and Welch (2002) 对 IPO 活动、定价与配售的系统综述,再到 Loughran and Ritter (2002a, 2002b) 关于「抑价为何越来越高」「发行人为何不在意桌上留钱」的追问。

另一条是 风投的角色:Megginson and Weiss (1991) 与 Barry et al. (1990) 立起了「认证 / 监督 → 降低抑价」的旗帜;Gompers and Lerner (1997) 随即质疑认证假说对样本期与方法高度敏感;Gompers (1996) 则另辟一路,提出抢风头假说,把风投行为放进「募资—声誉」的动态激励里去理解。

Lee and Wahal 的贡献,是把项目评估的因果推断工具(Rubin, 1974;Rosenbaum and Rubin, 1983;Dehejia and Wahba, 1999;LaLonde, 1986)引进这场争论,用纠正内生性的匹配法,把「认证 vs. 抢风头」这桩公案翻了案:认证不是普世规律,抢风头才是贯穿全样本的主线。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

(关于风投到底「赚没赚到钱」这个更上游的问题,可参见《看上去赚翻了的风险投资,其实只是一把彩票》;关于抑价与上市后流动性的关系,可参见《打折卖新股,是为了补偿你「将来不好脱手」的那份担心》;关于「7% 承销费」这把固定尺子如何左右新股定价,可参见《7% 这把「固定的尺子」,竟能改写新股的价格》。)

9 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:认证假说被「证伪」了吗?还是只是被限定了适用范围?

更准确地说是被限定了。在 1983–1987 这个 Megginson and Weiss 的原始窗口里,VC 背书的抑价确实低 1.5 个百分点;1980 年代整体也是负的。Lee and Wahal 没有否认那段历史,而是证明了认证效应不是普世、稳定的规律——一旦把样本拉长到 2000 年并纠正内生性,主导力量就变成了抢风头。两套机制可能并存,只是相对强弱随时代而变。

Q:匹配法(倾向得分)真的解决了内生性吗?

只解决了可观测那一半。倾向得分匹配依赖「在可观测特征给定后,处理近似随机」(selection on observables) 这个假设;如果还有不可观测的因素同时决定「被风投相中」和「抑价」,偏差依然在。作者也清楚这点,所以才补了一句「没有任何内生性纠正或控制是完美的」,并用多种设定、多种领投定义反复验证。但严格的因果,匹配法给不了。

Q:为什么风投会「自愿」承受财富损失?这不反常吗?

关键在于风投不是一锤子买卖。它持续地募资—投资—退出,单只基金的抑价损失,要放进「这次成功上市 → 声誉 → 下一只基金更大」这条多期收益里去算。对年轻风投而言,用一笔确定的、当期的抑价损失,换一个能显著放大未来管理费基数的信号,是划算的。这恰恰是交互项为负的经济含义。

Q:1999–2000 的泡沫,会不会污染了整个结论?

作者专门做了切割。剔除泡沫两年后,1980–1998 的抑价差仍有 2.0 个百分点且显著,相当于该期总抑价的近 20%;募资回归里的交互效应在 1980–1996 和 1997–2000 两段都显著。所以结论不是泡沫独家撑起来的,泡沫只是把它放大到了 25 个百分点的极端。

Q:抑价对未来募资的正向关系,会不会只是「做成 IPO」这件事本身的功劳?

这正是 Heckman 两阶段模型要回答的。把「只有做成 IPO 才观测到抑价」这层选择显式建模后,第二阶段里抑价的系数依然为正且显著——抑价有独立于「是否上市」的解释力,不只是 IPO 效应的影子。

Q:这对今天的创业者意味着什么?

一个微妙的提醒:风投的利益和创业者并不完全一致。当一家年轻风投急于「立招牌」时,它可能更乐意接受一个偏低的发行价,因为抑价的代价主要由老股东(含创业者)分摊,而上市带来的声誉收益却归风投独享。选风投时,对方的「资历」不只是能力信号,也可能是动机信号。

(b) 几个可能的研究问题与提案

1. 抢风头会不会蔓延到债券市场?

【经济故事】高收益债 (high-yield) 的承销商同样靠声誉吃饭,新进的承销商是否会用「首笔成交折价」(参见《新债上市第一笔成交,凭什么白赚 47 个基点?》) 去建立招牌、换取后续发行业务?这等于把抢风头从股权一级市场搬到信用一级市场。 【可行性】中。TRACE 能给出债券上市后的首日/首周价格变动,承销商身份与历史发行量可从 SDC/Mergent 构造声誉代理;难点是债券「抑价」的度量噪声大、且一级配售信息不透明。识别上可借鉴本文的匹配法。

2. 外资风投 vs. 本土风投的抢风头强度差异。

【经济故事】外资风投在东道国声誉积累的边际价值可能更高(要打开一个陌生的 LP 与 deal 网络),按本文逻辑,它们或许更愿意「抢风头」,带更年轻的公司上市、容忍更深的抑价。 【可行性】中。跨国 VC-IPO 数据可由 VentureXpert/PitchBook 拼出,本土 vs. 外资的区分清晰;挑战在于跨国制度差异(法律、上市门槛)需要大量固定效应来吸收,识别外资身份的外生性也需小心。

3. 新风投入行潮(1997–2000)作为竞争冲击的准自然实验。

【经济故事】本文已经观察到 1997 年后入行风投翻三倍、且抑价对募资的敏感度上升。能否把这波进入当作对在位风投的竞争冲击,更干净地识别「竞争 → 抢风头强度」的因果,而非仅做子样本对比? 【可行性】中偏低。进入潮本身是内生于互联网热潮的,很难找到与 IPO 市场无关的进入外生变动;可考虑用地区层面(如不同州的 VC 集聚)的进入差异叠加双重差分,但平行趋势是硬伤。

4. 抑价的「桌上留钱」最终落在谁头上?

【经济故事】本文算出 VC 公司平均多留 $10 百万在桌上,但没拆这笔钱在创业者、早期员工、与不同轮次 LP 之间如何分摊。把招股书里的持股结构接上,可以量化抢风头的「再分配」后果。 【可行性】高。招股书(S-1)披露上市前后的持股比例,结合首日回报即可分摊;数据公开、口径清晰,是一个 doable 的描述性 + 横截面项目。

参考文献