改革的公文盖了章,市场却还没「开门」——怎样给一国的金融开放找出真正的生效日

[2002 JFE] Dating the Integration of World Equity Markets
Note

本文读的是 Bekaert, Harvey & Lumsdaine (2002, Journal of Financial Economics):一纸看起来「全面」的开放法令,如果没能引来外资真金白银的流入,对一个新兴市场的运行其实没什么影响。作者不预设任何资产定价模型,只给一组金融与宏观时间序列设定一个简约式(reduced-form)VAR,再用一个内生的结构断点检验去「让数据自己说」一体化是哪天发生的。结论很扎心:这些被数据估出来的断点通常晚于官方公布的资本市场改革日——也就是说,「市场自由化(liberalization)」和「市场一体化(integration)」根本不是同一回事。

1 一个被公文骗了很多年的问题

先讲个看似无聊、却把整篇文章逼出来的常识。

一个新兴市场要「对外开放」,照例会有一连串动作:放松外汇管制、允许外国人持有本地股票、放开利润汇出、推动国企私有化、挂出第一只在卢森堡或纽约上市的国家基金(country fund)与存托凭证(ADR)。每一步都有明确的日期,写在官方公报里,盖着章。于是大家很自然地拿这些日期当作「这个市场被纳入世界资本市场的那一天」。

可问题是——盖章的那天,钱真的进来了吗?

作者在引言里把这层窗户纸捅破得很干脆:「看起来全面的监管变化,如果没能带来外国组合资金的流入,对一个发展中市场的运行就几乎没有影响。」换句话说,自由化是一个法律事件,一体化是一个经济事件,两者之间可能隔着好几年、甚至根本对不上。投资者可以早在政策出台前就通过 ADR、国家基金「绕道」进场(Foerster and Karolyi, 1999 就发现 ADR 的股价反应往往先于正式跨境挂牌);反过来,一纸法令也可能因为缺乏可信度而长期无人理会。

于是一个自然的问题浮出来:既然官方日期靠不住,我们到底该怎么给「一体化」定一个日子?

这正是全文的题眼。注意:他们不是要解释一体化为什么发生,而是要回答一个更朴素、却是一切后续研究前提的问题——它哪天发生的?(用作者的话说,「the dating question is the subject of our research」。)只有先有了这个日期,你才谈得上去估一体化对成本、对增长、对波动的影响。

2 为什么不预设模型,而要「让数据自己断」

一个看上去更「高级」的做法,是写一个刻画动态一体化的资产定价模型。Bekaert and Harvey (1995) 就用过一个机制转换(regime-switching)框架,让市场在「分割」和「一体化」两种状态间渐变。

但作者对这条路有清醒的不满:这类模型「难以设定,而且经常被统计上拒绝」;更尴尬的是,即便市场看起来已经完美一体化,国际资产定价模型仍然解释不了投资者那种顽固的本国偏好(home bias)。把一个会被拒绝的结构模型当尺子,量出来的日期能信吗?

所以作者干脆退后一步,做了一个方法论上的关键取舍:

Tip

不对资产定价模型表态。 只假设:变量在一体化前后各自服从一个平稳过程,且能被一个向量自回归(vector autoregression, VAR)很好地描述。一体化就体现为这个 VAR 的参数在某个未知时点发生了结构断点(structural break)

这个取舍有两重好处。其一,既然是简约式,就让所有参数都可以断——不只是均值,连自回归系数、方差都允许变化,这才对得起「市场运行方式整个变了」这件事。其二,也是更妙的一步:他们不止盯着收益率。收益率在新兴市场里噪声大得惊人,单看它很可能什么都看不出来。于是作者把视野撑开到一整组变量:净股权资本流、股息率(dividend yield)、市值/GDP 比、跨个股相关性、国家风险评级……这些变量里,股息率、市值/GDP 这类反映「永久性价格变化」的指标,理论上会比收益率更清楚地显出断点——因为一体化若真的压低了权益资本成本,价格会一次性跳升、预期收益会下台阶(Bekaert and Harvey, 2000;Henry, 2000a)。

到这里,思路其实已经很完整了:多变量、全参数、内生断点。但真正让这套方法「能用」的,是下面这个听起来反直觉的统计学事实。

3 方法的心脏:为什么「多塞几条序列」能把日期估得更准

这一节是全文的发动机,值得一步步拆。

3.1 最简单的情形:已知没有回归元

先看最干净的设定。令 \(y_t\) 为一个 \(n\times 1\) 向量,真实过程是 \(y_t = C + e_t\),我们去估计

$$y_t = C_0 + C_1\,\mathbf{1}(t>k) + e_t$$

这里 \(\mathbf{1}(\cdot)\) 是示性函数,\(t>k\) 时取 1。\(C_1\) 就是「断点幅度」:如果某日期 \(k\) 真有结构断裂,\(C_1\neq 0\);零假设是无断点(\(C_1=0\))。

对一个给定的 \(k\),检验「所有序列在 \(k\) 处同时无断点」可以构造一个 Wald 型统计量,其极限分布是 \(\chi^2(n)\)(因为 \(C_1\) 有 \(n\) 个元素)。

可我们并不知道 \(k\)。怎么办?很朴素:把每一个可能的日期都试一遍,在每个 \(k\) 上算出统计量 \(F_T(k)\),取这一整条序列的最大值,作为估计的断点日。Bai, Lumsdaine and Stock(下称 BLS,1998)证明,这个「逐点统计量序列」的极限分布是

$$F^n(\tau) = \{\tau(1-\tau)\}^{-1}\,\lVert W(\tau) - \tau W(1)\rVert^2$$

其中 \(\tau = k/T\) 是断点占样本的比例,\(W(\cdot)\) 是 \(n\) 维独立标准布朗运动,\(\lVert\cdot\rVert\) 是欧氏范数。对它取最大,就得到所谓 Sup-Wald 检验;使 \(F_T(k)\) 最大的那个 \(k\) 就是估计的断点。直觉上,这就是在所有候选日期里,挑出「前后差异被放得最大」的那一天。

3.2 真正反直觉的一步:置信区间随序列数收缩

断点估出来了,但学术良心要求给个置信区间。BLS 的核心定理给出,置信区间可以写成(论文 Eq. (5))

$$\hat{k} \pm a_{p/2}\,(\hat{C}_1'\,\hat{S}^{-1}\,\hat{C}_1)^{-1}$$

\(a_{p/2}\) 是某个极限分布 \(V^n\) 的分位数,\(\hat{S}\) 是误差协方差矩阵的估计。现在把它写到最透亮的一种特例:当各序列误差不相关、\(\hat{S}\) 为对角阵时,区间退化为下面这条——这也是整篇方法论里我最想让你盯住的一个公式:

$$ \cssId{a1}{\hat{k}} \;\pm\; \cssId{a2}{a_{p/2}} \cssId{a3}{\left(\sum_{i=1}^{n}\frac{\hat{C}_{1i}^2}{\hat{S}_i}\right)^{-1}} $$

为什么说它反直觉?请看求和符号里的每一项 \(\hat{C}_{1i}^2/\hat{S}_i\) 都严格为正。于是:

这就是整套方法的灵魂所在,也是作者反复强调「同时检验多条经济时间序列」的底气:在新兴市场这种样本又短、噪声又大的环境里,你没法靠「等更多数据」来把断点估准;但你可以靠「多看几个会在同一天一起变天的变量」把它估准。 一句话——精度来自序列的「合唱」,而非单条序列的「独白」。

3.3 推广到有平稳回归元的真实情形

真到了实证,模型当然不止一个常数。作者把它推广到带平稳回归元(自回归滞后项、以及「世界变量」这类外生工具)的一般 VAR(论文 Eq. (6)):

$$y_t = (\Gamma_t'\otimes I_n)\gamma + \delta_t(k)(\Gamma_t'\otimes I_n)S'S\delta + e_t$$

这里 \(\delta_t(k)\) 在 \(t哪些参数允许断裂。\(S=I_r\) 就是「全系数变化」模型,\(S=s\otimes I_n\)(\(s=(1,0,\dots,0)\))则只允许均值漂移。本文要的是前者——既然是简约式,凭什么只让均值动?相应地,对一个 \(p\) 阶、\(n\) 维的 VAR,若允许全部系数断裂,检验统计量的维度高达 \(n(np+1)\)。带回归元后,断点的置信区间、Sup-Wald 的极限分布与上面如出一辙,结论照搬。

Warning

别小看「让所有系数都断」这件事。这是第一篇真正实现「多变量 + 全系数」结构断点检验的论文,所以作者花了一整节做蒙特卡洛,确认这套检验在小样本里的水平(size)与功效(power)靠不靠谱。结果(论文表 1)显示:墨西哥收益率、不含世界工具、只测均值断点时,经验水平 0.063、功效只有 0.177;可一旦加入世界工具且允许全系数断裂,功效直接飙到 1.000(代价是水平略升到 0.105);智利收益率的功效也从均值断点的情形提升到 0.725 一档。「全系数 + 多序列」确实比「只测均值」检出力强得多——这正是方法论那条 \(1/n\) 直觉在有限样本里的回响。

4 把统计断点翻译成经济故事:哥伦比亚的例子

光有一个会冒红灯的统计检验还不够。断点检验只会告诉你「这里断了」,它不会告诉你「为什么断」。要把一个冷冰冰的日期接回经济世界,得靠对每个国家逐一整理的事件年表——这部分功课,作者在 Bekaert and Harvey (1998) 里已经替 20 个国家做完了。

拿哥伦比亚当例子,年表密密麻麻:1991 年初放松外资企业利润汇回;1991 年 3 月再融资外债;1991 年 10 月,比索放开自由浮动,同时 Resolution 51 允许外国人投资本地股市至多 10%;1991 年 11 月Resolution 52 干脆取消了这 10% 的上限;12 月电信业私有化;1992 年 4 月哥伦比亚投资公司(一只国家基金)在卢森堡挂牌;1993 年 2 月第一只 ADR 以 144A 私募形式发行;1994 年 11 月一家哥伦比亚公司的 ADR 登陆纽交所。

面对这样一团乱麻,结构断点检验能教我们什么?作者给了三层用法,层层递进:

而把这三层用法叠到 20 个国家上,最终浮出的那个反转,正是摘要里那句话:内生断点日期通常晚于官方自由化日期。 公文盖章在前,市场真正「开门」在后。法律上的自由化,远不等于经济上的一体化——这就是全篇要钉死的那一根钉子。

Note

顺带一提,作者也很诚实地留了个尾巴:如果一体化过程会逆转(比如马来西亚 1997 年底事实上中止了货币可兑换),那么用「一次永久性断点」来刻画就有风险。他们的直觉是:只要机制足够持久,一次机制转换就近似于一次永久断点,检验仍有功效;但若恰好只有两三次频繁切换,方法可能就不太灵了。这是个诚实的 caveat,也是后续研究的口子。

5 文献脉络

把这篇论文放回它的坐标系,能更清楚地看到它在「补哪一块」。

最早的国际资产定价文献,关心的是「分割 vs. 一体化」的静态刻画:Errunza and Losq (1985) 的温和分割(mild segmentation)模型给出了分割世界里只有本地现金流波动才被定价、一体化后才转向与世界市场的协方差。这是一切的理论底座。

接着,一个自然的问题是:现实中的市场并非非黑即白地一步跨过去,而是渐变的。Bekaert and Harvey (1995) 用机制转换框架去建模时变的一体化程度,是「动态化」这一支的代表作。但正如前文所说,这类结构模型难设定、常被拒。

文献脉络时间线
文献脉络时间线(按发表年份排布;红色为本文)

与此同时,计量经济学那边长出了另一条线:Banerjee, Lumsdaine and Stock (1992) 把递归与序贯的单位根、趋势断点检验做了系统梳理;到 Bai, Lumsdaine and Stock (1998),多变量平稳/非平稳系统的断点检验成型,并给出了那个「置信区间随序列数收缩」的关键结果。本文真正的「巧劲」,就是把这把计量利器,第一次扛进了市场一体化的定日期问题里,且把它从「只测均值」推广到「全系数断裂」。

然后,在实证后果这一侧,Henry (2000a, 2000b) 与 Bekaert and Harvey (2000) 记录了一体化带来的价格跳升、预期收益与资本成本下降。本文恰好站在这些研究的上游:要谈一体化的后果,先得有可信的一体化日期——而这正是它提供的东西。(关于外资进场对长期实体经济与市场的影响,可参见《外资真是「蝗虫」吗?》;关于新兴市场里「数不清的零」如何量出流动性的价格,可参见《数不清的「零」》。)

6 评论与延伸(Q&A + 研究方向)

(a) 几个可能的疑问

Q:「自由化」和「一体化」到底差在哪?为什么非要分这么细?

自由化是政策/法律事件(一纸允许外资进场的法令),一体化是经济结果(外资真的进来、价格按世界因子重新定价)。本文最核心的发现就是二者在时间上对不齐,且一体化通常更晚。混用这两个概念,会让所有「测一体化后果」的研究把事件日期定错——这正是本文的价值所在。

Q:内生断点日期「晚于」官方日期,会不会只是因为外资进场本来就有时滞,而非自由化无效?

两种解释并不互斥,而恰恰是本文想区分的。检验先确认收益生成过程确实断了(否则说明自由化无效),再用逐国事件年表把断点对到具体事件上。「晚」本身就携带信息:它说明可信度、资金真正流入、价格充分反应需要时间,公文日期不能直接当一体化日期用。

Q:不预设资产定价模型,是优点还是偷懒?

是经过权衡的优点。结构化的国际资产定价模型「难设定、常被拒、还解释不了本国偏好」,拿一个会被拒的模型当尺子,估出的日期不可信。简约式 VAR + 内生断点,代价是放弃了对「为什么一体化」的结构解释,但换来对「何时一体化」这个更基础问题的稳健回答。

Q:那条「区间随序列数 1/n 收缩」的性质,是不是太好以至于不真实?

它有前提:这些序列得在同一时点断裂,且断点幅度方向一致。塞进一条根本不在那天断的序列不会害你(大不了贡献为零),但如果你错误地假设多条序列「共同断裂」、而它们其实各断各的,那「人为收紧」的区间就会误导你。所以本文很谨慎地按「时机」给变量分组——价格类变量可在预期时即跳变,外资持有量却只能在政策允许后才变化。

Q:如果一体化会逆转(如亚洲危机后的资本管制回潮),这套方法还成立吗?

作者自己承认这是软肋。若过程更像频繁的机制切换而非一次永久断点,方法功效会下降;恰好两三次切换是最糟的情形。他们的补救是诉诸机制的持久性,并建议用 Bai and Perron (1998) 的多重断点检验做稳健性——但这与「多变量框架」的优势目前还无法兼得。

Q:为什么要扩到股息率、市值/GDP,而不是只看收益率?

因为新兴市场收益率噪声极大,单看它常常什么都测不出。理论上,一体化压低资本成本会带来永久性价格变化,这在股息率、市值/GDP 这类「水平型」变量上显现得比在「差分型」的收益率上更干净。把会一起变天的变量凑成合唱团,正是 §3 那条精度逻辑的实证落地。

(b) 几个可能的研究问题与提案

  1. 把这套「内生定日期」搬到公司债与信用市场的开放上。 【经济故事】新兴市场债市对外开放(如纳入摩根大通 GBI-EM、放开 QFII 额度)同样存在「政策日 ≠ 资金真正进场日」的错位,且债市价格对资本成本的永久性变化可能比股市更敏感。 【可行性】。需要逐国债市开放年表 + 外资持债占比、利差、流动性指标构成多变量 VAR;识别策略可直接照搬 BLS 内生断点。难点是新兴债市高频数据短、缺口多。

  2. 用断点的「官方—内生」时滞长度,去预测一体化的实体后果。 【经济故事】如果「时滞越长 = 改革可信度越低」,那么时滞本身应能预测后续增长、投资、资本成本下降的幅度。这把本文的「日期」变成一个右手边变量。 【可行性】中高。20 国时滞已可由本文方法产出,宏观结果数据(Henry, 2000a 等已用)现成;横截面回归即可,样本小是主要约束。

  3. 把「一体化会逆转」正面做掉:多重断点 × 多变量。 【经济故事】亚洲危机、2010 年代的资本管制回潮,都提示一体化是可逆的。能同时享受「多重断点」与「多变量精度」的检验,是本文明确指出却尚未填上的空白。 【可行性】低到中。这是计量方法论的硬骨头(作者自己说「迄今没有方法能兼得二者」),更适合做方法论贡献而非纯实证。

  4. 外资持有人结构与一体化日期的交互。 【经济故事】同样一纸开放令,引来的是长期养老金还是热钱套利者,决定了价格反应是「永久跳升」还是「短暂脉冲」,进而影响断点的清晰度与置信区间宽度。 【可行性】。需要按投资者类型拆分的跨境持仓数据(如 TIC、各国登记数据);识别可用本文断点 + 持有人结构做交叉。(与这一方向相关的微观证据,可参见《外资能买的股票,为什么更「抖」?》《外资真有「信息劣势」吗?》。)

我的判断

贡献。 这篇文章最漂亮的地方,不在某个惊人的实证数字,而在一个概念上的澄清加一件方法上的趁手工具:它把「自由化」和「一体化」彻底拆开,并把 BLS 的多变量内生断点检验——尤其是「置信区间靠横向叠加序列、而非纵向加长样本来收窄」这一性质——第一次用在了正确的问题上。对一个样本又短、噪声又大的研究对象,这个 \(1/n\) 的视角几乎是量身定做。它是后续无数「一体化后果」研究无声的地基。

对识别的担忧。 我最不踏实的有两点。其一,「共同断点」是把双刃剑:精度全靠各序列真的在同一天断裂,一旦把不同步的序列硬凑成合唱团,那条漂亮的收窄性质就会反过来骗你给出过窄、过自信的区间——而「哪些变量该归一组」终究带有研究者的判断。其二,一次性永久断点的设定,对「可逆的一体化」天然不友好,作者自己也承认在「恰好两三次切换」时方法会失灵。把统计断点对到具体经济事件,仍依赖逐国年表那一步人工叙事,这既是它接地气的优点,也是它主观性的来源。

后续想看到什么。 我最想看到的,是把这套方法搬到信用市场:债券利差对资本成本的永久性变化也许比股票收益更干净,而新兴债市开放的「政策日 ≠ 资金日」错位同样严重。再往前一步,如果能用「官方—内生」时滞的长短去预测一体化的实体后果,那本文产出的这些日期,就从一个被解释的对象,变成了一把能去解释世界的尺子。

参考文献