银行招谁来管风险：压力测试买来的，是「真本事」还是「过考试」？

[2025 JFE] Bank Stress Testing, Human Capital Investment and Risk Management

Thomas Schneider, Philip E. Strahan, Jun Yang

Jun He June 01, 2026

银行监管压力测试人力资本双重差分

Note

本文读的是 Schneider, Strahan & Yang (2025, JFE)：作者用 Lightcast 的海量招聘广告，直接「看」银行想雇什么样的人来管风险。结论有点扎心——大银行（"大到不能倒"）比小银行更不愿意投资风险管理人才；压力测试确实把这部分需求往上拉了一点，但拉动的几乎全是「为通过考试而生」的那一小撮岗位，对占了九成以上的其余风险管理岗位，几乎没有外溢。

1 引言：风险管理是银行的「核心业务」，可我们几乎不知道银行在为它雇谁

一家银行到底是干什么的？教科书会告诉你：承担风险、管理风险，这是银行创造价值的核心。可吊诡的是，关于银行「如何管理风险」这件事，学界研究来研究去，盯着的几乎都是塔尖上的那几个人——CEO 的薪酬激励 (Fahlenbrach and Stulz, 2011)、董事会里有没有金融专家 (Ellul and Yerramilli, 2013; Minton et al., 2014)、再不然就是抽象的「风险文化」(Fahlenbrach et al., 2012)。

这当然都重要。高管和董事会定下基调、设好激励，是风险管理的「司令部」。但司令部发了号令，总得有人去执行吧？真正趴在数据上跑模型、搭压力测试框架、盯着合规红线的，是大量的中低层员工。这些人是谁？银行愿不愿意花钱雇他们？——这恰恰是一片空白。

本文的巧思，就在于换了一个观察的窗口：与其去问银行「实际雇了谁」（那既受供给又受需求影响，数据也不存在），不如去看银行「想雇谁」。招聘广告，正是银行「显示性偏好」(revealed preference) 的直接证据。它登出来的每一条岗位、每一项技能要求，都在说：这是我现在最想往组织里补的能力。

于是作者拿到了 Lightcast（前身 Burning Glass）的全量在线招聘数据，干了三件事：度量银行对风险管理人力资本的需求，看它和银行规模、和过往风险的关系，再看压力测试这个外生冲击如何重塑了这种需求。

2 先把「风险管理需求」量出来：从「贴了标签」到「真要本事」

这篇文章一半的功夫，花在了怎么把一份招聘广告翻译成一个可比的数字上——这也是它方法论上最讲究的地方。

首先，最粗的口径，叫 RM Jobs：只要一个岗位要求任何一种风险管理相关技能，就算数。按这个口径，银行发布的风险管理岗位从 2010 年的约 26,000 条，一路涨到 2021 年的 167,000 条以上，六倍多的增长。金融危机之后，风险管理在银行里越来越重要，这一点数据讲得明明白白。

Figure 1: Labor Demand for RM Jobs and RM Skills

接着，一个自然的问题是：贴着「风险管理」标签的岗位，真的都在管风险吗？作者翻了翻岗位描述，发现大量所谓的「风险管理」岗，要的其实只是泛泛的商务能力，甚至是沟通、市场、客户关系这类「软技能」。换句话说，RM Jobs 这个口径注了水。

于是真正关键的一步来了：作者用一个结构化主题模型 (structural topic model, STM) 去清洗岗位描述里的技能清单，只保留那些真正需要定量、建模、分析能力的成分，构造出更精细的度量 RM Skills——它等于一家银行所要求的全部技能里，被模型判定为「真·风险管理」那一类的占比。RM Skills 的样本均值只有 6.64%，而 RM Jobs 的均值是 20.86%。两者一比就明白：贴着风险管理标签的岗位里，不到三分之一（≈0.0664/0.2086）的技能是货真价实在管风险的。论文 Table 1 用一个含八个假想岗位、两家银行的「玩具例子」，把 STM 怎么把 Basel、CCAR、Stress Testing 这些词归到「资本监管」主题、把 Software Engineering 归到「技术」主题，一步步演示得很透明。

Tip

这个清洗动作不是炫技。它把「为了 HR 凑数而挂的风险岗」和「真要硬核定量本事的岗」分开，后面所有关于「压力测试到底买来了什么」的结论，全靠这把更细的尺子才量得出来。

作者进一步把风险管理技能拆成五个子类：运营 (Operations)、技术 (Technology)、放贷 (Lending)、合规 (Compliance)、资本监管 (Capital Regulation)。记住后两个——技术与资本监管——它们是后文反转的主角。

Figure 2: Demand for RM Skills Decomposition

3 第一个发现：越大的银行，反而越不愿为「管风险」花钱

有了尺子，先看一个横截面事实（都已经把时间趋势、压力测试暴露等变量控制掉）：银行规模越大，对风险管理技能的需求反而越低。在最简单的模型里，最大的那批银行（资产 >$50 billion）作为总招聘的一部分，需求的风险管理技能比小银行少 30%（相对于全样本均值）。

Figure 4: Demand for RM Skills by Size

这本身已经有点反直觉了——大银行风险敞口更大、更复杂，按理该更需要管风险的人才对。但更说明问题的是第二个事实：小银行会对过往的风险「做出反应」——历史业绩波动率（即风险）高的小银行，会增加风险管理需求；而大银行呢？波动率、以及三个基于市场的风险度量，与它们的风险管理需求几乎不相关。

把这两件事放在一起，作者读出的故事是「大到不能倒」(Too Big to Fail, TBTF)：既然管理者和债权人都心知肚明——规模越大、越复杂，政府出手相救的概率越高（参见 Strahan, 2013 的综述）——那么花真金白银去雇昂贵的风控人才、把风险摁下去的激励，自然就被削弱了。论文还给了几条更细的佐证：道德风险效应只在大银行身上显现，资本充足率正向影响它们的风控需求、存款/资产比则负向影响——这些都和 TBTF 的预测吻合。

这是本文与既有 TBTF 文献的真正分野。以往研究 TBTF，盯的是规模、关联度与风险结果（贷款损失、股价波动、杠杆、次级债成本）。本文第一次直接度量了银行为对冲风险而投入的、代价高昂的人力资本。逻辑很干净：如果 TBTF 削弱了做这种昂贵投资的激励，那大银行面对更高风险时，就该比别人更「无动于衷」——数据正是这么显示的。

4 识别策略：压力测试，一个能「往里看」的外生冲击

接着，一个自然的问题是：既然大银行的风控激励可能被 TBTF 扭曲了，那监管能不能补上这一课？金融危机后最核心的监管创新——压力测试 (stress test)——恰好提供了一个识别的支点。

为什么压力测试适合做识别？因为它给了研究者银行内部的时序变动 (within-bank variation)：被纳入测试的银行集合逐年在变，测试对每家银行的冲击在时间上也不同。这就允许作者上面板模型，同时扫掉「不随时间变的银行特征」和「时间趋势」。

制度背景值得交代清楚（这也是识别的关键）。监督式压力测试 2009 年从 SCAP 起步，成功稳住了市场信心；随后美联储把它常态化、改名为 CCAR，并且直到 2020 年都把银行的分红、回购计划直接捆在测试结果上——这让 CCAR 有了实打实的「牙齿」。2011–2018 年，资产 >$50 billion 的银行都要接受 CCAR 与 DFAST。CCAR 不光看定量的资本充足率路径，还有一道定性评估，审银行内部风险管理的流程、实践与治理是否「靠谱」。

作者据此构造了三组度量：

Stress Tested：当年是否被测、以及是否预期下一年被测（Stress Tested_{i,t+1}）；
失败指标：从 0 到 2，0 = 美联储无异议，1 = 有条件不反对（conditional non-objection），2 = 直接否决（failure）；
资本暴露：严重不利情景下压力后资本比率相对期初的跌幅，用各行自己 DFAST 模型、美联储情景算出。

Warning

作者很诚实地交代了识别的天花板：金融危机后的监管变化是「铺天盖地」的，很多维度对所有美国银行同时生效，单挑出压力测试的因果效应本就困难。面板设定扫掉时间趋势的同时，可能也扫掉了监管变化的一些重要共同效应。更妙的一点是——风控本事强的银行本就更容易通过考试，所以「为压力测试而雇人 → 通过测试」这条反向因果，只会衰减而非夸大他们的核心发现。这把潜在的内生性方向讲清楚了。

5 反转：压力测试确实买来了人才，但只买在「考试范围」里

于是反转出现了。压力测试到底有没有把大银行的风控需求拉起来？

第一层答案是「有」。预期下一年要被测的银行，会增加对压力测试专属风控劳动力的需求；而且这种增加在考砸了的银行身上最强烈。论文 Figure 7 的动态双重差分 (dynamic difference-in-differences, DiD) 把这个时间结构画得很清楚：需求的抬升集中在测试启动前后，而非更早，缓解了「事前趋势不平行」的担忧。

Figure 7: Dynamic Difference-in-Difference around Stress Test Initiation

但真正关键的一步，是去看这部分被拉动的需求，到底落在哪类技能上。这里数字非常说话：

与压力测试岗位相关的技能里，超过一半属于资本监管 (capital regulation)，而其余风控岗这一比例只有约 15%；
技术类技能（数据仓库、数据治理、软件开发）在压力测试岗里也被显著高配——因为银行要自建模型、向监管提交海量颗粒化数据；
这两个子类——资本监管与技术——也正是回归里对压力测试反应最大的两类，而放贷、合规两类几乎纹丝不动。

Figure 6: Demand for RM Skills: Stress Test Jobs vs. Other RM Jobs

第二层、也是最冷峻的答案：压力测试岗在这些银行全部风控技能需求里占比不到 10%。剩下那 90% 以上的风控需求，无论是「是否暴露于测试」还是「测试结果好坏」，作者都找不到任何影响。

把这两层合起来，文章的中心论点终于落地：压力测试激发出来的银行风控招聘，很大程度上只是为了跨过监管门槛——是「为了过考试而刷题」，而不是「为了真懂了而读书」。说压力测试改善了银行整体风险管理实践？证据很弱。

这也解释了为什么作者对近年的监管松绑忧心忡忡。2018 年 Dodd-Frank 改革给了美联储自由裁量权，资产在 $50–250 billion 之间的银行可以少受测试约束——硅谷银行 (Silicon Valley Bank, SVB) 2018 年已越过 $50 billion 门槛，却因此没被拉进 CCAR。更要命的是，2020 年起美联储弱化并停止公开披露定性评估——而本文恰恰发现，正是这个定性评估部分，对银行的技能投资影响最大。换句话说，监管把那根最能撬动银行真去补风控短板的杠杆，自己拆掉了。

Tip

SVB 后来怎么倒的，是另一个故事——社交媒体如何把它推下悬崖，可参见《四天，一条推特，挤垮一家银行》。而本文提供的是更早一环的注脚：在挤兑发生之前，监管的「豁免」可能早已让它少雇了一批本该补上的风控人手。

6 文献脉络

这条线的源头，是金融危机后人们对「银行为什么没管好风险」的集体追问。早期的答案大多落在治理与激励上：Fahlenbrach and Stulz (2011) 看 CEO 激励，Ellul and Yerramilli (2013) 和 Minton et al. (2014) 看董事会与风控架构的强弱。与此并行的，是「大到不能倒」这条主线——Strahan (2013) 的综述把规模、关联度如何扭曲风险激励梳理得很清楚。

另一条支流，是压力测试本身。它从 2009 年的 SCAP（Hirtle et al., 2009 复盘了这场「宏观审慎监管的第一课」）起步，逐渐成为银行监管的核心工具。随之而来的研究多聚焦在它对信贷供给的影响（Acharya, Berger and Roman, 2018; Cortés et al., 2020; Doerr, 2021 等），以及关于信息披露的理论权衡（Goldstein and Leitner, 2018）。再往后，Hirtle, Kovner and Plosser (2020) 直接问「监管检查能不能改善银行业绩」。而作者自己更早的 Schneider, Strahan and Yang (2023) 已经在追问：压力测试究竟是「公共利益」还是「监管俘获」？

本文站的位置很清楚：它把「TBTF 扭曲风险激励」和「压力测试是否纠偏」这两条线，用一个全新的、可直接观测的对象——银行想雇什么样的人——焊在了一起，回答了一个此前几乎无人触碰的问题：压力测试到底有没有重塑银行内部的风险管理实践。答案是：只在很窄的范围内，重塑了。

7 评论与延伸（Q&A + 研究方向）

(a) 几个可能的疑问

Q：用招聘广告度量「风险管理投入」，可信吗？会不会银行嘴上招、实际不招？

这正是作者反复强调的取舍。招聘数据捕捉的是需求（banks want to hire），而非实际雇佣（既含供给又含需求）。作者明确承认拿不到按技能划分的实际雇佣数据——美国银行根本不存在这样的系统数据。好处是「想雇谁」恰恰是显示性偏好，是银行 HR 政策意图的干净信号；代价是它只是「意图」，不等于落地。对本文的核心问题——银行打算把资源往哪类风控能力上投——这个口径反而比实际雇佣更贴切。

Q：大银行风控需求更低，会不会只是因为它们规模经济、单位招聘里风控占比天然更低？

这是最该警惕的替代解释。作者的回应不在「水平值」而在「斜率」：小银行会随过往波动率上升而增加风控需求，大银行却对波动率和三个市场风险度量都无反应。一个单纯的规模经济故事很难解释这种「对风险的敏感度差异」，而 TBTF 的道德风险故事可以。

Q：压力测试的效果，会不会被反向因果污染——是风控强的银行更容易被选进测试？

测试纳入主要由 $50 billion 资产门槛这条相对机械的规则决定，且作者用面板扫掉了银行固定效应与时间趋势。更关键的是方向判断：风控强→更易通过测试，会让「为测试雇人→通过」这条反向链路衰减他们的估计，而非制造虚假的正效应。所以真实效应只会比报告的更强，不会更弱。

Q：「90% 的风控岗没被影响」会不会只是因为那 90% 本来就和压力测试无关、不该被影响？

这恰恰是作者想说的政策点，而非缺陷。压力测试的初衷被宣传为「全面提升银行风险管理」，如果它真有这种外溢，理应在放贷、合规等非测试类风控需求上看到松动；但数据显示这些子类几乎不动。所以「无影响」本身就是证据：测试的作用被限制在「过考试」的窄通道里。

Q：为什么偏偏是「资本监管」和「技术」两类技能反应最大？

因为这两类正是压力测试机制上最吃重的地方：CCAR/DFAST 要求银行自建定量模型、提交颗粒化数据，这天然拉动数据仓库、数据治理、软件开发（技术），以及围绕资本充足率路径的建模（资本监管）。反过来，这也暴露了测试的「应试」属性——它强化的是「算给监管看」的能力，未必是「把贷款风险看准」的能力。

Q：2020 年后停止披露定性评估，为什么作者认为这是坏消息？

因为本文发现，对技能投资影响最大的恰恰是那个定性评估部分——它审的是内部风控流程、实践与治理，而非冷冰冰的资本比率。一旦不再披露、不再施压，银行补这块短板的外部动力就消失了。作者据此推断，近年改革「很可能已经降低了银行对风控人才的投资」。

(b) 几个可能的研究问题与提案

压力测试招聘 → 真实风险结果
【经济故事】本文止步于「需求」，但最该问的下一问是：那些为通过测试而疯狂招人的银行，后续的贷款损失、波动率、乃至危机中的存活率，真的更好了吗？如果「应试型招聘」对真实风险毫无改善，那 TBTF 纠偏的政策叙事就要打个问号。
【可行性】中。Lightcast 招聘度量已有，风险结果用 Compustat/Call Report 可得；难点在识别——需借门槛规则做模糊断点或动态 DiD，把「招聘」与「结果」的因果链打通。
风控人力资本与公司债定价
【经济故事】如果一家银行（或发债企业）对风控人才的需求，是其未来风险的领先指标，那债券市场会不会给「风控招聘冷淡」的发行人要更高的利差？这把劳动力需求和信用风险定价接上了。
【可行性】中。把 Lightcast 招聘数据匹配到发债主体，用 TRACE 的二级市场利差做被解释变量；识别上可用同行业招聘强度变化作为外生扰动。流动性维度尤其值得做——风控薄弱是否在压力期放大了债券流动性折价。
外资持有人是否在意银行的「风控人力资本」
【经济故事】外资机构往往更依赖可观测、可比的治理信号。银行的风控招聘强度能否解释外资持有比例？若外资偏好风控投入更扎实的银行，则招聘数据成了一条新的「软信息」管道。
【可行性】中偏低。需把 Lightcast 与 13F/国际持有数据匹配，识别难——持有与招聘可能同受第三因素驱动，需找招聘的外生冲击（如本地劳动力市场供给变化，借鉴 Hershbein and Kahn, 2018 的招聘冲击思路）。
监管松绑（2018 Tailoring / 2020 停披露）的「准自然实验」
【经济故事】2018 年门槛上调、2020 年停止披露定性评估，给了一个清晰的「监管压力骤减」冲击。被「豁免」的那批银行（$50–250 billion）的风控招聘，是否相对从未被测银行出现了断崖式下滑？这能直接检验本文的核心担忧。
【可行性】高。事件时点明确、处理组/对照组清晰，Lightcast 面板覆盖到 2021 年，标准的 DiD 即可上手。这是本文最自然、也最 doable 的延伸。
STM 度量法的可迁移性
【经济故事】把「招聘文本 → 技能主题占比」这套 STM 流水线搬到其他领域：ESG 人才、合规人才、AI/数据科学人才，能否度量企业在某种能力上的「真实投入 vs 标签注水」？本文的方法本身就是一个可复用的资产。
【可行性】高。方法现成（Roberts, Stewart and Tingley, 2019 的 stm 包），数据可得；门槛在于针对新主题构造可信的「真·技能」过滤，并做人工校验。

8 我的判断与参考文献

贡献。这篇文章最漂亮的地方，是把一个老问题（TBTF 扭曲风险激励、压力测试是否有效）拽到了一个全新的、可观测的对象上——银行想雇谁。用招聘文本 + STM 直接度量「为管风险而投入的人力资本」，这是方法论上的真创新，也让「压力测试只买到了应试能力」这个略显悲观的结论，有了扎实的微观证据。九成风控需求不受测试影响、且对 2020 年停披露定性评估的担忧，都是有政策分量的发现。

对识别的担忧。我有三点保留。其一，招聘需求终究只是「意图」，从意图到真实风控能力之间隔着供给、隔着落地，文章没法闭合这一环。其二，作者自己也承认，金融危机后的监管是「全面铺开」的，面板扫掉时间趋势的同时可能也扫掉了压力测试真正的共同效应——「窄效应」会不会部分是设定造成的低估，值得更多稳健性。其三，TBTF 解释虽自洽，但「大银行风控需求低」也可能掺杂规模经济、外包、集团内部调配等替代机制，文中的「斜率证据」很有力，却未必能完全排除。

后续想看到什么。最想看的，是把这条「招聘 → 真实风险结果」的链路打通：那些应试型招聘的银行，危机中到底活得更好还是一样脆。其次，是 2018/2020 两次监管松绑作为准自然实验的干净 DiD——如果被豁免的银行风控招聘真的应声而落，本文的担忧就从「推断」变成了「证据」。

参考文献

Acharya, V.V., Berger, A.N., Roman, R.A. (2018). Lending implications of US bank stress tests: costs or benefits? Journal of Financial Intermediation 34, 58–90.
Cortés, K.R., Demyanyk, Y., Li, L., Loutskina, E., Strahan, P.E. (2020). Stress tests and small business lending. Journal of Financial Economics 136(1), 260–279.
Doerr, S. (2021). Stress tests, entrepreneurship, and innovation. Review of Finance 25(5), 1609–1637.
Ellul, A., Yerramilli, V. (2013). Stronger risk controls, lower risk: evidence from US bank holding companies. Journal of Finance 68(5), 1757–1803.
Fahlenbrach, R., Prilmeier, R., Stulz, R.M. (2012). This time is the same: using bank performance in 1998 to explain bank performance during the recent financial crisis. Journal of Finance 67, 2139–2185.
Fahlenbrach, R., Stulz, R.M. (2011). Bank CEO incentives and the credit crisis. Journal of Financial Economics 99(1), 11–26.
Frame, S., Gerardi, K., Willen, P. (2015). The Failure of Supervisory Stress Testing: Fannie Mae, Freddie Mac, and OFHEO. Federal Reserve Bank of Atlanta Working Paper 2015–3.
Goldstein, I., Leitner, Y. (2018). Stress tests and information disclosure. Journal of Economic Theory 177, 34–69.
Hirtle, B., Kovner, A., Plosser, M. (2020). The impact of supervision on bank performance. Journal of Finance.
Hirtle, B., Schuermann, T., Stiroh, K. (2009). Macroprudential supervision of financial institutions: lessons from the SCAP. Federal Reserve Bank of New York Staff Report 409.
Minton, B., Taillard, J., Williamson, R. (2014). Financial expertise of the board, risk taking, and performance: evidence from bank holding companies. Journal of Financial and Quantitative Analysis 49(2), 351–380.
Roberts, M.E., Stewart, B.M., Tingley, D. (2019). stm: an R package for structural topic models. Journal of Statistical Software 91, 1–40.
Schneider, T., Strahan, P.E., Yang, J. (2023). Bank stress testing: public interest or regulatory capture? Review of Finance 27(2), 423–467.
Strahan, P.E. (2013). Too big to fail: causes, consequences, and policy responses. Annual Review of Financial Economics 5, 43–61.