16. Learning under Uncertainty

Jun He May 30, 2026

资产定价Asset Pricing 学习Learning 贝叶斯更新Bayesian Updating 卡尔曼滤波Kalman Filtering 风险溢价Risk Premium 学习笔记Study Note

Note

本章研究代理人对未知参数进行学习时的资产定价。设总红利对数 $\delta_t=\ln D_t$ 的漂移 $\mu_\delta$ 未知，只取离散值 $\{\mu_1,\dots,\mu_n\}$ 之一。§16.1 用贝叶斯法则推导信念 $\Pi_t(\mu_s)$ 的连续时间更新方程，发现信念创新 $d\hat Z_t$ 仍是标准布朗运动，信念过程是鞅；在同质代理人下刻画价格-红利比与风险溢价，并证明学习会降低风险溢价当且仅当主观加权漂移低于客观条件均值；再推广到异质代理人与状态切换 (regime shifting) 模型。§16.2 给出连续时间 Kalman 滤波：观测方程 + 状态方程，用联合正态与条件正态引理 (Lemma 16.1) 导出隐含状态 $\beta_t$ 的均值动态 (16.37) 与方差动态 (16.39)（Riccati 型）。

Note

This chapter studies asset pricing when agents learn about an unknown parameter. The log aggregate dividend $\delta_t=\ln D_t$ has unknown drift $\mu_\delta$, taking one of the discrete values $\{\mu_1,\dots,\mu_n\}$. §16.1 uses Bayes' rule to derive the continuous-time updating equation for the belief $\Pi_t(\mu_s)$, finding that the belief innovation $d\hat Z_t$ is still a standard Brownian motion and the belief process is a martingale; under homogeneous agents it characterizes the price-dividend ratio and risk premium, and shows learning lowers the risk premium iff the subjective-weighted drift is below the objective conditional mean; it then extends to heterogeneous agents and a regime-shifting model. §16.2 gives continuous-time Kalman filtering: an observation equation + a state equation, deriving the latent state $\beta_t$'s mean dynamics (16.37) and (Riccati-type) variance dynamics (16.39) via joint normality and a conditional-normal lemma (Lemma 16.1).

16.1 Homogeneous Beliefs and Discrete Set of States

16.1.1 Setup

同质代理人（同信念，可视为单一代理人）。一只股票价 $P_t$、派息 $D_t$，$\delta_t\equiv\ln D_t$ 满足 (16.1)：

Homogeneous agents (same beliefs, treated as one agent). A single stock with price $P_t$ pays $D_t$, with $\delta_t\equiv\ln D_t$ satisfying (16.1):

$$d\delta_t=\mu_\delta\,dt+\sigma_\delta\,dZ_t,\tag{16.1}$$

$\{Z_t\}$ 标准布朗运动，$\sigma_\delta$ 已知，$\mu_\delta$ 未知且只取 $\{\mu_1,\dots,\mu_n\}$ 中某一值、永不变动。$\{\mathcal F_t\}$ 为信息流。代理人的主观先验（0 期）信念 $\Pi_0(\mu_s)=\mathbf P\{\mu=\mu_s\mid\mathcal F_0\}$，$\sum_{s=1}^n\Pi_0(\mu_s)=1$、$\Pi_0(\mu_s)\geq0$；后验（$t$ 期）$\Pi_t(\mu_s)=\mathbf P\{\mu=\mu_s\mid\mathcal F_t\}$。

16.1.2 Characterize the Belief Updating

由贝叶斯法则 (16.2)：

$\{Z_t\}$ standard BM, $\sigma_\delta$ known, $\mu_\delta$ unknown, taking one fixed value from $\{\mu_1,\dots,\mu_n\}$ that never shifts. $\{\mathcal F_t\}$ is the filtration. The subjective prior (period 0) belief $\Pi_0(\mu_s)=\mathbf P\{\mu=\mu_s\mid\mathcal F_0\}$, $\sum_{s=1}^n\Pi_0(\mu_s)=1$, $\Pi_0(\mu_s)\geq0$; the posterior (period $t$) $\Pi_t(\mu_s)=\mathbf P\{\mu=\mu_s\mid\mathcal F_t\}$.

16.1.2 Characterize the Belief Updating

By Bayes' rule (16.2):

$$\Pi_{t+dt}(\mu_s)=\frac{\mathbf P\{d\delta_t\mid\mu=\mu_s;\mathcal F_t\}\cdot\Pi_t(\mu_s)}{\sum_{j=1}^n\mathbf P\{d\delta_t\mid\mu=\mu_j;\mathcal F_t\}\cdot\Pi_t(\mu_j)}.\tag{16.2}$$

由 (16.1)，似然为正态 (16.3)：$\mathbf P\{d\delta_t\mid\mu=\mu_s;\mathcal F_t\}=\frac{1}{\sqrt{2\pi}}e^{-\frac12\frac{(d\delta_t-\mu_s dt)^2}{\sigma_\delta^2 dt}}$。代入 (16.2)，约去公因子并整理得 (16.4)：

By (16.1) the likelihood is normal (16.3): $\mathbf P\{d\delta_t\mid\mu=\mu_s;\mathcal F_t\}=\frac{1}{\sqrt{2\pi}}e^{-\frac12\frac{(d\delta_t-\mu_s dt)^2}{\sigma_\delta^2 dt}}$. Substituting into (16.2), cancelling common factors gives (16.4):

$$\Pi_{t+dt}(\mu_s)=\frac{e^{\frac{\mu_s d\delta_t}{\sigma_\delta^2}-\frac12\frac{(\mu_s)^2}{\sigma_\delta^2}dt}\cdot\Pi_t(\mu_s)}{\sum_{j=1}^n e^{\frac{\mu_j d\delta_t}{\sigma_\delta^2}-\frac12\frac{(\mu_j)^2}{\sigma_\delta^2}dt}\cdot\Pi_t(\mu_j)}.\tag{16.4}$$

用 $e^x\approx1+x+\frac12 x^2$ 二阶泰勒展开（$d\delta_t^2=\sigma_\delta^2 dt$，丢弃 $\circ(dt)$）得 (16.5)：$e^{\frac{\mu_s d\delta_t}{\sigma_\delta^2}-\frac12\frac{(\mu_s)^2}{\sigma_\delta^2}dt}\approx1+\frac{\mu_s d\delta_t}{\sigma_\delta^2}$。代入 (16.4) 并整理（$\mathbb E_t[\mu_\delta]\equiv\sum_j\mu_j\Pi_t(\mu_j)$）得信念动态 (16.6) 与创新 (16.7)：

The second-order Taylor expansion $e^x\approx1+x+\frac12 x^2$ (with $d\delta_t^2=\sigma_\delta^2 dt$, dropping $\circ(dt)$) gives (16.5): $e^{\frac{\mu_s d\delta_t}{\sigma_\delta^2}-\frac12\frac{(\mu_s)^2}{\sigma_\delta^2}dt}\approx1+\frac{\mu_s d\delta_t}{\sigma_\delta^2}$. Substituting into (16.4) and simplifying (with $\mathbb E_t[\mu_\delta]\equiv\sum_j\mu_j\Pi_t(\mu_j)$) gives the belief dynamics (16.6) and innovation (16.7):

$$d\Pi_t(\mu_s)=\Pi_t(\mu_s)\,(\mu_s-\mathbb E_t[\mu_\delta])\,\frac{1}{\sigma_\delta}\,d\hat Z_t\tag{16.6}$$

$$d\hat Z_t=\frac{d\delta_t-\mathbb E_t[\mu_\delta]\,dt}{\sigma_\delta}\tag{16.7}$$

Note

Remark 16.1. (16.7) 的 $d\hat Z_t$ 与 (16.1) 的 $dZ_t$ 不在同一信息流下。我们假设 $\sigma_\delta$ 已知；$\mathbb E_t[\mu_\delta]$ 在 $t$ 已知（$\{\Pi_t(\mu_s)\}$ 在 $t$ 已知）；$d\delta_t$ 在 $t$ 可观测。故 $d\hat Z_t$ 在 $t$ 可观测（属于 $\hat Z_t$ 生成的 $\hat{\mathcal F}_t$），而 $dZ_t$ 是 $t$ 时的冲击、不在 $\mathcal F_t$ 中。

Remark 16.2. 也可把 $\{\Pi_t(\mu_s)\}_{s=1}^n$ 理解为 $n$ 个影响红利漂移的潜在状态变量；此诠释下 $d\delta_t$ 有动态但 $\mu_\delta$ 无不确定性——两种诠释不矛盾，只是同一结构的不同读法。

观察。 ① $\mathbb E_t[d\hat Z_t]=0$、$\mathrm{Var}(d\hat Z_t)=\mathrm{Var}(dZ_t)=dt$，故 $d\hat Z_t\sim\mathcal N(0,dt)$，$\{\hat Z_t\}$ 也是标准布朗运动。② $\Pi_t(\mu_s)=1$ 或 $0$ 时 $d\Pi_t(\mu_s)=0$：若完全（概率 1）确信在/不在某状态，主观概率不再变。③ 可验证 $\sum_s\Pi_t(\mu_s)=1$、$\Pi_t(\mu_s)\geq0$ 对所有 $t$ 成立（信念碰到 0 后动态立即停止，不会变负；$\sum_s d\Pi_t(\mu_s)=0$）。

16.1.3 Special Case: Homogeneity of Agents

进一步设代理人在风险容忍 $\rho_i$、初始财富份额 $\omega_i$ 上也同质。$\{\Pi_t(\mu_s)\}$ 仍满足 (16.6)、(16.7)。

Note

Remark 16.1. The $d\hat Z_t$ in (16.7) and the $dZ_t$ in (16.1) are not in the same filtration. We assumed $\sigma_\delta$ known; $\mathbb E_t[\mu_\delta]$ is known at $t$ (since $\{\Pi_t(\mu_s)\}$ is); $d\delta_t$ is observable at $t$. So $d\hat Z_t$ is observable at $t$ (in $\hat{\mathcal F}_t$ generated by $\hat Z_t$), while $dZ_t$ is the shock at $t$, not in $\mathcal F_t$.

Remark 16.2. One can also view $\{\Pi_t(\mu_s)\}_{s=1}^n$ as $n$ latent state variables affecting the dividend drift; under this reading $d\delta_t$ has dynamics but $\mu_\delta$ has no uncertainty — the two readings are consistent, just different views of the same structure.

Observations. ① $\mathbb E_t[d\hat Z_t]=0$, $\mathrm{Var}(d\hat Z_t)=\mathrm{Var}(dZ_t)=dt$, so $d\hat Z_t\sim\mathcal N(0,dt)$ and $\{\hat Z_t\}$ is also standard BM. ② When $\Pi_t(\mu_s)=1$ or $0$, $d\Pi_t(\mu_s)=0$: if the agent is fully (probability one) certain of being in/out of a state, the subjective probability stops moving. ③ One verifies $\sum_s\Pi_t(\mu_s)=1$, $\Pi_t(\mu_s)\geq0$ for all $t$ (the dynamics stop the moment a belief hits zero, so it cannot go negative; and $\sum_s d\Pi_t(\mu_s)=0$).

16.1.3 Special Case: Homogeneity of Agents

Further assume agents are also homogeneous in risk tolerance $\rho_i$ and initial wealth share $\omega_i$. $\{\Pi_t(\mu_s)\}$ still satisfies (16.6), (16.7).

由 (16.1)，$\delta_{t+\tau}=\delta_t+\mu_\delta\tau+\sigma_\delta\sqrt\tau x_t$ (16.8)，$x_t\sim\mathcal N(0,1)$（同 (15.89)，$\mu_\delta$ 仍是常数，只是未知）。SDF $\pi_t=\frac1\xi e^{-\phi t-\gamma\delta_t}$（同质 CRRA，由 (15.93)）。期望对 $x_t$ 与 $\mu_\delta$ 同时取（二者皆未知）。由 (15.94) 算价格 (16.9)、价格-红利比 (16.10)：

By (16.1), $\delta_{t+\tau}=\delta_t+\mu_\delta\tau+\sigma_\delta\sqrt\tau x_t$ (16.8), $x_t\sim\mathcal N(0,1)$ (same as (15.89); $\mu_\delta$ is still a constant, just unknown). The SDF $\pi_t=\frac1\xi e^{-\phi t-\gamma\delta_t}$ (homogeneous CRRA, from (15.93)). The expectation is taken over both $x_t$ and $\mu_\delta$ (both unknown). By (15.94) the price (16.9) and price-dividend ratio (16.10):

$$\frac{P_t}{D_t}=\sum_{s=1}^n\Pi_t(\mu_s)\,k(\mu_s),\qquad k(\mu_s)=\frac{1}{\phi+(\gamma-1)\mu_s-\frac12(\gamma-1)^2\sigma_\delta^2}.\tag{16.11}$$

Note

Remark 16.3. $k(\mu_s)$ 是条件价格-红利比：由 (15.95)，$k(\mu_s)=\frac{P_t}{D_t}\big|_{\mu_\delta=\mu_s}$。

风险溢价。 由 (1.53)，CRRA 下 $\mathbb E[r_t]-r_{f,t}=\gamma\sigma_P\sigma_C\rho_{PC}$ (16.12)，等价于 (16.13)：$(\mathbb E[r_t]-r_{f,t})\,dt=\gamma(\frac{dP_t}{P_t})(\frac{dC_t}{C_t})$。设 $D_t=C_t$，则 $\frac{dC_t}{C_t}=d\delta_t=\mu_\delta\,dt+\sigma_\delta\,dZ_t$，$\sigma_C=\sigma_\delta$、$dZ_t^C=dZ_t$。

无学习时： $\frac{P_t}{D_t}$ 为常数 $h$，$\frac{dP_t}{P_t}=\frac{dD_t}{D_t}=d\delta_t$，$\sigma_P=\sigma_\delta$，代入 (16.13) 得 (16.14)：

Note

Remark 16.3. $k(\mu_s)$ is the conditional price-dividend ratio: by (15.95), $k(\mu_s)=\frac{P_t}{D_t}\big|_{\mu_\delta=\mu_s}$.

Risk premium. By (1.53), under CRRA $\mathbb E[r_t]-r_{f,t}=\gamma\sigma_P\sigma_C\rho_{PC}$ (16.12), equivalently (16.13): $(\mathbb E[r_t]-r_{f,t})\,dt=\gamma(\frac{dP_t}{P_t})(\frac{dC_t}{C_t})$. With $D_t=C_t$, $\frac{dC_t}{C_t}=d\delta_t=\mu_\delta\,dt+\sigma_\delta\,dZ_t$, $\sigma_C=\sigma_\delta$, $dZ_t^C=dZ_t$.

Without learning: $\frac{P_t}{D_t}$ is a constant $h$, $\frac{dP_t}{P_t}=\frac{dD_t}{D_t}=d\delta_t$, $\sigma_P=\sigma_\delta$; substituting into (16.13) gives (16.14):

$$\mathbb E[r_t]-r_{f,t}=\gamma\sigma_\delta^2.\tag{16.14}$$

有学习时： $\sigma_C=\sigma_\delta$、$dZ_t^C=dZ_t$ 不变，但由 (16.10) $\frac{P_t}{D_t}$ 不再常数，需对 (16.9) 微分。结果 (16.15)：$\frac{dP_t}{P_t}=[\sigma_\delta+(\tilde{\mathbb E}[\mu_s]-\mathbb E_t[\mu_\delta])\frac1{\sigma_\delta}]\,dZ_t+\circ(dt)$，其中 $\tilde{\mathbb E}[\mu_s]$ 是在加权测度 $\tilde\Pi_t(\mu_s)=\frac{\Pi_t(\mu_s)k(\mu_s)}{\sum_s\Pi_t(\mu_s)k(\mu_s)}$ 下的期望。代入 (16.13) 得有学习风险溢价 (16.16)：

With learning: $\sigma_C=\sigma_\delta$, $dZ_t^C=dZ_t$ unchanged, but by (16.10) $\frac{P_t}{D_t}$ is no longer constant, so we differentiate (16.9). The result (16.15): $\frac{dP_t}{P_t}=[\sigma_\delta+(\tilde{\mathbb E}[\mu_s]-\mathbb E_t[\mu_\delta])\frac1{\sigma_\delta}]\,dZ_t+\circ(dt)$, where $\tilde{\mathbb E}[\mu_s]$ is the expectation under the weighted measure $\tilde\Pi_t(\mu_s)=\frac{\Pi_t(\mu_s)k(\mu_s)}{\sum_s\Pi_t(\mu_s)k(\mu_s)}$. Substituting into (16.13) gives the with-learning risk premium (16.16):

$$\mathbb E[r_t]-r_{f,t}=\gamma\sigma_\delta\left[\sigma_\delta+\left(\tilde{\mathbb E}[\mu_s]-\mathbb E_t[\mu_\delta]\right)\frac{1}{\sigma_\delta}\right].\tag{16.16}$$

比较。 有学习风险溢价 $<$ 无学习风险溢价当且仅当 $\tilde{\mathbb E}[\mu_s]-\mathbb E_t[\mu_\delta]<0$，即加权测度 $\tilde\Pi$ 比 $\Pi$ 更偏向小 $\mu_s$，这发生在 $k'(\mu_s)<0$（即 $\gamma>1$，IES $\frac1\gamma<1$）时。直觉：IES $<1$ 时消费对价格不太敏感，故 $\rho_{PC}$ 减小、风险溢价被学习压低。

16.1.4 Heterogeneity of Agents

恢复异质风险容忍 $\rho_i$ 与初始份额 $\omega_i$，但保持信念同质。$\{\Pi_t(\mu_s)\}$ 仍满足 (16.6)、(16.7)。由 (15.92)，给定 $\mu_\delta$ 时 (16.17)：$P_t\mid\mu_\delta=e^{g(\delta_t)}\frac{1-e^{-\phi(T-t)}}\phi\mathbb E_t^{x_t,\tau}[e^{\delta_{t+\tau}-g(\delta_{t+\tau})}\mid\mu_\delta]$。对未知 $\mu_\delta$ 用信念加权得价格 (16.18)、(16.19)：

Comparison. The with-learning premium $<$ without-learning premium iff $\tilde{\mathbb E}[\mu_s]-\mathbb E_t[\mu_\delta]<0$, i.e. the weighted measure $\tilde\Pi$ tilts toward smaller $\mu_s$ than $\Pi$, which happens when $k'(\mu_s)<0$ (i.e. $\gamma>1$, IES $\frac1\gamma<1$). Intuition: with IES $<1$ consumption is less responsive to prices, so $\rho_{PC}$ shrinks and learning lowers the risk premium.

16.1.4 Heterogeneity of Agents

Restore heterogeneous risk tolerance $\rho_i$ and initial share $\omega_i$, but keep beliefs homogeneous. $\{\Pi_t(\mu_s)\}$ still satisfies (16.6), (16.7). By (15.92), given $\mu_\delta$ (16.17): $P_t\mid\mu_\delta=e^{g(\delta_t)}\frac{1-e^{-\phi(T-t)}}\phi\mathbb E_t^{x_t,\tau}[e^{\delta_{t+\tau}-g(\delta_{t+\tau})}\mid\mu_\delta]$. Belief-weighting over the unknown $\mu_\delta$ gives the price (16.18), (16.19):

$$P_t=D_t\sum_{s=1}^n\Pi_t(\mu_s)\,k(\delta_t,\mu_s),\qquad\frac{P_t}{D_t}=\sum_{s=1}^n\Pi_t(\mu_s)\,k(\delta_t,\mu_s).\tag{16.19}$$

其中 $k(\delta_t,\mu_s)\equiv e^{g(\delta_t)-\delta_t}\frac{1-e^{-\phi(T-t)}}\phi\mathbb E_t^{x_t,\tau}[e^{\delta_{t+\tau}-g(\delta_{t+\tau})}\mid\mu_s]$ 同时依赖 $\delta_t$（可观测）与 $\mu_s$（不可观测）。$g(\delta_t)$ 由泛函不动点 (15.76) 钉住但难解，其导数可如 §15.3.3 刻画（$g'(\delta_t)=1/\mathbb E_{\mathrm{CS}}^\star[\rho_i\mid\delta_t]>0$、$g''(\delta_t)<0$）。可数值模拟 (16.20)：先按 $\{\Pi_t(\mu_s)\}$ 抽 $\mu_\delta$、按截断指数分布抽 $\tau$、按正态抽 $\delta_{t+\tau}$，蒙特卡洛平均估计 $\mathbb E_t^{x_t,\tau,\mu_\delta}[e^{\delta_{t+\tau}-g(\delta_{t+\tau})}]$，再算 $P_t$。

16.1.5 Regime Shifting Model

放松"$\mu_\delta$ 为常数"：设 $\mu_{\delta,t}$ 可在 $\{\mu_1,\dots,\mu_n\}$ 间来回切换（状态切换）。此时 $\{\Pi_t(\mu_s)\}$ 不再满足 (16.6)、(16.7)。设代理人对同一离散状态集有同质信念，沿用 §16.1.1 假设但允许 $\mu_{\delta,t}$ 时变。定义转移率 $\Lambda=\{\lambda_{ij}\}$：$\lambda_{ij}=\mathbf P\{\mu_{\delta,t+dt}=\mu_j\mid\mu_{\delta,t}=\mu_i\}$，$\sum_j\lambda_{ij}=1$。信念动态分两部分：

where $k(\delta_t,\mu_s)\equiv e^{g(\delta_t)-\delta_t}\frac{1-e^{-\phi(T-t)}}\phi\mathbb E_t^{x_t,\tau}[e^{\delta_{t+\tau}-g(\delta_{t+\tau})}\mid\mu_s]$ depends on both $\delta_t$ (observable) and $\mu_s$ (unobservable). $g(\delta_t)$ is pinned by the functional fixed point (15.76) but hard to solve; its derivatives can be characterized as in §15.3.3 ($g'(\delta_t)=1/\mathbb E_{\mathrm{CS}}^\star[\rho_i\mid\delta_t]>0$, $g''(\delta_t)<0$). Numerically simulable (16.20): draw $\mu_\delta$ from $\{\Pi_t(\mu_s)\}$, $\tau$ from the truncated exponential, $\delta_{t+\tau}$ from the normal, Monte-Carlo average to estimate $\mathbb E_t^{x_t,\tau,\mu_\delta}[e^{\delta_{t+\tau}-g(\delta_{t+\tau})}]$, then compute $P_t$.

16.1.5 Regime Shifting Model

Relax "$\mu_\delta$ constant": let $\mu_{\delta,t}$ shift back and forth within $\{\mu_1,\dots,\mu_n\}$ (regime shifting). Now $\{\Pi_t(\mu_s)\}$ no longer satisfies (16.6), (16.7). Agents have homogeneous beliefs over the same discrete state set; keep §16.1.1 assumptions but allow $\mu_{\delta,t}$ to vary in time. Define transition rates $\Lambda=\{\lambda_{ij}\}$: $\lambda_{ij}=\mathbf P\{\mu_{\delta,t+dt}=\mu_j\mid\mu_{\delta,t}=\mu_i\}$, $\sum_j\lambda_{ij}=1$. The belief dynamics split into two parts:

$$d\Pi_t(\mu_i)=\underbrace{\left[\Pi_t(\mu_i)(\mu_i-\mathbb E_t[\mu_\delta])\frac{1}{\sigma_\delta}d\hat Z_t\right]\left(\sum_{i=1}^n\lambda_{ii}\right)}_{\text{Part A: regime unchanged}}+\underbrace{\sum_{j\neq i}\lambda_{ji}\Pi_t(\mu_j)-\sum_{j\neq i}\lambda_{ij}\Pi_t(\mu_i)}_{\text{Part B: regime changed}},$$

其中 $d\hat Z_t=\frac{d\delta_t-\mathbb E_t[\mu_\delta]\,dt}{\sigma_\delta}$。Part A 是"区制不变"条件下的贝叶斯学习（同 (16.6)），Part B 是跨区制切换带来的概率流入流出。

Note

Remark 16.4. 这里假设转移率矩阵 $\Lambda$ 已知；否则需再加一层对 $\Lambda$ 的学习，问题更复杂。

with $d\hat Z_t=\frac{d\delta_t-\mathbb E_t[\mu_\delta]\,dt}{\sigma_\delta}$. Part A is Bayesian learning conditional on the regime not changing (same as (16.6)); Part B is the probability inflow/outflow from regime switches.

Note

Remark 16.4. Here $\Lambda$ is assumed known; otherwise the problem is complicated by another layer of learning on $\Lambda$.

16.2 Kalman Filtering

与 He (2019a) 第 8 节思路相同。

16.2.1 Setup

观测方程 (16.21)：

Same fundamental idea as §8 in He (2019a).

16.2.1 Setup

Observation equation (16.21):

$$d\mathbf Y_t=(\mathbf F_0(\mathbf Y_t)+\mathbf F_1(\mathbf Y_t)\beta_t)\,dt+\boldsymbol\omega\,d\mathbf Z_t\tag{16.21}$$

其中 $\mathbf Y_t,\mathbf F_0,\mathbf F_1,d\mathbf Z_t$ 均 $n\times1$，$\boldsymbol\omega$ 为 $n\times n$，$\beta_t$ 为 $1\times1$，$d\mathbf Z_t\sim\mathcal N(\mathbf 0,\mathbf I\,dt)$。状态方程 (16.22)：

with $\mathbf Y_t,\mathbf F_0,\mathbf F_1,d\mathbf Z_t$ all $n\times1$, $\boldsymbol\omega$ being $n\times n$, $\beta_t$ being $1\times1$, $d\mathbf Z_t\sim\mathcal N(\mathbf 0,\mathbf I\,dt)$. State equation (16.22):

$$d\beta_t=(\alpha_0+\alpha_1\beta_t)\,dt+\boldsymbol\eta'\,d\mathbf Z_t\tag{16.22}$$

$\boldsymbol\eta$ 为 $n\times1$，$\alpha_0,\alpha_1$ 为 $1\times1$，(16.21)、(16.22) 中 $d\mathbf Z_t$ 相同。假设：观测向量 $\mathbf Y_t$ 每期可观测，状态 $\beta_t$ 不可观测；$\beta_t$ 的先验（$t$ 时、$d\mathbf Y_t$ 实现前）分布 $\beta_t\sim\mathcal N(\hat\beta_t,v_t)$。

16.2.2 Multivariate Normal Distribution

由多元正态定义（He 2019a §21），$\mathbf Y_{t+dt}$ 与 $\beta_{t+dt}$ 在 $t$ 时（$d\mathbf Z_t$ 实现前）服从联合正态 (16.23)：

$\boldsymbol\eta$ is $n\times1$, $\alpha_0,\alpha_1$ are $1\times1$, and $d\mathbf Z_t$ in (16.21), (16.22) is the same. Assumptions: the observation vector $\mathbf Y_t$ is observed each period, the state $\beta_t$ is not; the prior (at $t$, before $d\mathbf Y_t$) distribution $\beta_t\sim\mathcal N(\hat\beta_t,v_t)$.

16.2.2 Multivariate Normal Distribution

By the multivariate-normal definition (He 2019a §21), $\mathbf Y_{t+dt}$ and $\beta_{t+dt}$ are jointly normal at $t$ (before $d\mathbf Z_t$) (16.23):

$$\begin{pmatrix}\mathbf Y_{t+dt}\\\beta_{t+dt}\end{pmatrix}\sim\mathcal N\!\left(\begin{pmatrix}\hat{\mathbf Y}_{(t+dt)\mid t}\\\hat\beta_{(t+dt)\mid t}\end{pmatrix},\begin{bmatrix}\boldsymbol\Sigma_{\mathbf Y\mathbf Y'\mid t}&\boldsymbol\Sigma_{\mathbf Y\beta\mid t}\\\boldsymbol\Sigma_{\beta\mathbf Y'\mid t}&\Sigma_{\beta\beta\mid t}\end{bmatrix}\right).\tag{16.23}$$

各项由 (16.21)、(16.22) 取条件期望/方差算出：均值 (16.24)、(16.25)：$\hat{\mathbf Y}_{(t+dt)\mid t}=\mathbf Y_t+(\mathbf F_0(\mathbf Y_t)+\mathbf F_1(\mathbf Y_t)\hat\beta_t)\,dt$、$\hat\beta_{(t+dt)\mid t}=\hat\beta_t+(\alpha_0+\alpha_1\hat\beta_t)\,dt$；协方差 (16.28)、(16.31)、(16.32)、(16.33)：

Each term follows from conditional expectations/variances of (16.21), (16.22): means (16.24), (16.25): $\hat{\mathbf Y}_{(t+dt)\mid t}=\mathbf Y_t+(\mathbf F_0(\mathbf Y_t)+\mathbf F_1(\mathbf Y_t)\hat\beta_t)\,dt$, $\hat\beta_{(t+dt)\mid t}=\hat\beta_t+(\alpha_0+\alpha_1\hat\beta_t)\,dt$; covariances (16.28), (16.31), (16.32), (16.33):

$$\boldsymbol\Sigma_{\mathbf Y\mathbf Y'\mid t}=\boldsymbol\omega\boldsymbol\omega'\,dt,\quad\boldsymbol\Sigma_{\mathbf Y\beta\mid t}=(\mathbf F_1(\mathbf Y_t)v_t+\boldsymbol\omega\boldsymbol\eta)\,dt,\quad\Sigma_{\beta\beta\mid t}=v_t+(2\alpha_1 v_t+\boldsymbol\eta'\boldsymbol\eta)\,dt.\tag{16.33}$$

（推导中反复用 $(dt)^2=0$、$d\mathbf Z_t\,dt=\mathbf 0$、$d\mathbf Z_t(d\mathbf Z_t)'=\mathbf I_{n\times n}\,dt$。）

16.2.3 Updating

Lemma 16.1（条件正态）. 若 $\begin{pmatrix}\mathbf X\\\mathbf Y\end{pmatrix}\sim\mathcal N\!\left(\begin{pmatrix}\mathbf 0\\\mathbf 0\end{pmatrix},\begin{bmatrix}\mathbf S_{\mathbf X\mathbf X'}&\mathbf S_{\mathbf X\mathbf Y'}\\\mathbf S_{\mathbf Y\mathbf X'}&\mathbf S_{\mathbf Y\mathbf Y'}\end{bmatrix}\right)$，则 $\mathbf X\mid\mathbf Y\sim\mathcal N(\mathbf A\mathbf Y,\mathbf S_{\mathbf X\mathbf X'\mid\mathbf Y})$，其中 $\mathbf A=\mathbf S_{\mathbf X\mathbf Y'}\mathbf S_{\mathbf Y\mathbf Y'}^{-1}$、$\mathbf S_{\mathbf X\mathbf X'\mid\mathbf Y}=\mathbf S_{\mathbf X\mathbf X'}-\mathbf A\mathbf S_{\mathbf Y\mathbf Y'}\mathbf A'$。

把 (16.23) 改写为去中心化形式 (16.34)，对 $(\mathbf Y_{t+dt}-\hat{\mathbf Y}_{(t+dt)\mid t},\ \beta_{t+dt}-\hat\beta_{(t+dt)\mid t})$ 应用 Lemma 16.1，得更新后 $\beta_{t+dt}\mid\mathbf Y_{t+dt}\sim\mathcal N(\hat\beta_{t+dt},v_{t+dt})$，其中 $\mathbf A=\boldsymbol\Sigma_{\beta\mathbf Y'\mid t}\boldsymbol\Sigma_{\mathbf Y\mathbf Y'\mid t}^{-1}$ (16.35)、$v_{t+dt}=\Sigma_{\beta\beta\mid t}-\boldsymbol\Sigma_{\beta\mathbf Y'\mid t}\boldsymbol\Sigma_{\mathbf Y\mathbf Y'\mid t}^{-1}\boldsymbol\Sigma_{\mathbf Y\beta\mid t}$ (16.36)。代入 (16.28)、(16.32) 得 $\mathbf A=(\mathbf F_1(\mathbf Y_t)v_t+\boldsymbol\omega\boldsymbol\eta)'(\boldsymbol\omega\boldsymbol\omega')^{-1}$，进而隐含状态的均值动态 (16.37)：

(The derivation repeatedly uses $(dt)^2=0$, $d\mathbf Z_t\,dt=\mathbf 0$, $d\mathbf Z_t(d\mathbf Z_t)'=\mathbf I_{n\times n}\,dt$.)

16.2.3 Updating

Lemma 16.1 (conditional normal). If $\begin{pmatrix}\mathbf X\\\mathbf Y\end{pmatrix}\sim\mathcal N\!\left(\begin{pmatrix}\mathbf 0\\\mathbf 0\end{pmatrix},\begin{bmatrix}\mathbf S_{\mathbf X\mathbf X'}&\mathbf S_{\mathbf X\mathbf Y'}\\\mathbf S_{\mathbf Y\mathbf X'}&\mathbf S_{\mathbf Y\mathbf Y'}\end{bmatrix}\right)$, then $\mathbf X\mid\mathbf Y\sim\mathcal N(\mathbf A\mathbf Y,\mathbf S_{\mathbf X\mathbf X'\mid\mathbf Y})$ with $\mathbf A=\mathbf S_{\mathbf X\mathbf Y'}\mathbf S_{\mathbf Y\mathbf Y'}^{-1}$, $\mathbf S_{\mathbf X\mathbf X'\mid\mathbf Y}=\mathbf S_{\mathbf X\mathbf X'}-\mathbf A\mathbf S_{\mathbf Y\mathbf Y'}\mathbf A'$.

Rewriting (16.23) in demeaned form (16.34) and applying Lemma 16.1 to $(\mathbf Y_{t+dt}-\hat{\mathbf Y}_{(t+dt)\mid t},\ \beta_{t+dt}-\hat\beta_{(t+dt)\mid t})$ gives the updated $\beta_{t+dt}\mid\mathbf Y_{t+dt}\sim\mathcal N(\hat\beta_{t+dt},v_{t+dt})$, with $\mathbf A=\boldsymbol\Sigma_{\beta\mathbf Y'\mid t}\boldsymbol\Sigma_{\mathbf Y\mathbf Y'\mid t}^{-1}$ (16.35), $v_{t+dt}=\Sigma_{\beta\beta\mid t}-\boldsymbol\Sigma_{\beta\mathbf Y'\mid t}\boldsymbol\Sigma_{\mathbf Y\mathbf Y'\mid t}^{-1}\boldsymbol\Sigma_{\mathbf Y\beta\mid t}$ (16.36). Substituting (16.28), (16.32) gives $\mathbf A=(\mathbf F_1(\mathbf Y_t)v_t+\boldsymbol\omega\boldsymbol\eta)'(\boldsymbol\omega\boldsymbol\omega')^{-1}$, hence the latent state's mean dynamics (16.37):

$$d\hat\beta_t=(\alpha_0+\alpha_1\hat\beta_t)\,dt+(\mathbf F_1(\mathbf Y_t)v_t+\boldsymbol\omega\boldsymbol\eta)'(\boldsymbol\omega\boldsymbol\omega')^{-1}\,d\tilde{\mathbf Z}_t,\tag{16.37}$$

其中 $d\tilde{\mathbf Z}_t=(\boldsymbol\omega\boldsymbol\omega')^{-\frac12}[d\mathbf Y_t-(\mathbf F_0(\mathbf Y_t)+\mathbf F_1(\mathbf Y_t)\hat\beta_t)\,dt]$ 满足 $d\tilde{\mathbf Z}_t\sim\mathcal N(\mathbf 0,\mathbf I\,dt)$（因 (16.21) 给出 $d\mathbf Y_t$ 的均值与方差 $\boldsymbol\omega\boldsymbol\omega'$）。代入 (16.33)、(16.31) 得方差动态 (16.39)：

where $d\tilde{\mathbf Z}_t=(\boldsymbol\omega\boldsymbol\omega')^{-\frac12}[d\mathbf Y_t-(\mathbf F_0(\mathbf Y_t)+\mathbf F_1(\mathbf Y_t)\hat\beta_t)\,dt]$ satisfies $d\tilde{\mathbf Z}_t\sim\mathcal N(\mathbf 0,\mathbf I\,dt)$ (since (16.21) gives the mean and variance $\boldsymbol\omega\boldsymbol\omega'$ of $d\mathbf Y_t$). Substituting (16.33), (16.31) gives the variance dynamics (16.39):

$$\frac{dv_t}{dt}=(2\alpha_1 v_t+\boldsymbol\eta'\boldsymbol\eta)-(\mathbf F_1(\mathbf Y_t)v_t+\boldsymbol\omega\boldsymbol\eta)'(\boldsymbol\omega\boldsymbol\omega')^{-1}(\mathbf F_1(\mathbf Y_t)v_t+\boldsymbol\omega\boldsymbol\eta).\tag{16.39}$$

(16.39) 是 $v_t$ 的局部确定性运动（$t$ 时 $\frac{dv_t}{dt}$ 无随机性）。
若 $\mathbf F_1(\mathbf Y_t)=\mathbf F_1$ 恒为常数，(16.39) 表明 $v_t$ 收敛到使 $\frac{dv_t}{dt}=0$ 的定值（可由 (16.39) 显式解出，Riccati 不动点）。
若 $\mathbf F_1(\mathbf Y_t)$ 依赖 $\mathbf Y_t$，则一般不收敛。

(16.39) is a locally deterministic motion of $v_t$ ($\frac{dv_t}{dt}$ has no randomness at $t$).
If $\mathbf F_1(\mathbf Y_t)=\mathbf F_1$ is always constant, (16.39) shows $v_t$ converges to the value where $\frac{dv_t}{dt}=0$ (explicitly solvable from (16.39), a Riccati fixed point).
If $\mathbf F_1(\mathbf Y_t)$ depends on $\mathbf Y_t$, convergence generally fails.

References

He, X. (2019a). Econometrics / Statistics Notes by Xindi He.