仿射期限结构模型：理论与实现——理论部分

仿射期限结构模型：理论与实现——理论部分

本文是 Affine Term-Structure Models: Theory and Implementation 的阅读笔记，摘录一些关键结论与公式。

1 引言

期限结构建模涉及两类截然不同又相互关联的问题。

为一组债券价格拟合即期利率曲线。
模拟利率期限结构的动态过程。

期限结构模型应满足的三个条件：

模型能反映期限结构的动态特征。
存在解析表达式。
参数容易估计。

2 理论发展

2.1 一些关键利率的关系

固收分析的最基础模块是无风险零息债券。

记无风险零息债券的价格是 \(P(t,T)\)，\(t\) 表示当前时间，\(T\) 表示债券到期日，连续复利的零息利率 \(z(t,T)\) 为：

\[z(t,T) = -\frac{\ln P(t,T)}{T-t} \]

瞬时利率记为 \(r(t)\)，即 \(z(t,T)\) 的极限：

\[r(t) = \lim_{T \to t} z(t,T) = -\frac{\partial \ln P(t,t)}{\partial t} \]

而

\[P(t,T) = E(e^{-\int_t^T r(s)ds}|\mathcal{F}_t) \]

2.2 仿射模型的基本结构

仿射模型的出发点是用随机过程描述状态变量（或称为因子），而这些状态变量驱动了期限结构。对于单因子模型来说，瞬时利率便是唯一的状态变量。

记状态变量的 SDE 为：

\[d y(t) = A_0 dt + A_1 d W(t) \]

瞬时利率与期限结构之间的关系并不显而易见，两者通过"无套利原理"联系起来。仿照 Black-Scholes 等式的推导过程，可以得到一个有关零息债券价格的 PDE，这个 PDE 将状态变量和利率期限结构（等价地，零息债券价格）联系起来。

推导 BS 等式的思路——对冲：

未定权益（期权）和底层资产构造一个"自融资"（self-financing）组合，选择合适的动态权重保证组合的收益率没有随机性，此时组合收益率将等于无风险利率，进而得到关于未定权益的 PDE。

为确保 PDE 有解且唯一，需要对 \(A_0\) 和 \(A_1\) 的形式做出限制。作为一个特例，可以要求 \(A_0\) 和 \(A_1^2\) 是"仿射形式"（affine form）的。

\(A_1^2\) 与 PDE 中的二次导数项相伴而生，故而要求 \(A_1^2\) 是仿射形式的。

仿射期限结构模型的主要文献：

Vasicek, O. (1977): "An Equilibrium Characterization of the Term Structure," Journal of Financial Economics, 5, 177–188.
Cox, J. C., J. E. Ingersoll, and S. A. Ross (1985a): "An Intertemporal General Equilibrium Model of Asset Prices," Econometrica, 53, 363–384.
Cox, J. C., J. E. Ingersoll, and S. A. Ross (1985b): "A Theory of Term Structure of Interest Rates," Econometrica, 53, 385–407.
Longstaff, F. A., and E. S. Schwartz (1992a): "Interest Rate Volatility and the Term Structure: A Two-Factor General Equilibrium Model," The Journal of Finance, XLVII, 1259–1282.
Longstaff, F. A., and E. S. Schwartz (1992b): "A Two-Factor Interest Rate Model and Contingent Claims Evaluation," The Journal of Fixed Income, pp. 16–23.
Duffie, D., and R. Kan (1996): "A Yield-Factor Model of Interest Rates," Mathematical Finance, 6, 379-406.

对仿射期限结构模型的批评：

对当前观测到的期限结构数据拟合不佳。事实上，仿射模型关注的是期限结构的时间序列特性，而不是横截面（cross-sectional）特性。
仿射模型是内在“线性的”。即期利率与状态变量之间是线性关系。

2.3 单因子模型

记瞬时利率的 SDE 为：

\[d r(t) = f(r,t) dt + \rho(r,t) dW(t) \]

由 \(r(t)\) 的马尔可夫性，\(P (t, T)\) 将是 \(r(t)\) 的函数：

\[\begin{aligned} P(t,T)&=P(t,T, r)\\ d P(t,T,r) &= \left(P_t + f P_r + \frac{\rho^2}{2}P_{rr} \right)dt + \rho P_r d W(t) \end{aligned} \]

用对冲的思路推导债券的 PDE：

由于 \(r(t)\) 不是可交易资产，考虑用两个不同期限的债券构造自融资组合：

\[\begin{aligned} V &= P_1 + h P_2\\ dV &= d P_1 + h d P_2 \end{aligned} \]

记

\[d P = \mu dt + \sigma dW \]

则

\[\begin{aligned} dV &= d P_1 + h d P_2\\ &= \mu_1 dt + \sigma_1 dW + h(\mu_2 dt + \sigma_2 dW) \end{aligned} \]

若令 \(h = -\frac{\sigma_1}{\sigma_2}\)

\[\begin{aligned} dV &= d P_1 + h d P_2\\ &= \left( \mu_1 - \frac{\sigma_1}{\sigma_2} \mu_2 \right)dt\\ \end{aligned} \]

要达到无套利，需要要求

\[dV = rVdt \]

则

\[\mu_1 - \frac{\sigma_1}{\sigma_2} \mu_2 = r\left(P_1 - \frac{\sigma_1}{\sigma_2} P_2\right) \]

对任意两个期限都成立，所以

\[\frac{\mu_1 - rP_1}{\sigma_1} = \frac{\mu_2 - rP_2}{\sigma_2} \]

仅是 \(t\) 和 \(r\) 的函数 \(\lambda(t,r)\)，称为"利率风险的市场价格"。再根据 Ito 公式得到得到 PDE：

\[P_t + (f-\rho \lambda(t,r))P_r + \frac{\rho^2}{2}P_{rr} - rP=0 \]

上述 PDE 的解 \(P(t,T,r)\) 是 \(\tau(=T-t)\) 与 \(r\) 的函数。

对于 Vasicek 模型：

\[\begin{aligned} d r(t) &= \kappa(\theta -r(t))dt + \sigma dW\\ P(\tau, r) &= \exp(A(\tau)-B(\tau)r)\\ B(\tau) &= \frac{1}{\kappa}(1-e^{-\kappa r})\\ A(\tau) & = \frac{\gamma(B(\tau)-\tau)}{\kappa^2}-\frac{\sigma^2 B(\tau)^2}{4\kappa}\\ \gamma &= \kappa^2 \left(\theta-\frac{\sigma \lambda}{\kappa} \right) - \frac{\sigma^2}{2} \end{aligned} \]

对于 CIR 模型：

\[\begin{aligned} d r(t) &= \kappa(\theta -r(t))dt + \sigma \sqrt{r(t)} dW\\ P(\tau, r) &= \exp(A(\tau)-B(\tau)r)\\ B(\tau) &= \frac{2(e^{\gamma\tau}-1)}{(\gamma+\kappa+\lambda)(e^{\gamma\tau}-1)+2\gamma}\\ A(\tau) &= {\frac{2\kappa\theta}{\sigma^2}}\ln \left( \frac{2\gamma e^{\frac{(\gamma+\kappa+\lambda)\tau}{2}}}{(\gamma+\kappa+\lambda)(e^{\gamma\tau}-1)+2\gamma} \right)\\ \gamma &= \sqrt{(\kappa+\lambda)^2+2\sigma^2} \end{aligned} \]

2.4 多因子模型

瞬时利率是 \(n\) 个因子的和：

\[r = \sum_{i=1}^n y_i \]

每个因子的 SDE：

\[d y_i(t) = f_i(y_i,t) dt + \rho_i(y_i,t) dW_i(t) \]

记

\[dP_i = \mu_i dt + \sigma_i^T \times dW \]

\(W\) 是 \(n\) 维布朗运动，\(d W_i dW_j = \rho_{i,j}dt\)。

用对冲的思路推导债券的 PDE：

用 \(n+1\) 个不同期限的债券构造自融资组合：

\[\begin{aligned} dV &= d P_0 + h^T \times d P\\ &= \mu_0 dt + \sigma_0^T \times dW + h^T \times \mu dt + h^T \times \sigma \times dW\\ \mu &= [\mu_1,\dots,\mu_n]^T\\ dW &= [dW_1,\dots,dW_n]^T\\ \sigma &= \begin{bmatrix} \sigma_{1,1} & \cdots & \sigma_{1,n}\\ \vdots & & \vdots \\ \sigma_{n,1} & \cdots & \sigma_{n,n} \end{bmatrix} \end{aligned} \]

若令

\[h = -(\sigma^T)^{-1} \times \sigma_0 \]

\[\begin{aligned} dV &= d P_0 + h^T \times d P\\ &= \left(\mu_0 - \sigma_0^T \times \sigma^{-1} \times\mu \right)dt\\ \end{aligned} \]

要达到无套利，需要要求

\[dV = rVdt \]

则

\[\mu_0 - rP_0 = \sigma_0^T \times \sigma^{-1} \times(\mu - rP) \]

对任意 \(n+1\) 个期限都成立，所以

\[\sigma^{-1} \times(\mu - rP) \]

仅是 \(t\) 和 \(y_i\) 的函数向量，称为"利率风险的市场价格"，记为 \(\lambda\)。再根据 Ito 公式得到得到 PDE：

\[P_t + \sum_{i} P_{y_i}f_i + \frac{1}{2}\sum_{i,j}P_{y_i,y_j}\rho_i \rho_j \rho_{i,j} - \sum_i P_{y_i}\rho_i \lambda_i - rP = 0 \]

上述 PDE 的解 \(P(t,T,y)\) 是 \(\tau(=T-t)\) 与 \(y\) 的函数。

对于 Vasicek 模型：

\[\begin{aligned} d y_i(t) &= \kappa_i(\theta_i -y_i(t))dt + \sigma_i dW_i\\ P(\tau, y) &= \exp(A(\tau)-\sum_{i=1}^n B_i(\tau)y_i)\\ B_i(\tau) &= \frac{1}{\kappa_i}(1-e^{-\kappa_i \tau})\\ A(\tau) & = \sum_{i=1}^n \frac{\gamma_i(B_i(\tau)-\tau)}{\kappa_i^2}-\frac{\sigma_i^2 B(\tau)^2}{4\kappa_i}\\ \gamma_i &= \kappa_i^2 \left(\theta_i-\frac{\sigma_i \lambda}{\kappa_i} \right) - \frac{\sigma_i^2}{2} \end{aligned} \]

\(W\) 是 \(n\) 维标准布朗运动，\(\lambda\) 是常数。

对于 CIR 模型：

\[\begin{aligned} d y_i(t) &= \kappa_i(\theta_i -y_i(t))dt + \sigma_i \sqrt{y_i(t)} dW_i\\ P(\tau, y) &= \exp(A(\tau)-\sum_{i=1}^n B_i(\tau)y_i)\\ B_i(\tau) &= \frac{2(e^{\gamma_i\tau}-1)}{(\gamma_i+\kappa_i+\lambda_i)(e^{\gamma_i\tau}-1)+2\gamma_i}\\ A(\tau) &= \sum_{i=1}^n{\frac{2\kappa_i\theta_i}{\sigma_i^2}}\ln \left( \frac{2\gamma_i e^{\frac{(\gamma_i+\kappa_i+\lambda_i)\tau}{2}}}{(\gamma_i+\kappa_i+\lambda_i)(e^{\gamma_i\tau}-1)+2\gamma_i} \right)\\ \gamma_i &= \sqrt{(\kappa_i+\lambda_i)^2+2\sigma_i^2} \end{aligned} \]

\(W\) 是 \(n\) 维标准布朗运动，\(\lambda\) 是常数。

3 模型实现

用卡尔曼滤波研究债券价格和状态变量之间的关系，进而估计模型参数。

3.1 卡尔曼滤波简介

卡尔曼滤波应用于仿射期限结构的主要文献：

Duan, J.-C., and J.-G. Simonato (1995): "Estimating and Testing Exponential-Affine Term Structure Models by Kalman Filter," Discussion paper, Centre universitaire de recherche et analyze des organizations (CIRANO).
Lund, J. (1997): "Econometric Analysis of Continuous-Time Arbitrage-Free Models of the Term Structure of Interest Rates," Department of Finance, The Aarhus School of Business.
Geyer, A. L. J., and S. Pichler (1998): "A State-Space Approach to Estimate and Test Multifactor Cox-Ingersoll-Ross Models of the Term Structure of Interest Rates," Department of Operations Research, University of Economics Vienna.
de Jong, F. (1998): "Time-Series and Cross-Section Information in Affine Term Structure Models," Department of Financial Management, University of Amsterdam.
Babbs, S. H., and K. B. Nowman (1999): "Kalman Filtering of Generalized Vasicek Term Structure Models," Journal of Financial and Quantitative Analysis, pp. 115–130.

在期限结构问题的语境下，卡尔曼滤波中的

观测系统指零息利率与状态变量之间的关系，
转移系统指状态变量的动态过程。

观测系统和转移系统合起来构成模型的状态空间，卡尔曼滤波根据零息利率（观测系统）递归的推断无法观测的状态变量（转移系统），最后通过最大化似然函数来估计模型参数。

3.2 状态空间表示

\(n\) 个零息利率 \(z_1,\dots,z_n\) 的期限分别是 \(t_{z_1},\dots,t_{z_n}\)，\(z(s,T)\) 表示 \(s\) 时观测到的期限为 \(T\) 的即期利率。

观测系统和转移系统：

\[\begin{aligned} z_{t_i} &= A + H y_{t_i} + \nu_{t_i}\\ y_{t_i} &= C + F y_{t_{i-1}} + \varepsilon_{t_i} \end{aligned} \]

Vasicek 模型和 CIR 模型的观测系统表达式：

\[\begin{bmatrix} z(t_i,t_{z_1}) \\ \vdots\\ z(t_i,t_{z_n}) \end{bmatrix}= \begin{bmatrix} \frac{-A(t_i,t_{z_1})}{t_{z_1} - t_i} \\ \vdots\\ \frac{-A(t_i,t_{z_n})}{t_{z_n} - t_i} \end{bmatrix}+ \begin{bmatrix} \frac{B_1(t_i,t_{z_1})}{t_{z_1} - t_i}&\frac{B_2(t_i,t_{z_1})}{t_{z_1} - t_i}&\frac{B_3(t_i,t_{z_1})}{t_{z_1} - t_i}\\ \vdots&\vdots&\vdots\\ \frac{B_1(t_i,t_{z_n})}{t_{z_n} - t_i}&\frac{B_2(t_i,t_{z_n})}{t_{z_n} - t_i}&\frac{B_3(t_i,t_{z_n})}{t_{z_n} - t_i} \end{bmatrix} \begin{bmatrix} y_1(t_i) \\ y_2(t_i) \\ y_3(t_i) \end{bmatrix}+ \begin{bmatrix} \nu_1(t_i) \\ \vdots\\ \nu_n(t_i) \end{bmatrix} \]

\(\nu \sim N(0,R)\) 是相互独立的观测误差。

Vasicek 模型的转移系统：

\[y_j(t_i) = \theta_j(1-e^{-\kappa_j \Delta t}) + e^{-\kappa_j \Delta t} y_j(t_{i-1}) + \varepsilon_j(t_i),j=1,2,3 \]

\[\varepsilon_j(t_i) \sim N(0, \sqrt{\frac{\sigma_j^2}{2\kappa_j}\left(1-e^{-2\kappa_j \Delta t}\right)}) \]

CIR 模型的转移系统：

\[y_j(t_i) = \theta_j(1-e^{-\kappa_j \Delta t}) + e^{-\kappa_j \Delta t} y_j(t_{i-1}) + \varepsilon_j(t_i),j=1,2,3 \]

\[\varepsilon_j(t_i) \sim N(0, \sqrt{ \frac{\theta_j\sigma_j^2}{2\kappa_j}\left(1-e^{-2\kappa_j \Delta t}\right)^2 + \frac{\sigma_j^2}{\kappa_j}(e^{-\kappa_j \Delta t}-e^{-2\kappa_j \Delta t})y_i(t_{i-1})}) \]

CIR 的真实转移概率分布是一个非中心 \(\chi^2\) 分布，但 Ball and Torous (1996) 指出在足够小的时间区间上可以用正态分布近似。

3.3 实现细节

\(\mathcal{F}_s\) 是观测系统的 \(\sigma\) 代数

\[\mathcal{F}_{t_i} = \sigma \{z_{t_0}, z_{t_1},\dots,z_{t_i}\} \]

观测时长是 \([0,T]\)，\(t_i = i \frac{T}{N}\)

五步计算过程：

Step 1：初始化状态向量

\[E[y_1] = E[y_1|\mathcal{F}_0] = \theta \]

对于 Vasicek 模型：

\[var[y_1] = var[y_1|\mathcal{F}_0] = diag(\frac{\sigma^2}{2 \kappa}) \]

对于 CIR 模型：

\[var[y_1] = var[y_1|\mathcal{F}_0] = diag(\frac{\sigma^2 \theta}{2 \kappa}) \]

Step 2：预测观测值

\[\begin{aligned} E[z_{t_i}|\mathcal{F}_{t_{i-1}}] &= A + H \cdot E[y_{t_i}|\mathcal{F}_{t_{i-1}}]\\ var[z_{t_i}|\mathcal{F}_{t_{i-1}}] &= H \cdot var[y_{t_i}|\mathcal{F}_{t_{i-1}}] \cdot H^T + R \end{aligned} \]

Step 3：更新状态向量的推断

\[\zeta_{t_i} = z_{t_i} - E[z_{t_i}|\mathcal{F}_{t_{i-1}}] \]

在卡尔曼滤波中，此预测误差用于更新对转移系统的推断。

\[\begin{aligned} E[y_{t_i}|\mathcal{F}_{t_{i}}] &= E[y_{t_i}|\mathcal{F}_{t_{i-1}}] + K_{t_i}\zeta_{t_i}\\ K_{t_i} &= var[z_{t_i}|\mathcal{F}_{t_{i-1}}] \cdot H^T \cdot var[z_{t_i}|\mathcal{F}_{t_{i-1}}]^{-1} \end{aligned} \]

\(K_{t_i}\) 称为卡尔曼获得矩阵。获得矩阵决定了更新预测时新观测数据的权重。条件方差也要更新。

\[var[z_{t_i}|\mathcal{F}_{t_{i}}] = (I - K_{t_i}H)var[z_{t_i}|\mathcal{F}_{t_{i-1}}] \]

在 CIR 模型中 \(E[y_{t_i}|\mathcal{F}_{t_{i}}]\) 可能小于零，可以考虑替换成 \(\max (E[y_{t_i}|\mathcal{F}_{t_{i}}], 0)\)，(Chen and Scott, 2003)。

Step 4：预测状态向量

根据更新的变量，预测下一步的状态值

\[\begin{aligned} E[y_{t_{i+1}}|\mathcal{F}_{t_{i}}] &= C + F \cdot E[y_{t_i}|\mathcal{F}_{t_{i}}]\\ var[y_{t_{i+1}}|\mathcal{F}_{t_{i}}] &= var[y_{t_i}|\mathcal{F}_{t_{i-1}}] - F \cdot var[y_{t_i}|\mathcal{F}_{t_{i}}] \cdot F^T + Q \end{aligned} \]

Step 5：构造似然函数

以上每一步都可以得到观测系统的预测误差（\(\zeta_{t_{i}}\)）和预测误差协方差矩阵（\(var[y_{t_i} | \mathcal{F}_{t_{i−1}}]\)），对数似然函数是

\[l(\theta) = -\frac{nN\ln(2\pi)}{2} - \frac12 \sum_{i=1}^N\left[ \ln\left( \det(var[z_{t_i}|\mathcal{F}_{t_{i-1}}])\right) + \zeta^T_{t_i}var[z_{t_i}|\mathcal{F}_{t_{i-1}}]^{-1}\zeta_{t_i} \right] \]

3.4 模拟计算

模拟期限结构路径，状态变量还可以用 SDE 的离散化模拟。
以任意参数开始，用 Broyden-Fletcher-Goldfarb-Shanno（BFGS）算法找到最大化对数似然函数的参数。
反复运行 250 次。

3.5 应用于真实数据

参数估计的误差通过 Fisher 信息矩阵获得。如果有 \(k\) 个参数，误差向量是 \(\psi\)，那么

\[\psi_i = \sqrt{H^{-1}_{ii}} \]

\(H\) 是 Hessian 矩阵。

其他相关文献

Ball, C. A., and W. N. Torous (1996): "Unit Roots and the Estimation of Interest Rate Dynamics," Journal of Empirical Finance, 3, 215–238.

Chen, R., Scott, L. Multi-Factor Cox-Ingersoll-Ross Models of the Term Structure: Estimates and Tests from a Kalman Filter Model. The Journal of Real Estate Finance and Economics 27, 143–172 (2003).

延伸阅读

《仿射期限结构模型：理论与实现——实现部分》

posted @ 2020-04-06 10:10 xuruilong100 阅读(5161) 评论(0) 收藏举报

刷新页面返回顶部