1、基于贝叶斯分层模型的可违约债券利率期限结构 吴建华 张颖 王新军 济南大学数学科学学院 山东大学经济学院 摘 要: 本文构建可违约债券利率期限结构的贝叶斯分层模型, 通过采用 Dirichlet 多层先验分布和联合估计思路, 获得了不同信用级别下的收益曲线。利用交易所市场的企业债券交易数据对模型的有效性进行了实证检验。检验结果表明, 基于 Svensson 函数的贝叶斯分层模型可以有效的克服小样本问题和异常值的影响, 提高了模型拟合精度和样本预测绩效, 而且能避免单曲线模型导出的收益率曲线交错的问题, 说明贝叶斯分层模型可以有效的拟合交易所企业债券收益率曲线。模型丰富了中国企业债券收益曲线估计
2、方法, 对于企业债券的合理定价具有较强的参考价值。关键词: 可违约债券; 收益率曲线; Svensson 函数; Dirichlet 先验分布; 分层模型; 作者简介:吴建华, 经济学博士, 济南大学数学科学院学院讲师, 研究方向:金融数学与风险量化。作者简介:张颖, 女, 济南大学数学科学院学院讲师, 研究方向:金融计量分析。作者简介:王新军, 经济学博士, 山东大学经济学院教授、博士生导师, 研究方向:保险精算与金融数学。基金:国家自然科学基金重点项目“民间金融风险:变迁;区域差异与治理研究”(71333009) Term Structure Model for Defaultable B
3、onds Based on Bayesian Hierarchical ModelWu Jianhua Zhang Ying Wang Xinjun Abstract: This paper constructs a bayesian hierarchical model based on the Svensson Function.The yield curve based on different credit rates is gained by means of Dirichlet hierarchical prior and joint estimation approach.The
4、 empirical examination for proposed model is implemented using the data of exchange market in Chinese defaultable bond market.The empirical examination shows that the proposed model can overcome the question of a small sample, avoid the impact from outliers, and improve efficiently the fitted accura
5、cy and predictive performance.The proposed model can enrich the way of estimating defaultable bonds, and the proposed model has a strong reference value for the reasonable pricing of corporate bonds.Keyword: defaultable bond; yield curve; svensson function; dirichlet prio; hierarchical model; 引言与文献综
6、述无论是微观金融资产定价、金融风险管理和投资分析, 还是宏观经济预测和货币政策制定, 利率期限结构都发挥着极其重要的角色。国债收益率曲线从一个侧面反映了实体经济、金融市场的状况和市场主体对经济未来的预期信息。而可违约债券的利率期限结构则在风险管理中被用于推测企业债券的信用评级和评估衍生品的风险。因此, 对于利率期限结构的准确估计和预测研究一直是学界和业界的热点问题。现代利率期限结构模型研究大致可以分为如下三类模型:经验估计模型 (包括样条拟合模型和参数拟合模型) , 仿射期限结构模型 (包括均衡模型和无套利模型) 和宏观-金融模型。以上这些研究方向都从不同的角度对利率期限结构展开了丰富的研究。
7、最早利用统计学方法对利率期限结构进行经验估计的文献可以追溯到 Mc Culloch and Huston (1971) 1和 Mc Culloch (1975) 2, 他们将贴现曲线模型化为多项式基础函数的一个线性组合, 分别利用二次和三次多项式样条模型来拟合收益率曲线。在此基础上, Schaefer (1981) 3提出了利用 Bernstein 多项式模型化收益率曲线的思路。不过多项式样条函数会引起远期利率的剧烈波动, 为此 Vasicek and Fong (1982) 4提出指数样条模型, 它可以有效避免远期利率的剧烈波动, 获得更为平滑的远期收益率曲线。类似的, Shea (1984
8、) 5提出了 B-样条模型, Fisher et al. (1995) 6提出了平滑样条模型。以上这些方法主要采用分段曲线对收益率曲线进行拟合, 因此被统称为样条类模型。另外一些学者采用了整段曲线对收益曲线进行拟合的思路, 即所谓的参数化拟合模型, 比如 Nelson and Siegel (1987) 7提出的 Nelson-Siege 模型, 以及在 NS 模型基础上, Svennson (1994) 8提出的 Svennson 模型。针对已有的这些参数模型, Bliss (1997) 9提出了交叉效度方法检验这些模型的有效性。再后来, Diebold and Li (2002) 10基于
9、 NS 模型提出了动态 NS (DNS) 模型, 估计了不同时刻刻画收益率曲线水平、斜率和曲度的三个因子。周子康等 (2008) 25提出了 NSM模型, 他们通过对指数多项式添加扩展项, 调整了收益率曲线的形状, 既保留了 NS 类模型的经济学含义和参数的稳健性, 也克服了 NS 类模型的单峰特征。张蕊等 (2009) 26通过在 DNS 模型中引入第四个因子, 建立了四因子的动态NS 利率期限结构模型, 利用 Kalman 滤波方法处理了非线性最优化问题。在模型的应用方面, 王志强和康书隆 (2010) 27针对经典的 NS 模型在实际应用中存在部分久期配比免疫问题, 提出利用收益率预期信
10、息对模型进行动态调整的思路, 从而改进了 NS 模型的应用。在模型的估计方面, De Rezende and Ferreira (2014) 11提出了利用分位数回归估计扩展的 Nelson-Siegel 模型的方法。沈根祥和陈映洲 (2015) 28通过在 DNS 模型中引入新的斜率因子, 从而构造了双斜率的 DNS 利率期限结构模型, 提高了模型对短期收益率的静态拟合和动态预测绩效。尚玉皇等 (2015) 29通过对 DNS 模型进行扩展, 构建一种混频 Nelson-Siegel 模型。张雪莹等 (2017) 30在 Diebold et al. (2006) 12提出的动态 Nelso
11、n-Siegel 模型中, 通过引入政府债券的供给和需求变量, 讨论了国债供求关系、利率期限结构与宏观经济变量之间的变动关系, 构建了含有国债供求变量的动态 Nelson-Siegel 模型。目前这两类利率期限结构的经验估计方法已经被业界的 Bloomberg 和 Reuters 的电子信息系统所采用。从模型拟合所采用的债券数据类别来看, 以上的研究几乎都是基于政府债券数据来估计无风险利率的期限结构, 相比而言, 针对可违约债券利率的期限结构估计的研究相对较少。尤其是国内的相关研究更少, 一个重要的原因就是, 无论是从发行量还是从发行规模上来看, 可违约债券都相对落后于发达的国债市场, 从而相
12、应的数据也较少, 对于某些期限较长的可违约债券来说, 发行数量更少。根据中国债券市场数据显示, 2015 年中国债券市场各券种未结清数量占比分别为政府债 34.62%, 银行债 16.52%, 公司和企业债 5.12%, 金融类企业短期融资券 22.77%, 其他债券 20.97%。显然, 相比政府债券, 可违约债券 (公司债和企业债) 在未结清的数量方面相形见绌。从现有的文献来看, 最早研究企业债券的利率期限结构估计的是 Schwartz (1998) 13, 他提出先用信用评级作为分类标准, 将所有的企业债券划分成不同的组别, 然后构建每一组内债券的利率和期限之间的变动关系。不过这种估计思
13、路有一个较大的缺点:组内样本容量较小。这就使得对收益率曲线估计的精度较低, 表现为曲线的平滑度较低。为了增加组内的样本容量, Houweling et al. (2001) 14和 Jankowitsch and Pichler (2002) 15提出了对企业债券和政府债券的进行联合建模的思路, 充分利用政府债券发行量较大的优点, 以增加样本容量, 这样针对每一个信用评级水平, 都可以生成信用价差曲线的估计量, 而且可以获得更为平滑的收益率曲线。Krishnan et al. (2010) 16沿着 Diebold and Li (2006) 10提出的参数化方法, 基于发行公司作为分类标准对
14、债券进行分类, 利用指数多项式来模型化价差曲线的差。在此基础上, Jarrow et al. (2012) 17基于样条的模型将企业债务的期限结构描述为无风险期限结构和一个价差曲线的和, 然后利用非线性最优对模型参数进行了估计。虽然后面这几个研究通过增加政府债券来提高样本的容量, 从而改进了模型估计的精度, 不过这仅仅是一种权宜之计, 对于单纯估计可违约债券利率期限结构的研究, 仍然有待进一步探索。为了克服可违约债券的利率期限结构估计中出现的某些组内样本数据较少的问题, 本文提出了利用贝叶斯分层模型 (Gelman et al.2013) 18对所有的分组进行联合估计的思路。贝叶斯分层模型在生
15、物、心理学和教育学等社会学科中应用广泛, 它特别适用于参数多于样本点的情形。从现有的研究来看, 将贝叶斯分层模型引入到利率期限结构估计中的研究思路几乎还是一个空白, 本文试图在这一方面进行探索。本文首先在 Svensson 利率期限结构模型框架内, 构建可违约债券价格的贝叶斯分层模型, 并给出分层 Dirichlet 后验分布估计的 MCMC 算法的具体实现过程。其次, 利用中国债券交易所市场的债券数据对贝叶斯分层模型和经典的单曲线模型进行了对比实证分析。最后, 提出了贝叶斯分层模型在各种利率期限结构研究中的应用前景。模型构建及其估计方法债券的利率期限结构是指在相同的违约风险水平下, 在某一时
16、刻, 不同的到期期限与对应的零息债券到期收益率之间的关系。债券利率期限结构的经验估计是指以零息债券的市场价格为基础, 找到某个平滑函数来拟合某一时点的债券利率与不同期限之间的变动关系。不过市场上大多数债券都是附息债券, 零息债券较少, 因此需要通过某种方法从附息债券价格中推导出零息债券的到期收益率。基本的思路为:附息债券可以看作是一系列不同期限零息债券的组合, 附息债券的价格应该等于复制其现金流量的所有零息债券的价值的总和。因此, 可以用零息债券的利率期限结构来计算附息债券的价格。根据零息债券和附息债券的这种关系, 可以利用实际市场中的付息债券的价格倒推出零息债券的利率期限结构。一、拟合函数与
17、权重的选择考虑 n 只同等信用质量的附息债券, 记 tm i为第 i 只债券的到期日, 其中 i=1, 2, n, 在债券有效期内需要多次支付现金流 (利息或本金) C (i, j) , 支付时刻为 ti, j (t) , 其中 j=1, 2, mi, mi为第 i 只债券的最大支付次数。根据现金流贴现原则, 第 i 只附息债券在当前时刻 t 的理论价格 P (t, tm i) 可以如下计算:其中 y (t, ti, j) 表示第 i 只债券在时刻 ti, j的到期收益率。假设 g (t, ti, j;) 为备选的近似函数, 其中 为待估计参数向量。那么 P (t, tmi) 的估计值为这样我
18、们可以构造第 i 只债券的市场价格与理论价格之间的非线性回归模型其中 Pi为第 i 只债券的市场价格, 为债券的理论价格, i是误差项, 假设满足 iN (0, ) , 其中 为精度 (逆方差) 。在二次损失函数准则下, 使得下面的目标函数最小时的参数向量 即为待估计参数向量 的最优值:本文选取 g (t, T;) 为 Svensson (1994) 8函数以对收益率曲线 y (t, T) 进行整体逼近, 即:其中 = ( 0, 1, 2, 3) 为形状系数, = ( 1, 2) 为缩减因子系数。Svensson 函数是由 Svensson (1994) 8在 NelsonSiegel 函数基
19、础上提出的, 它可以生成在实践中经常见到的一个较为宽泛的曲线的形状, 曲线形状完全由四个参数所决定。 0刻画了利率的长期趋势, 1刻画了利率的短期行为, 2和 3描述了利率的中期行为, 这两个参数共同决定了曲线的曲率和极值点的特征。这些参数使得利率期限结构的曲线更为灵活多变, 它可以刻画水平型、单调型、V 型、倒 V 型和驼峰型的曲线形状。接下来的问题就是如何量化权重 wi。B o l d e r a n d Streliski (1999) 19认为, 既然债券的久期综合了到期收益率、价格和期限三者的信息, 那么利用久期定义的权重可以将这些信息融合进估计的过程中。下面在不考虑其他因素的情况下
20、, 我们沿用该思路将第 i 个债券的权重定义为其中 Di为第 i 只债券的麦考利久期。麦考利久期是 Macaulay (1938) 20在全美经济研究局 (NBER) 的一次研究报告中提出的, 它是利用债券现金流的现值作为权重的债券的到期日的加权平均值。具体的计算公式如下其中 Ci为 t 时刻需要支付的现金流, T 为债券到期日, r 为到期收益率。这样, 在一组债券中, 对于具有较短到期日的哪些债券来说, 权重将趋于更高。上面给出的利率期限结构估计的静态模型, 可以用于政府和企业债券的期限结构的估计。在具体应用的时候, 通常假设政府债券都有同样的期限结构。企业债券因为具有不同的违约风险水平,
21、 通常会根据某些分类准则将企业债券划分成不同的族群, 然后对每一族群分别估计它们的期限结构。在实践中, 一个流行的分类准则就是债券的信用评级。二、利率期限结构的贝叶斯分层模型在利用上述的单曲线估计方法对可违约债券进行估计时, 经常会面临小样本问题, 即在某些分组中, 只有少数几只债券。这在债券市场上一个常见的现象, 尤其在中国不发达的债券市场上这种问题更为严重。显然, 在单曲线估计方法下, 小样本问题会导致组内的估计精度会大幅度降低。为了克服小样本带来的估计精度较低的问题, 本文提出了整体联合估计的贝叶斯分层模型的思路, 通过对所有债券分组的期限结构进行联合建模, 来抵消组内样本数量较少的问题
22、, 从而提高估计的精度。实际上, 在贝叶斯分析框架内估计利率期限结构模型的思路并不新鲜, Li and Yu (2005) 21早就提出了在利用贝叶斯分析框架来估计利率期限结构模型的思路。不过从估计思路来看, 他们的方法仍然属于单曲线估计方法, 而本文则采用了多层先验分布和联合估计的方法思路。另外, 他们利用样条函数来分段刻画收益率曲线, 本文采用的是收益率曲线的参数函数整体拟合方法。假设根据 K 个不同的信用级别把所有的企业债券划分成 K 组, 这对应着需要估计 K 个不同的期限结构。令 K为刻画第 k 个期限结构的参数向量, 那么需要对参数向量 = 1, 2, K进行估计。为了克服可能会出
23、现的个别组内样本容量过小的问题, 将参数向量 设定多层先验分布, 构建贝叶斯分层模型, 这样就可以利用所有 K 组债券的信息对参数向量 进行联合估计。债券价格的贝叶斯分层模型主要包括下面的三个部分:其中 Pk i为第 k 个分组中第 i 只债券的价格, 其中 i=1, 2, , nk, nk表示第k 组中包含 nk个债券, k=1, 2, , K。债券价格的似然函数分布 P (Pki| k, ) (i=1, 2, , n k, k=1, 2, , K) 由下面的非线性回归给出, 即债券的市场价格被模型化为 , 其中 ki是误差项, 假设满足 kiN (0, ) , 其中 为精度 (逆方差 =1
24、/) 。该式等价的概率模型为其中 为第 k 组债券中的第 i 个债券的理论价格, 根据式子 (2) 可知有如下形式C (k i, j) 为第 k 组债券中的第 i 个债券在时刻为 tk i, j (tti, jmki) 所支付的现金流 (利息或本金) , j=1, 2, , m ki, mki为第 i 只债券的最大支付次数;g (t, t k i, j; k) 被用于近似描述在时刻 t 的 K 个待估计的期限结构的第k 个期限结构, 这样每一个期限结构都通过一个四维向量 k= ( k0, k1, k2, k3) 来刻画。在上面的设定下, 我们可以得到债券价格的似然函数 p= (Pki| k)
25、(i=1, 2, , n k, k=1, 2, , K) 。为了估计模型参数 k, 本文设计了一个有限混合先验分布, 以保证模型能够捕获特定主体参数之间的异质性 (包括异常点, 超扩散点和多样态) 。比如对于某些投资级的债券, 由于某种原因导致这些债券的市场价格变得很低, 这些债券应当被降级为垃圾级, 如果这些债券的评级并没有及时发生改变, 就会出现异常点。在数据概率建模中, 对于数据的不同局部具有不同的变化特征时, 单参数分布族无法给予确切地描述, 但有限混合分布模型却能对其进行有效的刻画, 而且有限混合分布模型具有良好的适应性和模拟性, 它广泛的被应用于生物、基因工程、信息科学和金融保险等
26、社会各领域。比如混合泊松分布在医学和保险精算领域有广泛应用;混合指数分布在信息工程领域里有一定应用;而正态混合分布应用更是广泛, 理论证明任何有限分布都可以由等协差阵的有限正态混合分布任意逼近, 而且正态混合分布模型也具有较高的灵活性和高效性的计算优势。关于正态混合分布更为详细的相关内容可以参考 Yu and Deng (2015) 22。在贝叶斯分层模型中, 将参数向量 k的先验分布设定为正态混合分布可以提高完全后验推断中的计算效率。我们用一个正态混合分布来模型化期限结构参数向量 k的分布 p ( k|) , 即其中 为混合比例, 它由各组的债券在所有债券中的数量占比决定, k为位置参数,
27、S 为常数协方差矩阵, 它等于样本协方差。这样超参数可以写成 =G。贝叶斯模型的分层更多的是体现在对超参数=G的分布的设定。下面沿用文献 Mller and Quintana (2015) 23的方法给出超参数 =G的超先验分布的设定。设 G 服从 Dirichlet 过程, 即 GDP (G0, M) , 其中基础分布 G0服从多元正态分布, 即 G0N (b, B) , 它刻画了位置参数 G 的均值, M 服从伽马分布和 MGa (am, bm) , 它决定了 G 围绕 G0波动大小的程度。矩 b 和 B 被选择为与混合核是共轭的:bN (b 0, B0) 和 BWishart (r, (
28、r W) ) 。对于精度 , 设定它服从伽马分布, 即 Ga (a , b ) 。综上所述, 债券价格的贝叶斯分层模型如下给出:在本文设定的先验分布的超参数中, 混合基础测度 G0和协方差矩阵 S 对于所有的参数 k都是一样的。这样后验分布推断就可以利用所有期限结构共享的信息。通过设定位置超参数 G 服从 Dirichlet 过程的先验分布, 贝叶斯分层模型可以借用整个期限结构的力量, 对每一个分组中的少数几个债券的期限结构进行联合建模, 从而可以有效解决组内样本数量较少所带来的估计精度不足的问题。显然, 上面给出的贝叶斯分层模型的后验分布没有封闭解。利用 MCMC 算法从后验分布中进行抽样,
29、 可以获得参数的贝叶斯估计的近似解。令 K 为待估计的期限结构的个数, n k为期限结构 k (k=1, 2, k) 中的债券的个数。下面给出模型的 MCMC 算法。实证结果及分析一、样本选取本文所使用的数据是从和讯网债券债券行情抓取的 2017 年 4 月 6 日 15:00 更新的交易所市场的债券交易数据, 选取的变量主要包括:信用评级、本金、息票率、到期日、剩余年限、息票支付日、修正久期和最新报价。债券样本的信用评级主要包括投资级债券 (AAA, AA, A, BBB) , 最大到期日为15 年。我们排除了具有负的收益的所有债券, 因为这些债券具有极差的流动性。最后样本数据集包含了国内
30、248 只未结清的企业债券的数据, 基于信用评级的分类包括四组:AAA, AA, A 和 BBB;每一组中分别包括 49、179、13 和 7 只债券。表 1 基于信用评级的债券的分布情况 下载原表 表 2 基于剩余年限 (列) 和信用评级 (行) 的债券的分布情况 下载原表 为了进一步考察到期日与债券个数的关系, 表 2 给出了将剩余年限划分成了下面几组:表 2 表明, 债券的个数对于 1 年期以上的中长期债券来说, 随着时间增长, 债券的个数急速减少, 比如, 在剩余期限为 15 年的区间中有 176 只债券, 它解释了样本中债券数量的 71%。而在 10 以上的区间中, 债券的个数只有
31、1 只。显然, 剩余期限越短, 债券的流动性越强, 这可以部分的解释投资者对中短期债券更加偏好的流动性偏好理论。本小节将上面的债券价格贝叶斯分层模型方法用于估计企业债券的期限结构。为了进行对比, 本节也将利用单曲线方法对不同的期限结构进行估计。二、实证结果及分析1.利率期限结构估计单曲线方法利用现金流贴现原理估计得到基于信用评级的期限结构。在本文提出的利率期限结构的贝叶斯分层模型中, 利用了作者自己编写的非线性似然函数程序, 结合 R 软件包“DPpackage”和“termstrc”对模型进行了估计, 软件包“DPpackage”专门针对贝叶斯非参数和半参数模型, 利用模拟抽样技术从后验分布
32、中抽样, 其中的先验分布为服从 Dirichlet 过程的分层先验分布。本文通过最小化 (4) 中的加权平方误差来估计参数, 权重由 (6) 定义, 最优化问题利用了 R 软件中的 nlminb () 函数进行数值计算。在利率的期限结构估计中, 第 k 个期限结构的参数被估计为参数向量 k的后验均值, 它由后验样本的平均值来近似。其中 N 为 M C M C 算法中的抽样迭代的次数, b 为 MCMC 算法中的预烧期, K 为期限结构的个数, 在本文中 K=4。对于精度参数 也有类似的估计结构。被估计的参数列在表 3 中, 其中所有参数的马氏链路径最终都收敛在一定的区域里, 波动比较平稳, 且
33、没有明显的周期性和趋势性。针对不同的信用级别, 利用该方法都获得了相应的参数估计。利用可替代的初始值, 在所有情形中的被估计参数都与表 3 中报告的数值基本一致。表 3 基于信用评级分类的期限结构的被估计参数 下载原表 为了进行对比, 估计量的表达沿用了 Nelson and Siegel (1987) 7引入的原始参数化思路。对于利用贝叶斯分层模型获得的估计量, 在括号中给出了估计量的 90%的置信区间。图 1 给出在四个不同的信用级别 (AAA, AA, A, BBB) 下的期限结构估计, 给出了期限结构估计的单一曲线方法和贝叶斯分层模型估计。从图 1 可以看出利用单曲线模型估计的利率期限
34、结构时, AAA 级和 AA 级表现出了较为合理的曲线形状, 即到期日越长, 收益率越高。但是 A 级和 BBB 级的收益率曲线表现出了与现实和理论不符的严重问题, 比如 A 级和 BBB 级的收益率曲线不但表现出了不合理的隆起形状, 甚至在长期, A 级和 BBB 级收益率曲线竟然低于 AA 级的收益率曲线, 这显然与信用级别越低, 收益率越高的理论和现实相矛盾。如果探究其出现估计与现实出现较大偏差的原因, 一个重要的原因就是, A 级和 BBB 级的债券数据样本容量较小带来的估计偏差, 比如 A 级债券的样本个数为 13, BBB 级债券的样本个数为 7。相比而言, 基于贝叶斯分层模型所估计的收益曲线则表现出了与现实和理论相一致的形状, 它们的“顺序”与理论一致, 这和信用风险和收益之间的预期关系是一致的:信用评级越低, 收益越高。