1、利率期限结构的主成分分析胡志强 马文博l利率期限结构的相关概念l主成分分析法l利率期限结构的主成分分析利率期限结构的相关概念 利率期限结构的定义利率 期限结构是指 某个时点不同 期限的即期利率与到期期限的关系及变化规律。 由于 零息债券 的到期收益率等于 相同期限的市场即期利率 ,因此利率期限结构一般用反映零 息债券的到期收益率与期限之间的一 条曲线来表示,如水平线、向上倾斜和向下倾斜的曲线。 几种不同类型的利率期限结构在使用久期和凸度来衡量 债券 的利率 风险时 ,能 有效发挥作用的一个重要前提是利率期限结构的平行移动 。但是研究 发现,国债收益率曲线的移动方式并不是只有平行移动一种,同时也
2、存在着收益率曲线的斜率和曲率变化。收益率曲线的非平行移动的存在,削弱了债券组合投资中久期和凸性利率风险管理策略的有效性。因此,久期和凸性在利率市场化逐步推进,市场上利率风险逐渐扩大的今天,已经显得较为落后。20世纪 90年代之后,主成分分析技术被运用到从时间序列角度捕捉影响收益率曲线变化的风险因素,成为了债券投资组合的重要的风险管理工具 。本 次实验课的主要目的就是运用主成分分析的方法 来研究我国国债收益率曲线的变动模式及其在国债投资组合中利率风险管理中的 应用 。主成分分析法l线性代数相关知识设 A是 n阶矩阵,若有 n维非零列向量 x使得以下关系成立 :则 称 是 A的一个特征值,而 x是
3、 A的属于特征值 的一个 特征向量若 A有 n个线性无关的 特征向量 ,我们 还可以将其对角化:令 , 则 , 其中 是由特征值组成的对角矩阵l主成分分析法简介主成分分析 是将多指标化为少数几个综合指标的一种统计分析方法 。在 实际问题中 ,由于 变量太多,彼此之间往往还存在着一定的相关性,因而使得所观测到的数据在一定程度上反映的信息有所重叠。而且当变量较多时,在高维空间中研究样本数据的分布规律比较复杂,势必会增加问题分析的难度。人们自然希望能够用较少的综合变量来代替原来复杂的多变量,而这几个综合变量又能够尽可能多的反映原始变量的信息,并且彼此之间互不相关,利用这种降维的 思想 , 产生 了主
4、成分分析的统计方法。先 假定只有二维,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值;如果这些数据形成一个椭圆形状的点阵(这在变量的二维正态的假定下是可能的 ) ,那么 这个椭圆有一个长轴和一个短轴。在短轴方向上,数据变化很少;在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点的变化了;这样,由二维到一维的降维就自然完成了。 当坐标轴和椭圆的长短轴平行,那么代表长轴的变量就描述了数据的主要变化,而代表短轴的变量就描述了数据的次要变化。 但是,坐标轴通常并不和椭圆的长短轴平行。因此,需要寻找椭圆的长短轴,并进行变换,使得新变量和椭圆
5、的长短轴平行。 如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的两个变量(舍去次要的一维),降维就完成了。 椭圆(球)的长短轴相差得越大,降维也越有道理。 对于多维变量的情况和二维类似,也有高维的椭球,只不过无法直观地看见罢了。 首先把高维椭球的主轴找出来,再用代表大多数数据信息的最长的几个轴作为新变量;这样,主成分分析就基本完成了。 注意,和二维情况类似,高维椭球的主轴也是互相垂直的。这些互相正交的新变量是原先变量的线性组合,叫做主成分(principal component)。 主成分分析通常的做法是,寻求原指标的线性组合 。即 :主成分 满足 如下条件:1.每个主成分的系数
6、平方和 为 1。 即2.主成分之间相互独立,即无重叠的信息。即3.主成分的方差依次递减,重要性依次递减,即为了分析原始变量和主成分之间的关系,我们可以利用原始变量与主成分之间的 相关系数 :写 成矩阵形式:则其中 为 对应 的特征根,所以原始变量和主成分之间的相关系数可以写为 :因此可以通过比较 Y的特征根来决定主成分的顺序,从而达到降维的目的利率期限结构的主成分分析l利率期限结构的估计Nelson-Siegel模型是一种通过参数模型来描述曲线动态变化的方法,大量应用于利率期限结构的估计中,由 Nelson和Siegel在 1987年提出。瞬时远期利率可以用包含参数的如下模型来描述 :( 1)
7、其中, x是参数向量, 是固定时间常数,之后讨论 的取值方法。 Nelson和 Siegel运用拉盖尔函数构造出了到期收益率的表达式如下:( 2) 由于 R(t,x)是 f(t,x)的一种积分,因此两者的图形属性一定是一致的,为了 研究 0、 1、 2 的性质,所以暂时假定 =5,得到 R( t,x)相对 0、 1、 2的 偏导数如 图 1所示图 1 =5时, 利率对参数的敏感度0 是 R(t,x)在期限 t趋 于无 穷 大 时 的 渐进值 ,且必 为 正数,当期限 t无 穷 大 时 , 长 期利率无限接近 渐 近 线 ( 也即收益率无限接近于 0 )。利率 对 0 的敏感度恒 为 1, 短期
8、利率 的 变动对 所有的收益率引起的 变 化是一 样 且恒定的 , 对 于任意的 t, 0对 R(t,x)的影响是恒定的, 因此 0 的 变动 整体改 变 利率期限 结 构的水平高度 ,可以理解 为 “水平因子 ”。1 参数 , 当 t不断增加 时 , 从 上 图 可以看出的 1 系数衰减 为 0, 说 明 1 的影响力在 t递 增的过 程中逐 渐 减弱, 因此可以将 1 看作是短期因素 ,它在短期中 发挥 重要作用, 长 期而言作用微乎其微。同 时 , 由于 1 0时 , 收益率曲 线 斜率 为负 , 1 0时 ,收益率曲 线为 正,且 的 绝对值 越大,收益率曲 线 越陡峭, 因此也可以将
9、 1 理解 为 “斜率因子 ”。2 参数 , 从 上 图 中可以看出 , 2 的系数随着 t的 递 增先增加后减小, 因 为 2 的系数可以从0开始,所以不是 长 期因素,同 时 它又不是单调递 减迅速衰减到 0的,因此也不是短期因素, 可以将 2 理解 为 中期因素 。 同 时 2 对不同期限的收益率影响程度是不一 样 的 ,因此可以理解 为 “曲率因子 ”。 参数,在其他参数固定不变的情况下, 决定了收益率曲线第一次驼峰出现的时间,而且也影响了 和 的衰减速度,对比 图 1和 2就 可以直观的看出 的不同取值对图形的 影响图 2 =1.5时, 利率对参数的敏感度因此对期限结构进行估计时,需
10、要选取合适的 的取值,这里采用试值法。数据选取 2008年 6月至 2013年 6月每个月的最后一天的的上交所国债数据作为样本,数据全部 来源 于 wind, 具体数据见附表 1。分别 取 =0.5,1,1.5,5,6,7,8,9,10,15,20,25,30对 公式(2)进行 最小二乘估计,分析软件为 Eviews,得到估计结果的统计表 如 下 表所 示: 0 1 2 残差平方和R2估 计值 p值 估 计值 p值 估 计值 p值0.5 3.9800 0.0000 0.2977 0.6749 -6.1596 0.0000 3.8567 0.6843 1 4.1521 0.0000 -1.227
11、4 0.0012 -3.1371 0.0001 3.1736 0.7402 1.5 4.2804 0.0000 -1.6191 0.0000 -2.2315 0.0011 2.9430 0.7591 2 4.3647 0.0000 -1.8331 0.0000 -1.6419 0.0108 2.8868 0.7637 2.5 4.4167 0.0000 -1.9610 0.0000 -1.1754 0.0628 2.8867 0.7637 3 4.4464 0.0000 -2.0357 0.0000 -0.7834 0.2176 2.8980 0.7627 3.5 4.4597 0.0000
12、-2.0753 0.0000 -0.4409 0.4974 2.9072 0.7620 4 4.4598 0.0000 -2.0902 0.0000 -0.1315 0.8450 2.9114 0.7617 4.5 4.4481 0.0000 -2.0862 0.0000 0.1564 0.8237 2.9112 0.7617 5 4.4254 0.0000 -2.0669 0.0000 0.4312 0.5586 2.9080 0.7619 6 4.3481 0.0000 -1.9890 0.0000 0.9633 0.2409 2.8965 0.7629 7 4.2281 0.0000 -
13、1.8640 0.0000 1.4950 0.1048 2.8828 0.7640 8 4.0652 0.0000 -1.6944 0.0000 2.0432 0.0486 2.8695 0.7651 9 3.8589 0.0000 -1.4812 0.0023 2.6177 0.0244 2.8576 0.7661 10 3.6087 0.0000 -1.2243 0.0293 3.2244 0.0133 2.8473 0.7669 15 1.6915 0.1651 0.7194 0.5249 6.8364 0.0016 2.8143 0.7696 20 -1.3464 0.5060 3.7
14、742 0.0578 11.5086 0.0005 2.7987 0.7709 25 -5.5102 0.0776 7.9493 0.0107 17.2852 0.0002 2.7904 0.7716 30 -10.8018 0.0162 13.2489 0.0032 24.1794 0.0001 2.7855 0.7720 具体操作:1、新建一个 workfile,选择文件类型为unstructured/undated,输入样本数据个数(本例为 42)2、导入收益率 y和时间 t的数据 :data ydata t3、构建序列 l1和 n1:series l1=(1-exp(-t/0.5)/(
15、t/0.5)series n1=(1-exp(-t/0.5)/(t/0.5)-exp(-t/0.5)4、运行参数估计程序 “ NS固定参数取值 ” ,得到 去不同值时的 OLS估计结果:file/open/program/run5、比较 不同取值时的模型估计效果,然后选取合适的取值(此例 =8)得到 N-S模型的估计结果由 Nelson-Siegel模型参数的意义可以 看出 ,0代表长期水平,应该是一个 正值 ; 1代表 短期利率和长期的利差,在上升形的利率期限结构中,该利差应该为负值, 因此 1应该 为 负值 ; 2代表 了中期利率,在 t为正且有限的时候, 应该为正值。综合考虑上述因素,而
16、且同时满足残差平方和尽可能小,模型拟合的 R2尽可能大,各参数在 5%的显著水平下尽可能显著,从之前的讨论已经知道 的取值会影响 1和 2 的衰减速度, 的值越大,衰减越慢,越适合拟合期限较长的数据,由于本次样本中到期期限在 15年之内的数据占绝大部分,因此选取 =8作为适合的取值。在 =8时, Nelson-Siegel模型的估计方程 为 :对 2008年 6月 -2013年 6月的月度样本数据根据上述方法拟合,得到每个月的 N-S拟合模型,然后每个模型取 t=0.5, 1, 2, 3, , 30得到对应期限利率估计值,为之后的主成分分析提供数据,具体结果见附表 2l利率期限结构的主成分分析
17、1、将 N-S模型估计的利率期限结构数据导入SPSS软件中:file/open/data,然后选择文件类型 (execl),以及数据所在的 sheet,完成数据导入2、进行主成分分析:Analyze/dimension reduction/factor,然后选取需要进行主成分分析的变量3、对主成分分析的结果进行分析,得到影响利率期限结构变动的三个主成分 主成分分析结果从表中 可以看出贡献最大的三个主成分的方差贡献率分别为 85.991%, 8.782%和 3.541%,而三个主成分的累计方差贡献率为 98.314%,可以看出三个主成分基本上完全包含了原始数据的方差信息,可以代表原始多维数据进行 统计 分析