1、Presented ByHarry Mills / PRESENTATIONPRO第四章Eviews应用案例 通货膨胀预测分析汪昌云 中国人民大学财政金融学院 教授张成思 中国人民大学财政金融学院 教授戴稳胜 中国人民大学财政金融学院 副教授Presented ByHarry Mills / PRESENTATIONPRO本章内容梗概Eviews预测基础在 Eviews中进行预测分析利用 Eviews进行中国 CPI预测Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 预测的基础知识 预测序列 是指在 Eviews调用 “预测 (Forec
2、ast)”选项的预测设定窗口 后储存预测结果的序列 。 预测样本 指的是 EViews计算预测值(拟合值)的样本区间。如果预测值是不可计算的,那么就将返回一个缺失值( NA)。有些情况下, EViews会对样本进行自动调整,以防止出现预测序列全部为缺失值的情况。需要注意的是,预测样本有可能会与估计方程所用的样本区间重叠。 所有样本数据可分为两段,一段为训练数据集,用以估计(或称训练)预测模型,另一段为测试数据集,用以测试训练出的模型的估计效果Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 如果 预测序列中不包含在预测样本中的值,有两个处理
3、方式可供选择。 默认情况下, EViews将把预测值序列中预测样本外的部分赋予因变量的实际值, 如果在预测设定窗口中关掉 Insert actuals for out-of-sample选项,那么预测序列中预测样本外的值将设为缺失值( NA)。 如果使用已经存在的预测序列的名称,每次预测后预测值序列的所有数据将会被重写,预测序列中已经存在的数值将会丢失Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 点预测值 对于预测样本的每个观测值, EViews都会利用估计得到参数、外生自变量、滞后内生变量的实际值或拟合值以及残差值,来计算出因变量的拟
4、合值。 生成预测值的方法主要取决于预测使用的模型及用户设臵。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 点预测 以 不包含滞后内生自变量和 ARMA项的线性回归模型 为例 假定已经估计了下面的模型:y c x z单击估计等式结果上方工具栏中的 Forecast按钮,指定预测期 对预测期的每个观测值, EViews都会利用估计参数和自变量的对应值(即 X和 Z),来生成 Y的拟合值,即: 需要确保预测期内的所有观测值对应的外生变量均为有效值。如果预测样本中有数据缺失,那么对应的预测值将为缺失值( NA)。 ( 1 ) ( 2) ( 3
5、)t t ty c c x c z Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 调整缺失项 预测值的缺失项生成有两种情况:一种是 某个自变量有缺失值 ,另一种是 某个所需的回归变量的值在工作簿的时间范围之外 。 这包含了 AR模型中的隐误差项。 如果预测方程中没有动态变量(例如:没有滞后内生变量或 ARMA误差项),那么预测序列中的缺失值将不会影响以后各期的预测值。 如果 有动态项,预测序列中单个缺失值就会影响到未来所有的预测值。 此时 , EViews会向前期移动预测样本的开始点,直至包含一个有效预测值。如果不进行这些调整,使用者就
6、必须自行指定某个合适的值,否则,预测结果将会全部由缺失值组成。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 假定使用者想用下列方程项进行动态预测:y c y(-1) ar(1) 此时如果设定预测样本和工作簿时间范围的起始点相同,那么EViews将会把预测样本向后推迟两期,然后使用预测样本前面的观测值作为滞后变量来进行预测。 向后推迟两期,是因为滞后内生变量使得残差损失一期观测值,所以对误差项的预测只能从第三期开始。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 预测的误差和方差 假
7、定真实模型 为 : 其中, 是服从独立同分布且均值为零的随机扰动项, 是未知参数向量。 放宽 “ 是独立的 ” 这个约束条件 使用真实模型得到的 y是不可知的,但是我们估计得到未知参数 的估计值 b, 设定误差项为零。对 y的点估计可以从下式中取得: 预测是有误差的,这个误差其实就是实际值与预测值的差,即ttt xy ttbxy tt bxye ttt Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 假设模型是正确设定的,那么预测误差来源有两种: 残差不确定性 系数不确定性Presented ByHarry Mills / PRESENT
8、ATIONPROEviews预测基础 残差的不确定性 公式中的残差 在预测期是未知的并被它们的期望值代替。残差的期望为零,但是个别值不为零,个别误差的变化越大,预测的总体误差就越大。 一般使用回归标准差来衡量误差的变化程度(在回归等式输出界面中用“ S.E. of regression”表示),残差的不确定性是预测误差的主要来源。 在动态预测中,残差不确定性是复合形成的,这是由于滞后因变量和 ARMA项取决于滞后残差。 EViews同样将这些值设臵为等于它们的期望值,然而这些期望值与真实值是不同的。这种额外的预测不确定性的来源有超过预测区间的趋势,导致这种动态预测有越来越多的预测误差。Pres
9、ented ByHarry Mills / PRESENTATIONPROEviews预测基础 系数的不确定性 在随机模式下,回归等式中的估计得到系数 b不同于真实的系数 。在回归等式输出界面给出的估计系数的标准差可以衡量估计参数反映参数的真实值的准确程度。 系数不确定性的影响程度取决于外生变量。在计算预测值的过程中,由于估计系数与外生变量 x相乘,所以外生变量与其平均值相差越多,预测的不确定性越大。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 预测的不确定性 预测的不确定性由预测标准差来衡量。对于一个不包含滞后因变量或者 ARMA项的
10、回归方程,预测标准误差计算公式如下:其中 s是回归标准差 预测标准差同时解释了 残差不确定性 和 系数不确定性 。利用通过最小二乘法估计得到的线性回归模型进行的点估计预测,这从某种意义上讲是最优的,因为它们在线性无偏估计的预测中拥有最小的预测方差。此外,如果残差呈正态分布,那么预测误差将呈现 t分布,预测值分布的区间也就很容易确定了。tt xXXxssef or e c as t 1 )(1 Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 如果在进行预测时,在预测标准差( S.E.)对话框中输入一个名称,那么 EViews会计算出预测标准
11、差序列并将其保存在工作簿中。预测标准差可以用来确定预测区间。 如果选择 Do graph选项进行输出, EViews会通过加减两个标准差得到预测区间,并绘制预测图。这两个标准差的范围提供了大约 95%的预测区间。也就是说如果假设你做 进行 了很多次预测,那么因变量的实际值会有 95%的几率落在区间内。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 预测效果评估 基于已经估计好的中国 CPI的 AR( 2)模型,我们可以创建一个对2005M01到 2009M11中国 CPI的动态预测。 如果我们勾选了 Forecast evaluation
12、选项,同时有预测变量在预测期的实际数值的话, EViews将会给出评估预测结果的统计数据Presented ByHarry Mills / PRESENTATIONPROEviews预测基础中国 CPI预测结果Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 注意事项 如果没有预测期因变量的实际数据的话,那么 EViews将无法给出预测效果评价。 预测效果评价可按两种格式保存。如果你选择了 Do graph选项,预测结果评价会出现在一张预测图旁边。如果你希望评价结果单独以表格的形式出现,就不要选择预测对话框中的Do graph选项。Pres
13、ented ByHarry Mills / PRESENTATIONPROEviews预测基础 计算预测误差的统计指标 以拟预测测试数据集结果来评估 假定预测期为 j=T+1,T+2 , T+h,并指定预测期 t中实际值与预测值分别为 和均方根误差( Root Mean Squared Error)平均绝对误差( Mean Absolute Error)平均相对误差( Mean Absolute Percentage Error)泰勒不等系数( Theil Inequality Coefficient)21( ) /Th tttTy y h1 /Th tttTy y h1100 /Th ttt
14、T tyy hy212211( ) / /ThtttTT h T httt T t Ty y hy h y h ty tyPresented ByHarry Mills / PRESENTATIONPROEviews预测基础 均方根误差和平均绝对误差与 因变量的规模有关。这些指标为相对指标,用来比较同一个序列用不同模型得到的不同预测结果。误差越小,说明该模型的预测能力就越强。 平均相对误差和泰勒不等系数 与因变量规模无关 。 泰勒不等系数的值在 0和 1之间,当泰勒不等系数等于零时,是最优拟合。Presented ByHarry Mills / PRESENTATIONPROEviews预测基
15、础 平均预测误差可以分解为: 、 、 和 分别是 和 的平均值和有偏标准偏差。 r为和 的相关系数。2 2 2 ( ) / ( ( / ) ( ) 2 ( 1 )t t t y y y yy y h y h y s s r s s ) - /tyh yys ys tytyyyPresented ByHarry Mills / PRESENTATIONPROEviews预测基础 常见误差衡量指标偏倚比例( Bias Proportion)方差比例( Variance Proportion)协方差比例( Covariance Proportion)22( / )( ) /ttty h yy y h
16、 ) -22( - )( ) /yyttssy y h 22(1 )( ) /yyttr s sy y h 偏倚比例 说明了预测均值与序列实际值的偏离程度。 方差比例 表明预测值方差与序列实际方差的偏离程度。 协方差比例 衡量了剩余的非系统误差的大小。 偏差比,方差比以及协方差比之和为 1。 如果偏差比例和方差比例较小,协方差比例比较大,那么可以说预测结果比较理想。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 含有滞后因变量的预测 如果我们在之前估计的方程的右手侧增加 Y的一期滞后项:y c x z y(-1) 在估计完成后,单击 Fo
17、recast按钮然后在对话框中输入序列名称进行预测。 如何判断方程等号右边 Y的滞后值 ?通常有两种方法: 动态预测 和 静态预测 。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 动态预测 如果选择了动态预测,那么 EViews将从预测期的第一期开始执行 Y的多步骤预测。对于这个一阶滞后模型, EViews进行了以下处理1. 预测期中第一期的观测值将使用滞后变量 Y的实际值。因此,设 S是预测样本的第一个观测值, EViews将计算:是预测期前一期的滞后内生变量,这就是向下一期预测。2. 对以后各期观测值的预测将要用到预测期第一期 Y的
18、预测值:1)4()3()2()1( ssss yczcxccy1sy1)4()3()2()1( ksksksks yczcxccyPresented ByHarry Mills / PRESENTATIONPROEviews预测基础3. 这种预测与向下一期预测有着显著不同。如果估计的方程中还有更多的变量 Y的滞后项,那么以上计算方法可以适当修改 , 例如,如果方程中有三个 Y的滞后项。4. 预测样本中的第一个观测值 使用 、 、 的真实值计算5. 预测样本的第二个观测值 使用 的真实值,和 的一期滞后项的预测值 计算得到。6. 预测样本的第三个观测值 使用 的真实值,和 的一期和两期滞后项的预
19、测值 和 计算得到。7. 在计算随后各期的在预测观测值时,三期滞后项均使用预测值。sy 1sy2sy3sy3sy1sy 12, ss yy 1sysy1sy 2sy1sy syPresented ByHarry Mills / PRESENTATIONPROEviews预测基础 进行动态预测时,样本起始值的选择非常重要。由于动态预测重复使用滞后因变量的预测值,所以本质上,这是一种从第一个预测数据开始的多步骤预测。 这种预测方式可以被解释为只利用预测期最开始时的已知信息来计算的随后各期的预测值。 动态预测要求预测期内各外生变量的每个观测值均为已知,并且计算预测样本的初始值所需的因变量的各个滞后项
20、的值也必须是已知的。在必要的情况下,预测样本将被调整。如果自变量有缺失值,将会使本期预测值以及随后各期预测值为缺失值( NA)。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 静态预测 静态预测对因变量执行一系列的向下一期预测。对预测样本中的每一个观测值, EViews计算如下: 内生变量的各个滞后项采用的实际值而非预测值进行计算。1)4()3()2()1( ksksksks yczcxccyPresented ByHarry Mills / PRESENTATIONPROEviews预测基础 静态预测要求外生变量以及任何滞后内生变量在预
21、测期内的实际观测值可以获得。 在必要的情况下, EViews将会调整预测期以获得在预测期之前滞后变量。如果某个时期的数据都是未知的,那么当期的预测值将为缺失值,但是这不会影响以后各期的预测。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 动态预测与静态预测的比较 两种方法生成的第一个预测值是相同,因此两种方法生成的预测序列在预测期中的第一个观测值是相同的。 只有存在滞后因变量或者 ARMA项时,两种方法得到的以后各期的值才会不同。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 含有
22、ARMA误差项的预测 结构预测 默认方式下, EViews利用估计 ARMA结构预测残差值。 如果希望假设 ARMA误差总是零,那么在预测设定窗口选定Structural ( ignore ARMA )选项 , 以进行结构预测 , 这样EViews在计算预测值时便假设误差总是为零。 如果被估计方程中没有 ARMA项,该选项对预测无影响。Presented ByHarry Mills / PRESENTATIONPROEviews预测基础 含有 AR误差项的预测 在估计包含 AR误差项的方程的时候, EViews将会把从方程得到的残差预测值加到基于右手侧变量的结构模型预测中。 为了得到计算残差的估计值, EViews需要残差的滞后项的估计值和实际值。对于预测样本中的第一个观测值, EViews将利用预测期之前的数据作为滞后残差进行计算。如果用于计算残差滞后项的前样本数据是未知的, EViews将调整预测样本,并用实际值给预测序列赋值。 如果选择了 Dynamic选项,预测时因变量和残差项的滞后项都会使用 预测值 。 如果选择 Static,因变量和残差项的滞后项都会使用为 实际值 。