1、1与时间序列相关的 STATA 命令及其统计量的解析残差 U 序列相关: DW 统计量 针对一阶自相关的(高阶无效) STATA 命令:1.先回归2.直接输入 dwstat 统计量如何看:查表 Q 统计量 针对高阶自相关 correlogram-Q-statistics STATA 命令: 1 先回归 reg 2 取出残差 predict u,residual(不要忘记逗号)3 wntestq u Q 统计量如何看:p 值越小(越接近 0)Q 值越大 表示存在自相关 具体自相关的阶数可以看自相关系数图和偏相关系数图: STATA 命令: 自相关系数图: ac u( 残差) 或者窗口操作在 Gr
2、aphics Time-series graphs correlogram(ac) 偏相关系数图: pac u 或者窗口操作在 GraphicsTime-series graphs (pac) 自相关与偏相关系数以及 Q 统计量同时表示出来的方法: corrgram u 或者是窗口操作在 StatisticsTime-seriesGraphs Autocorrelations&Partial autocorrelationsLM 统计量 针对高阶自相关STATA 命令: 1 先回归 reg 2 直接输入命令 estate bgodfrey,lags(n) 或者窗口操作 在 Statistics
3、 Postestimation(倒数第二个) Reports and Statistics(倒数第二个) 在里面选择 Breush-Godfrey LM(当然你在里面还可以找到方差膨胀因子还有 DW 统计量等常规统计量) LM 统计量如何看:P 值越小(越接近 0)表示越显著(显著拒绝原假设) ,存在序列相关 具体是几阶序列相关,你可以把滞后期写为几,当然默认是 1, (通常的方法是先看图,上面说的自相关和偏相关图以及 Q 值,然后再利用 LM 肯定) 。 平稳时间序列存在自相关的问题的解决方案残差出现序列相关的补救措施: 1、一阶自相关 :最近简单的方法是用 AR(1)模型补救,就是在加一个
4、残差的滞后项即可。 2、高阶的自相关:用 AR(n)模型补救。 2AR 模型的识别与最高阶数的确定: 可通过自相关系数来获得一些有关 AR(p) 模型的信息,如低阶 AR(p) 模型系数符号的信息。但是,对于自回归过程 AR(p),自相关系数并不能帮助我们确定 AR(p) 模型的阶数 p。所以,可以考虑使用偏自相关系数k,k,以便更加全面的描述自相关过程 AR(p)的统计特征。 且对于一个 AR(p) 模型,k,k 的最高阶数为 p,也即 AR(p) 模型的偏自相关系数是 p 阶截尾的。因此,可以通过识别 AR(p)模型的偏自相关系数的个数,来确定 AR(p) 模型的阶数 p,进而设定正确的模
5、型形式,并通过具体的估计方法估计出 AR(p) 模型的参数。 如果 AR(p)还解决不了则进一步使用:MA(q) 模型,以及 ARMA(p,q)模型 。1、 MA(q) MA(q) 的偏自相关系数的具体形式随着 q 的增加变得越来越复杂,很难给出一个关于 q 的一般表达式,但是,一个 MA(q) 模型对应于一个 AR() 模型。因此,MA(q) 模型的偏自相关系数一定呈现出某种衰减的形式是拖尾的。故可以通过识别一个序列的偏自相关系数的拖尾形式,大致确定它应该服从一个 MA(q) 过程。 2、 ARMA(p,q)就是既含有 AR 项又含有 MA 项。 我们引入了自相关系数和偏自相关系数这两个统计
6、量来识别 ARMA(p,q) 模型的系数特点和模型的阶数。但是,在实际操作中,自相关系数和偏自相关系数是通过要识别序列的样本数据估计出来的,并且随着抽样的不同而不同,其估计值只能同理论上的大致趋势保持一致,并不能精确的相同。因此,在实际的模型识别中,自相关系数和偏自相关系数只能作为模型识别过程中的一个参考,并不能通过它们准确的识别模型的具体形式。具体的模型形式,还要通过自相关和偏自相关系数给出的信息,经过反复的试验及检验,最终挑选出各项统计指标均符合要求的模型形式。 注:无论采取什么样的方式,只要能够把残差中的序列相关消除掉,又不会引入新的问题,这样的模型就是最优模型。 与平稳性检验相关的 S
7、TATA 命令及其统计量解析( P212 张晓峒)白噪声检验: 1. Q 检验 wntestq var ,lag(n) 2.Bartlett 检验 wntestb var ,table (表示结果以列显示,而不做图。不加 table 就以图形的方式现实) 或者在 StatisticsTime-seriesTESTBartlett 检验(第四个) 画密度图: 1、 概率密度图 命令:pergram var ,generate(新变量名字) 将概率密度的图上所生成的值生成并储存在新变量里,这个不是必须的,只是为了日后方便。 窗口:Statistics Time-seriesGraphsPeriod
8、ogram(第五个) 2 累积分布函数图 命令:cumsp var ,generate(新变量名字) 解释同上,并且这个生成新变量的功能似乎只能通过命令完成。 窗口:Statistics Time-seriesGraphsCumulative Spectral distribution 3单位根检验(219) 1、 Dickey-Fuller 检验 命令:dfuller var (,lags(#)/trend/noconstant/regress/)对变量做 ADF 检验可以加滞后期或趋势项或不含常数项等等这些取决于你的模型。 窗口:Statistics Time-seriesTESTADF
9、单位根检验(第一个)在里面你也可以选择滞后期数,常数项等等。 如何看结果:原假设为:至少存在一个单位根;备选假设为:序列不存在单位根。 如果统计量小于后面的显著性水平给出的值且 P 值很大有单位; 如果统计量大于后面的显著性水平给出的值且 P 值很小 无单位根 ADF 检验需要注意的地方: (1 )必须为回归定义合理的滞后阶数,通常采用 AIC 准则来确定给定时间序列模型的滞后阶数。在实际应用中,还需要兼顾其他的因素,如系统的稳定性、模型的拟合优度等。 (2 )可以选择常数和线性时间趋势,选择哪种形式很重要,因为检验显著性水平的 t 统计量在原假设下的渐进分布依赖于关于这些项的定义。 如果在检
10、验回归中含有常数,意味着所检验的序列的均值不为 0,一个简单易行的办法是画出检验序列的曲线图,通过图形观察原序列是否在一个偏离 0 的位臵随机变动,进而决定是否在检验时添加常数项; 如果在检验回归中含线性趋势项,意味着原序列具有时间趋势。同样,决定是否在检验中添加时间趋势项,也可以通过画出原序列的曲线图来观察。如果图形中大致显示了被检验序列的波动趋势随时间变化而变化,那么便可以添加时间趋势项。 2、 Phillips-Perron 检验 命令:pperron var , (,lags(#)/trend/noconstant/regress/)对变量做 PP 检验可以加滞后期或趋势项或不含常数项
11、等等这些取决于你的模型。 窗口操作:Statistics Time-seriesTESTPP 单位根检验 (第三个) 如何看结果:同 ADF 一样 原假设为:至少存在一个单位根;备选假设为:序列不存在单位根。 P 值越小(统计量大于各显著性水平值)不存在单位根 P 值越大(统计量小于各显著性水平值)存在单位根 向量自相关回归 VAR 模型向量自回归(VAR)模型是 AR 模型的多元扩展,用以反映在一个系统中的多个变量之间的动态影像,格兰杰因果检验、脉冲响应、方差分解都是 VAR 模型中重要的分析工具。 与 VAR 模型相关的 STATA 命令与解析1、 VAR 模型的估计 STATA 命令:v
12、ar 解释变量 (,无常数项 noconstant/滞后期 lags(n)/ 外生变量 exog(varlist)/constraints(numlist)线性约束的个数注意:使用线性约束要提前定义,详情见建模中的各种小问题/LIKEPOHL 滞后阶数选择的统计量 lutstats) 窗口操作:Statistics Multivariate time seriesVAR(第二项) 4如何看结果: 保存估计结果的命令:est store 名称 2 VAR 模型平稳性 STATA 命令:varstable(,graph 表示画出图形) 如何看结果:特征值都在圆内,即都小于 1,表示 VAR 模型稳
13、定 窗口操作:Statistics Multivariate time series VAR diagnostics and testscheck stability condition of VAR estimates 3 VAR 阶数的选择 滞后阶数的确定 在 VAR 模型中,正确的选择模型的滞后阶数,对于模型的估计和协整检验都产生一定的影响,小样本情况更是如此。 (1 ) STATA 命令:用于 VAR 模型估计之前 varsoc 解释变量(,没有常数项 noconstant/最高滞后 期 maxlag(#)/ 外 生 变 量 exog(varlist)/ 线 性 约 束 条 件 con
14、straints(numlist)) (2 )命令:用于模型估计之后 解释变量(,estimates(estname)) 其中,estname 表示已经估计的 VAR 模型的名字。(1 ) (2)如何看结果:找最显著的阶数作为其滞后项(一般会标有 ) (3 )命令:用于模型估计之后(Wald 滞后排除约束检验) Varwle 窗口操作:Statistics Multivariate time seriesVAR diagnostics and tests第一第二项 如何看结果:看不同阶数上的联合显著性,看 P 值,越小越显著,表示存在该阶滞后项。4 残差的正态性与自相关检验 STATA 命令:
15、 1. 先进行 var 回归 2. varnorm 如何看结果:原假设是服从正态分布 P 值越小越显著拒绝原假设 不服从正态分布 P 值越大越不显著拒绝,原假设成立服从正态分布 自相关:窗口操作:Statistics Multivariate time series VAR diagnostics and testsLM Test 正态分布:窗口操作:Statistics Multivariate time series VAR diagnostics and testsTest for normally(倒数第三项) 5 Granger 因果关系检验 格兰杰因果关系不同于我们平常意义上的因果
16、关系,它是指一个变量对于另外一个变量具有延期影响。格兰杰因果关系检验有助于表明变量间的动态影响,有助于提高模型的预测效果。 命令格式: 1. 先进行 var 2. 再进行格兰杰因果检验 vargranger 5如何看结果:看 P 值的显著性,越小说明存在越强的因果关系,相反 P 值越大说明两者的因果关系不明显。 窗口操作:Statistics Multivariate time seriesGranger causality test 6脉冲响应与方差分解(223) 脉冲响应与方差分解是一个问题的两个方面。脉冲响应是衡量模型中的内生变量对一个变量的脉冲(冲击)做出的响应一对多,一个变 量向下所
17、引起的其他变量的变动,而方差分解则是如何将一个变量的响应分解到模型中的内生变量 多对一,一个变量的变动向上追溯引起该变动的若干原因。STATA 的 irf 命令用于计算 VAR、SVAR 、VEC 模型的脉冲响应、动态乘子和方差分解。 注意:该方法的操作使用于 var、svar、vec 估计之后。 (1 ) 创建 irf 文件 STATA 命令:irf create irfname ,set( 名字) (先进行 var, 然后使用这条命令就可以直接把刚刚 var 的结果保存到该 irf 文件里,并且只有这条命令是最好用的,其他命令即使可以建立 irf 文件但是不能把 var 的结果保存进去,那
18、也是没用的。) 激活 irf 文件 显示当前处于活动状态的 irf 文件: STATA 命令: irf set 激活(或创建)irf 文件: STATA 命令:irf set 文件名称创建新的 irf 文件并替换正在活动的 irf 文件: STATA 命令: irf set 文件名称 ,replace 清除所有活动的 irf 文件:STATA 命令: irf set ,clear 窗口操作:Statistics Multivariate time seriesManage IRF results and files (2 ) 用 irf 文件作图(223) 对于 VAR、SVAR、VEC 模型
19、,脉冲响应函数(IRF)的类型包括简单脉冲响应、正交脉冲响应、动态乘子三种,方差分解包括 Cholesky 分解和结构分解两种。没种模型可以采用不同的分析工具。 窗口操作:Statistics Multivariate time seriesIRF and FEVD analysis 简单的 IRF:(VAR/SVAR/VEC 之后) 命令:irf graph irf(,使用哪个文件 set(文件名)/ 脉冲变量 impulse(变量名)/响应变量response(内生变量名) )如果不加约束就是默认当前打开的文件 动态乘子:(VAR 之后) 命令:irf graph dm(,使用哪个文件 s
20、et(文件名)/ 脉冲变量 impulse(变量名 )/响应变量 response(内生变量名) ) 方差分解:(VAR/SVAR/VEC 之后) 命令:irf graph fevd(,使用哪个文件 set(文件名)/ 脉冲变量 impulse(变量名)/ 响应变量response(内生变量名) )联合图表:将多个脉冲响应图或方差分解图结合起来) 命令:irf cgraph (irfname 脉冲变量 响应变量 方差分解的方法 fevd/IRF 的方法 irf) 6(irfname 脉冲变量 响应变量 IRF 方法 irf/方差分解的方法 fevd) 叠加图表:(将多个脉冲响应图或方差分解图叠
21、加起来) 命令:irf ograph(irfname 脉冲变量 响应变量 方差分解的方法 fevd/IRF 的方法 irf) (irfname 脉冲变量 响应变量 IRF 方法 irf/方差分解的方法 fevd) (3 ) Irf 列表 STATA 命令:irf table IRF 方法 irf/方差分解方法 fevd 联合列表:(将多个脉冲响应图或方差分解列表结合起来) 命令:irf ctable (irfname 脉冲变量 响应变量 方差分解的方法 fevd/IRF 的方法 irf) (irfname 脉冲变量 响应变量 IRF 方法 irf/方差分解的方法 fevd) (4 ) Irf
22、其他命令 命令:irf describe irf describe ,detail 7 VAR 模型的预测 227 窗口操作:Statistics Multivariate time seriesDynamic forecast 命令格式 1(对于 VAR、SVAR 模型): fcast compute prefix 命令格式 2(对于 VECM 模型): fcast compute prefix 对预测进行作图 命令:fcast graph prefixvar(prefix 变量名) 小结大概流程: 估计 VAR 模型 var y x z est store VAR1 根据信息准则确定 VA
23、R 模型的最优滞后结束,根据结果重新估计 varsoc x z ,maxlag(#) var *(全部变量,或者 ln*所有的对数变量) ,lags(1/3) (比如最优的滞后期为 3,滞后期 123) est store VAR2 考察 VAR 模型的平稳性 varstable,estimates(VAR2) graph dlabel ( 画图并标出具体数值) 检验 VAR 模型残差的正态分布特征和自相关特征 varnorm,jbera estimates(VAR2) 对各变量进行 Granger 因果关系检验 vargranger (,estimates (VAR2) ) 绘制脉冲响应图以
24、及预测误差方差分解 var y x z,lags(1/3) irf create irfname,set (名称 ) irf graph irf (,estimates(名称)) irf table fevd(,estimates(名称)/预测区间n8step(n) 7 根据 VAR 模型的估计结果进行预测 预测 n 期(n8)fcast compute prefix(,step(n) fcast compute f_(,step(n) 将 VAR 模型与 IRF 相结合的窗口操作: StatisticsMultivariate time seriesBasic VAR 约翰逊协整检验协整检验
25、是对非平稳变量进行回归的必要前提。只有存在协整关系,协整回归才有意义。在各种协整检验方法中,Johansen(1998) 在VAR 框架下的特征值检验和迹检验应用最为普通。命令格式为: vecrank var1 var2 (,lag(n),trend(constant) ) 输出结果: max 输出极大特征统计量 ic 输出信息准则 levela 输出 1%和 5%的临界值 例如: vecrank depvar var,lags(n) ic max 窗 口 操 作 : Statistics Multivariate time series Cointergrating rank of a VE
26、CM 向量误差修正模型由一阶单整变量构成的 VAR 模型中,如果变量存在协整关系,那么 VAR 模型存在对应的向量误差修正(VEC)表达式。 命令格式:vec 变量( ,模型设定) 模型设定: rank(n) 协整方程的个数,默认选项为 rank(1) lags(n) VAR 模型的最高滞后阶数 trend(constant) 包含无约束的常数项 (state 默认值) trend(rconstant) 包含有约束的常数项 trend(trend) 包含趋势项 trend(rtrend) 包含有约束的趋势项 trend(none) 既不包含趋势项也不包含常数项 输出结果: alpha 将调整系
27、数单独列表 pi 输出 pi 矩阵,即 pi=(alpha)(beta) mai 输出 MA 影响矩阵的参数 dforce 输出短期参数、协整参数和调整参数 注意:8必须先设定时间格式 tsset Varlist 可以包含时间序列符号。 支持循环递推 不允许时间序列存在间断点 在 VEC 模型中,同样可以进行模型的平稳性条件检验、残差的正态分布检验和自相关检验。命令格式为: vecstable vecnorm veclmar 与 VAR 命令相类似。 VECM 建模 窗口操作:Statistics Multivariate time seriesVECM VECM 各种检验 窗口操作:Statistics Multivariate time series VEC diagnostics and tests