1、1第 4 章 谱分析方法1 绪论一 时间序列模型:通过分析自相关就获得描述与预测时间序列可能够用模型的第一印象。如这里 与 相关性较大,而与 相关较弱,为什么?1tttyaf-=ty1t- 2ty-二分析时间序列的两种方法频谱法, 时间序列法-Box Jenkins 方法三 时间序列模型的五个特征(最重要的)描述趋势有多种方法1 趋势确定性趋势t tyadm=+1,2.tn=随机趋势11t t-2 季节性: ,2, ,.t ttsttyDDaam+1,2.n=是季节哑变量,定义为,stD, , ,=()tTSs-,.S=,.TN其它,0st3 异常观测值异常观测值:在时间序列中,可能有一个或几
2、个点,会对时间序列的建模与预测起到重要的作用。这样的数据点称为奇异观测值。4 条件异方差异常观测值倾向于成群出现,这个现象称为波动性集聚(vilatility clustering)条件异方差()()2211tt tttyyarm-=+3,4.tn=5 非线性: 状态依赖机制转换特征2 谱分析一 时间序列分析的方法1 时序分析方法:也就是时序建模方法,ARMA 等,也就是原序列的时间顺序不变。2 频谱建模方法:单变量频谱建模技术就是时间序列看作是有不同频率的正弦和余弦波组成。其基本思想是:把时间序列看作是互不相关的周期(频率)分量的叠加,通过研究和比较各分量的周期变化,以充分揭示时间序列的频域
3、结构,掌握其主要波动特征。做法:对某个时间序列剔除趋势和季节因素后的循环项(平稳)进行2谱估计,根据估计出的普密度函数,找出序列中的主要频率分量,从而把握该序列的周期波动特征。优点:当频率分量的行为或内在机制互不相同时,谱分析可以避免时域方法带来的混淆(因为时域方法所衡量的只是各频率分量共同叠加后的结果)更精细的研究各种行为及因素。二 基本原理1 对于确定性函数 ,周期为 ,如果 在 可积,并在 点()Xt2T()Xt,T-t连续,则有如下的傅立叶级数展开: () (01cos2sin2kkkXtaftbftpp=+其中 ()Tk ktd-0,12.=sinTXft-2kf=0,12.k意义:
4、周期函数通常可以分解为常数项 与频率 的正弦和余弦函数之和。0akf为了方便,令 0, ,12,.2k kkibaibAAa-+=从而得到复数形式的傅氏级数展开 ()2kiftkXtep=-()1kTiftAd-0,12,.=其中 为振幅, 为频率k因此,周期函数 可以表示成不同频率 及其对应的振幅 的正弦和余Xt kfkA弦函数之和,这就是 的谱表示。()在周期 内 消耗的能量等于每一个不同频率的三角函数分量所消,Tt耗的能量之和: 222201kkTXdtATA单位时间上的能量消耗 的功率为Xt221XkTPt即 的总功率等于各频率分量的功率之和。t3功率谱:功率依不同频率的分布,表示为
5、2,01,.0kkAfhf称此函数为功率谱密度函数。三一般确定性非周期函数 的谱表示Xt构造以 2T 为周期的函数 ,满足T21,2.TTXtttnn则当 在 内可积,并在 t 点连续的情况下, 进行傅立叶级数t, TXt展开,在 内:2kiftTkXttAed221kkkkTiftiftkiftiftTkXeted这里 ,当 。112kff,0kTf如果积分存在,则对任何 t,有ififtXtted的功率为 2 22 =ifttdXtGedfd这里 ,iftGf2iftXted则 是在频率 f 处的能量密度,或称为连续能量谱密度。而且非周期函2数 的功率为 。Xt 21lim0TTtd3 平
6、稳过程的频域分析一 因为无法保证实现 的周期性和可积性,因而需采取相应的手段。Xt对平稳过程的实现 加以截取,构造新函数4 0otherTXTt其傅立叶展开为 2iftTTtGd这里 2Tift iftfXeXed是 的能量谱密度函数。 的总能量无限,但功率2TTt却可能有限。 称为功率功率谱密度函数。limf 2limTGf如果功率谱密度函数的期望 存在,则称为平稳过2liTTfhfE程 的功率谱密度函数,简称功率谱或谱密度。称 称为Xt fHhd谱分布函数。二自协方差函数和谱密度 的关系hf定理 1:平稳过程 的谱密度 存在,则过程 的自协方差函数Xt Xt有如下的傅立叶变换R2ifthf
7、edFR1ifhf即如果 的自协方差函数 绝对可积, ,则 的谱Xt RdXt密度必定存在。方差: ,因为自相关函数 ,即方差代表平20XRhfd 2Xr稳过程的总平均功率。标准化功率谱密度函数 ,他代表频率范围在 内的2xfpf,fdf分量对总功率的贡献率。 22ifxhfpfred即标准化谱密度 是自相关函数 的傅立叶变换。pfr谱密度 的性质:1) 1fd2)对任何 , 。0pf53)对实值过程,对于任何 f,满足 。pff积分谱 具有下列性质:Pf1) 。012) , 。3) 是 f 的单调非减函数,即当 时, 。12f12Pff定理 2(维纳-辛钦定理):自相关函数 是某个平稳(连续
8、)随机过程 的自相关函数的充分必rXt要条件是:存在一个函数 ,在 上具有分布函数的性质(即Pf,,且 是单调非减) ,使得对一切 , 可以表示0,1P r成: 2ififredRH分别称为自相关函数和自协方差函数的谱表示。0,0R如果 是绝对连续的分布函数,则对任何 f 都存在谱密度函数Pfdpff称随机过程 具有纯连续谱。如 过程。Xt ,ARMpq三 平稳时间序列的频域分析1平稳时间序列是平稳随机过程的特殊情况。具有两种特殊性质:1)t 只取整数值,因此自协方差和自相关函数只在整数点有定义。2)谱密度只在 范围内有定义。12,f2Wold 定理:序列 作为某个时间序列 的自相关函,01,
9、.rkXt数的充分必要条件是:存在一个 上的单调非减函数 ,12,fPf,使得11220,P自相关函数 12, k=0,.ifkrkedP自协方差12 1ifRH称为非标准化积分谱。 为标准化积分谱。Hf f当序列为实值,自相关函数为偶函数时,标准化谱密度函数:62 11221cos xkhfRfkf1cosk kprrfk1122 f例:求白噪声的谱密度其自协方差函数 2 0=,.Rk则 21122 hf fpf表明纯随机序列具有常值谱密度函数,意味着总功率或方差在 上12,f是均匀分布的,即每个频率成分对总功率或方差的贡献是一样的。一般情况下,纯连续谱的时间序列的谱密度可划分为三种类型:1
10、)谱密度从频率 0 到频率 1/2 递减,高谱密度值集中在相对低频处,表明序列异常周期波动为主。2)在高频处显示高谱密度,说明序列以短周期波动为主,比白噪声还不规则的随机过程。3)谱密度主要集中在某个特定频率附近,意味着序列的变动主要是由这个频率所确定的周期波动。hf hf hff f f4 功率谱密度函数的估计方法一几种常用指标设 为具有纯连续谱的平稳时间序列,其谱密度为 ,记 为根Xt hfNf据样本 所得到的 的估计量。12,.nxhf1偏差 12 NNbfEf当 ,则称此估计为无偏估计。当 , , 为渐0N0NbfNhf进无偏估计。2方差 , 2var-NNhfhfEf12f它描述了
11、偏离均值的程度,方差越小,估计量越好。73均方误差: 22varNNEhffhfbf时, ,则 是 在均方意义下的一致N0h估计。二估计方法:非参数方法和参数方法(一)非参数方法:周期图和窗谱估计1周期图估计:研究观测数据中可能隐藏的周期性模型为 1cos2sin2ktii itiXAftBf其中 ; iiiiiC从而 2iiiiiarctgA估计的基本思想(寻找隐含周期的基本思路):用一组足够密的备选频率 作选择,得到参数估计值12,.f,做出振幅的平方 关于频率123,.ABAB 22iiiCB的图形,根据平方振幅足够大处(即图形中较明显的峰值)作对.if应的备选频率,便可识别出隐含周期频
12、率,并同时得到相应的振幅 。根据2iC是否显著不同于零,可以判别其对应频率是否是隐含周期的频率。2iC定义周期图: 22NIfAfBf12f其中 ; 。因此在备选频率1costAfxt1sinNtxft处,周期图为,2,.if。而且等价2224iNi iIffBfC1ifkkRe 12 f周期图恰好是从样本数据出发通过样本协方差函数的谱密度进行直接估计的统计量。它有以下特点:1) 时,周期图方差趋向于谱密度的平方,即在均方误差意0,hfN义下,不是一致估计;2)对于不同的频率 f, 是渐进不相关的,当 增大时, 特别不NIf NNIf稳定,不平滑。3窗谱估计:对周期图进行截断,即对 12ifk
13、NkNIfRe8的两头的若干求和项去掉,从而得到谱密度的新估计量:12 f,其中 M 为小于 N-1 的正整数,称这个 M 为截断点,20MifkkhRe而上面的估计式称为截断周期图。 201ifkkMEf eN更一般的形式为 12ifkkhfwRe其中 为 的权函数,称为时窗函数或时窗。 为窗谱估计。wRNhf(二)参数方法:ARMA 和极大熵谱估计1AR 和 ARMA 谱估计基于 ARMA 模型的谱估计方法是近代谱分析中比较感兴趣的一种方法。1)AR 谱估计假设一个时间序列 是由 过程生成的,即tXARp1,ttpXa20tWN:其理论谱密度为 221.ifipfhfaeae其估计量为 2
14、21.ifipffee这种方法就是所谓的自回归谱估计或 AR 谱估计。2)ARMA 谱估计1 1, .ttptttqtXaXb20tWN:其理论谱密度为 221.ifiqfifipfbeehfaa其估计量为 221.ifiqfifipfebehfaa 9这种方法就是所谓的自回归谱估计或 AR 谱估计。3)极大熵估计(现代谱分析)熵是一种不规则性的度量,现在用于表示不确定性的度量。可用来度量随机变量或随机过程的不确定程度。(1) 熵: 称为谱熵。谱熵越大,则 的随机性越1/2lnShfd Xt强,所受人为干预越少,包含信息越多。(2) 极大熵准则,对于满足约束条件1/2, 0,1.ifkedRkp 使谱熵 达到最大的 ,记为 (极大熵谱估计) 。Shhfhf4 谱分析在经济中的应用须注意的问题1)序列长度要大:至少 100-200 个数据。2)数据需要预先处理:要求平稳序列、去掉长期趋势以及可能的季节性变化。3)谱估计方法的选择。4)窗函数的确定。5)频率点的选取。6)谱估计的计算。参考教材:1) 经济计量学手册17 章 格兰杰著2) 经济周期波动的分析与预测高铁梅等著 吉林大学出版社3) 时间序列分析:预测与控制Box 和 Jenkins 著 中国统计出版社