1、AR ModelAR 即自回归,主要用在时间序列分析中。P 阶 AR(AutoRegressive)模型可以记做AR(p),定义如下:(0)其中 Zt是一个随机过程,并且 ,参数 称为 AR系数。之所以起名为自回归是因为 Xt由它前面的数值 Xt-1、 Xt-2等求得。与 AR 模型密切相关的 Yule-Walker 方程一般地,对于 P 阶 AR(p),我们对等式两边同时乘以 Xt-k,然后取其期望值(1)其中 为延迟为 k 的自协方差函数(自相关) ,由于 ,我们可以得出式 1。它就是 Yule-Walker 方程。然后,我们将 替换为为 ,将此式带入式 1,我们就可以计算出 AR 系数的
2、估计值。同时,我们将式 0 乘以Xt, 得到: ,然后取其期望值,我们会得到因此可以用估计值 和 代替 和 的方法得到 ,此外 Maximum Entropy Method 方法一是一种估计 AR 系数的方法。AR MethodAR 方法是计算信号频谱的另一种方法,尤其是当信号具有较低的信噪比时。AR 方法应该同 AIC 方法结合使用。AR SpectrumWiener-Khintchine 定理对于任何自协方差为 的平稳随机过程而言,存在一个函数 p(f) ,函数 p(f)就是一个谱密度函数,或者称为谱函数。逆函数为:对于 AR(1)来说,谱函数为:对于 AR(p)来说,谱函数为; 相对于经
3、典的傅立叶变换来说,用 AR 模型来估计频谱的方法称为参数放。一个 AR(p)谱里的峰值数一般为 p/2。估计 AR 的阶数也是很重要的一个方面。除了地震分析外,很少用到阶数超过 20 阶的 AR 模型。实例:地震信号的 AR 谱分析。下图显示的是不同 AR 阶数的频谱图。可以看出,随着 AR阶数的增加,峰值的数量也增加,但是其中一些峰值可能没有实际用处,是一些假成分。Akaike Information Criterion (AIC)赤池信息量准则A fitting problem 一个拟合问题在实际的数据分析场合,我们通常不知道确切的拟合函数。一般我们倾向使用一种我们熟悉的函数,但是我们怎
4、么知道它比别的函数更好呢?现在考虑 N 个数据点(x i, yi),i=1,2,N ,以及一个有 k 个参数的模型,一个例子就是多项式函数, 。参数的估计通常是由 sum of the squared residual (SSR)的最小化来完成的。其中 SSR 定义为:其中一个关键点就是如何选取参数 K*的数目。在线性均方拟合中,一个想 SSRK 的优质函数有以下关系:但它不能给出 K*的数目。Kullback-Leibler information number and log-likelihood假定我们的数据服从 g(y)分布,f (y)是近视 g(y)统计学模型。Kullback-Leibler information numbers 是衡量 f(y)和 g(y)相似性的准则。 KL 信息数的性质:为了简便起见,我们只考虑离散情况,假定 p 和 q 是概率分布,满足:和 。我们使 , ,只有 时, 取得其最大值 0。AR 与 AICAIC 准则变为在时间序列模型拟合方面的一个标准工具。为了演示 AIC在 AR 模型上如何工作,我们考虑下面一个噪声信号。 ,其中 ,噪声强度稍微大于正弦信号。见下图:在下图中 AR 模型的阶数由最小化 AIC 得到。对于噪声部分,最优的模型为 AR(10)。混合信号的 AR(10)谱函数清晰地在 f=0.1 处显示出波形信号。