1、I基于 ARIMA 模型的股价预测研究摘 要随着我国金融市场的逐步放开、股票市场的迅猛发展,股票市场作为整个国民经济的重要基石之一,其地位和作用也日益突出如何有效地控制金融市场风险,促使金融市场有效、健康的运行,已成为我国金融机构面临的重大挑战而通过历史数据,建立 ARIMA 模型,能较好地预测股价的发展趋势,从而使股票的投资者和管理者获得最大的回报或最小的损失。本文利用同花顺软件收集深市同德化工(002360)股票从2010 年 3 月 3 日2016 年 4 月 25 日间的每日收盘价,其中样本数据采用股指对数收益率作为样本数据,并采用其数据进行平稳、零均值化处理,模型识别和模型定阶,在使
2、用最小二乘法估计参数后,建立 ARIMA 模型;最后利用已建模型预测出未来 3 天的股票开盘价指数,并与实际数据相对照,计算模型预测误差,验证 ARIMA 模型是否适合于所选股票的短期预测。关键词:股价 ARIMA 模型IIComparison of urban and rural residents in Hebei ProvinceLi da Directed by Lecturer Liu linghuiAbstractIn recent years, under the guidance of the national integration strategy launched in
3、Beijing, Tianjin, Hebei Province, by means of its regional advantages Hebei Province efforts to build “one hour life circle.“Accelerate the flow of population makes the structural differences in Hebei Household Consumption size changed.In order to better describe this difference, and this difference
4、 is a measure of the size of the paper to survive and consumption, development and enjoyment and consumption and consumption in total consumption in proportion to the share of differences and build differentiated consumption structure.In this paper, descriptive statistics, found that the proportion
5、of urban and rural consumption structure difference in survival consumption and enjoyment and consumption of large differences in the development and consumption of a smaller proportion of the status quo.Then analyzed to find a comprehensive description of the size difference factor by factor analys
6、is reveals that the reason for the difference generated by the status quo.Finally, the specific economic development in Hebei Province, Hebei Province, is given to promote the coordinated development of urban and rural consumption policy recommendations. KEY WORDS:Urban and Rural Residents Consumpti
7、on Differences Compare ResearchIII1目 录摘 要 I英文摘要 II目 录 1前 言 21 概念界定 31.1 城镇和乡村的界定 31.2 本研究中的消费结构 32 指标体系的建立与原数据的选取 42.1 河北省城乡居民消费结构体系的建立 42.2 河北省城乡居民消费结构数据 53 河北省消费结构的描述性统计分析 63.1 恩格尔系数分析 63.2 衣着和房屋消费分析 73.3 交通通信和文化教育消费分析 93.4 家用服务和医疗保健消费分析 104 河北省消费结构的因子分析 114.1 原数据与数据预处理 114.1.1 原始数据的选取 114.1.2 数据预
8、处理 124.2 确定公共因子和载荷矩阵 134.3 因子旋转与两个公因子的实际含义 1424.4 计算因子得分与差异趋势 165 结论与建议 165.1 差异现状分析 165.2 原因分析 175.3 建议 17参考文献 19附录 20致 谢 22前 言随着社会的进步及科技的快速发展,中国的股票市场也日益完善,并且逐步成为我国最重要的资本市场之一。由股份公司在筹集资本时向投资者发行的一种有价证券称为股票。它可以显示出投资者股权身份和权力,股票持有者可以根据所持的股份享有专有的权力。它也是股票持有者承担义务的凭证。只有股份有限公司可以发售股票,并且它只能发给持股者持股证明,同时不能转售,所以股
9、票市场就是股票转让、流通和买卖的场地,它包含交易所市场及场外交易市场。股票是一种“投资小、收益大”同时伴随高风险的投资行为,所以无论是投资者还是股票的管理者,预测股价的发展走势,通过了解股价的发展走势来进行投资与管理尤为重要。而所谓的股票价格趋势分析就是借助某种工具通过对股价现有的情况来对未来的股价进行预测,已有研究表明应用时间序列分析理论可以对未来的股价进行分析和研究。实际上,应用时间序列分析知识的领域是十分广泛的。时间序列分析的应用一般有两个目的:一个是通过给出的数据生成模型,二是根据历史数据,预测3出将来的可能取值。学者常常能通过一定顺序的时间点来观察所获得的数据,如日股票开盘价、某城市
10、的降水量、每毫秒心电活动的状况、月价格指数、年销售量等等。在观察这些数据时发现它们之间具有相依性。通过对这些具有相依性的数据进行观察与研究来找出其发展规律,并利用其规律来拟合出数学模型,这些数学模型可以用来预测数据的未来发展走向。而 ARIMA 模型就是其最重要的时间序列模型之一。他能很好地预测股价的发展趋势,从而使股票的投资者和管理者得到最大的收益。随着社会的快速进步和发展,股票市场也逐渐成为我国经济发展和金融活动的阴晴表。正规股票市场最早出现在美国。如果股票交易市场出现了不良影响,那么势必会影响经济及其金融的发展。在股市活跃的投资者和管理者都知道股市唯一不变的性质就是它是每分每秒都在变化。
11、这就需要我们借助某种工具来研究股价的趋势走向。我们使用时间序列分析对股价进行分析,进而达到“投资小,收益大”的目的。通过对股价数据的分析,利用时间序列分析中的模型对其建模,进而了解股价的未来走向。时间序列分析在很多领域应用得十分广泛。1970 年,George E.P. Box和 Gwilym M. Jenkins 著写了一本名为(Time Series Analysis-Forecasting and Control 的书1。此书引起了广泛的关注和重视。其后国内外学者通过多个领域对时间序列分析进行研究,并且出版了许多专著和专门的期刊。如1994 年,J.Hamilton 著写Time Ser
12、ies Analysis2。 2003 年,美国的经济学家 Robert F.Engle 和英国的经济学家 Clive W J.Grange 因在经济时间序列分析上取得了巨大的成就而获得诺贝尔经济学奖3。1999 年,查正洪利用时间序列分析对上证综合指数进行建模分析与研究,从而建立了 ARIMA 模型4。冯盼和曹显兵在“基于 ARMA 模型的股价分析与预测的实证研究”中5,利用单位根检验首先确定原序列的平稳性,从而利用差分法使其变得平稳并通过 ADF 检验,然后建立 ARMA 模型,并利用猜想法确定 和 的值。再确定模型的参数值来确保模型的参数显著,最后对于所建pq的模型进行残差检验来确定模型
13、的合理性,并利用所建模型对股价进行预测。通过对比实际值和预测值,可以看出所建模型是较为合理的。郭雪、王彦波的“基于 ARMA 模型对沪市股票指数的预测”6及邓军、杨宣、王玮等的“运用ARMA 模型对股价预测的实证研究”7和邵丽娜的“基于 ARMA 模型对招商银行股票价格的预测”8,这些文章都是应用 ARIMA 模型对其数据进行建模与预测。总之,目前的研究是在 ARIMA 模型的基础上对股票进行分析来建立模4型和拟合模型,最终达到预测的目的,从而使股票受益者达到利益最大化。本文主要关注的是 ARMA 模型在股价指数拟合和预测方面的应用9。我们知道,ARMA 模型是基于数据序列为线性、平稳的假设前
14、提下的,而事实上,经济时间序列的一个重要特征是存在趋势性及非线性成分,即通常认为时间序列 具有以下形式:)(tY)()(tCStX其中 为趋势性成分, 为季节性成分, 为随机性成分。ARMA t )(tS)(tC模型是针对随机性成分 的建模。对季节性成分 (如果存在的话),通常)(t S采用季节调整;对趋势性成分 ,通常采用 阶差分的办法去除趋势性,使tXd之平稳,然后用 ARMA (p, q)模型拟合,此即为 ARIMA (p, d, q)模型,然而对于某些数据样本,比如文所选取的深市同德化工(002360)股票 2015 年 8 月2016 年 3 月的对数数据序列,虽然存在明显的趋势,对
15、其进行一阶差分后固然消除了趋势成分使序列平稳,然而得到的序列自相关性不明显,在显著性水平下与历史数据呈不相关性,即为一个白噪声序列。本文考虑的是用 ARIMA 模型来拟合时间序列的趋势性成分。下面是论文的框架:第二章首先阐述时间序列模型 AR、MA、ARMA 及 ARIMA 的概念;其次绍 AR、MA 和 ARMA 模型参数的估计、模型的检验和选择模型的标准;最后说明 ARIMA 模型的差分阶数的确定和适用标准。第三章采用 ARIMA 模型对深市同德化工(002360)股票进行分析预测,分别介绍了指数组成的来源,模型的识别和定阶、检验,并比较了预测结果。第四章结束语。51 时间序列的理论模型与
16、方法概述本文在这一章里主要介绍时间序列的相关概念以及模型,以便为下面章节的顺利展开做一个铺垫。时间序列(Time Series)系指以时间顺序型态出现之一连串观测值集合,或更确切的说,对某动态系统(Dynamic System)随时间连续观察所产生有顺序的观测值集合。1.1 时间序列模型的含义时间序列是以时间顺序生成的观测值的集合10。分为连续型时间序列和离散型时间序列。本文中我们讨论离散型时间序列,它是某一过程中的某一个变量或一组变量 在一系列时刻上如: 得tY )(, 212,1 mmtttt 为 自 变 量 , 且到的离散有序数集合 ,即某一过程在 时刻的观测值,一般为m,21 ,21离
17、散等间隔的数字时间序列,属于随机过程的一次样本实现。如:某产品价格的月度数据、某产品产量的年度数据、消费品价格指数的季度数据以及股票价格的口数据等等都是以时间序列的形式出现的。随机过程指随时间顺次发展且遵从概率法则的统计现象。1.2 随机时间序列模型随机时间序列的一个最基本特征就是相邻两个数据之间有相互依赖性,即:两个随机数据呈现一定的相关。时间序列分析就是依据不同时刻变量的相关关系进行分析,生成随机动态模型来揭示其相关结构并进行预测。本文主要采用ARIMA 模型的时间序列预测方法。1.3 平稳时间序列6利用 ARIMA 模型对时间序列进行分析的时候,要求序列是平稳的。非平稳的时间序列要转化为
18、平稳时间序列再利用 ARIMA 模型进行预测。1.3.1 随机平稳时间序列随机平稳过程如果一个随机过程在 和 时刻变量概率分布的随机特性tk不随时间的改变而改变,我们便称其为随机平稳过程。随机平稳过程的联合分布和条件分布均不随时间变化而发生变化,即过程的随机性具有时间上的不变性,在图形上表现为所有的样本点皆在某一水平线上下随机地波动。由随机平稳过程产生的时间序列即为随机平稳时间序列。如果序列 是平稳的,则对yt任意 和 都有 与 是同分布的。kt,m),(kttY )( kmttY,所以平稳时间序列 有以下性质:yt1、序列的数学期望 是常数,记为 ;)(ttEuyu2、序列的方差 是常数,所
19、以22ymty)()(mtytEu3、序列的自协方差: 是常数,)(),cov( ymtytktk uEy所以,对于任意 。),cov(, mtttyk白噪声过程是一种特殊的平稳序列,也是最简单的平稳时间序列。如果一个平稳序列 对于任何 ,都有 为常数rt st,2为任取的时刻且urEstt 0),cov(,)(st就称 是一个白噪声。t当 是独立序列时,称 为独立白噪声。rt rt当 时,称为零均值白噪声;0u当 时,称为标准白噪声;1,2平稳时间序列的线性模型111、自回归模型(Autoregressive model)7如果一个随机平稳时间序列在任意时刻 的取值 ,都可以表示成为过tY去
20、 个时刻上的数值 的线性组合加上 时刻的残差,并且构成残pptttyy,21差的序列表现白噪声的性质。这样的序列就可以用自回归模型表示为: Ttcyptttt ,21,21 其中:参数 为常数; 是自回归模型系数,且 ; 为自回,1 0p归模型的阶数; 是均值为 ,方差为 的白噪声序列。可以表示为上述形式的平稳序t02列模型称为自回归模型。 阶自回归模型简记为 AR(P).p2、移动平均模型(Moving average model)如果一个随机平稳时间序列 在任意时刻 的取值都可以表示为过去Yt个时刻残差序列 的加权平均值和 的和,并且残差序列 表现为白噪声qttt的性质。这样的时间序列用移
21、动平均模型可以表示成为: Tty qtttt ,21,21 其中:参数 为常数; 是自回归模型系数,且 为自回归模, ;0q型的阶数; 是均值为 ,方差为 的白噪声序列。符合上述形式的模型称为t02移动平均模型。 阶移动平均模型简记为:MA(q)。q3、自回归移动平均模型(Autoregressive Moving Average Model)自回归移动平均过程是自回归过程和移动平均过程的组合。所以自回归移动平均模型可以表示成为: Ttyycy qtttptttt ,21,2121 显然此模型是 AR(p)和 MA(q)的混合形式,称为混合模型,常记作ARMA( p, q)。当 时, ;当 时
22、,ARMA( p, 0)=AR( 0p)(),0(qMAAR0p)。其中:参数 为常数; 是自回归模型系数,且 为自回归模cp, 21 ;q型的阶数; 是均值为 0,方差为 的白噪声序列。上述形式的平稳时间序列称t2为自回归移动平均模型,简记为 ARMA (p, q)。84、自回归求积移动平均模型(Autoregressive Integrated Moving Average Model)如果一个时间序列模型是非平稳的,在建模的过程中我们必须把他差分 次,把它变为平稳的,然后用 ARMA (p, q)作为它的模型,那么,我们就d说那个原始的时间序列是 ARIMA (p, d, q),我们把它
23、称作是一个自回归求积移动平均模型。1.3.2 非平稳时间序列非平稳序列时间序列的统计规律随着时间推移而不断发生变化,即生成变量时间序列的随机过程的特征随时间变化。只要平稳过程中的三个条件不完全满足,它所生成的时间序列就是非平稳时间序列。非平稳时间序列分为两种:1、趋势平稳的时间序列时间序列有确定性的时间趋势,去除这种趋势后即为平稳时间序列。用方程表示为: ttufy)(其中 表示为时间序列在 时刻的取值; 表示为时间的函数; 表t t)(tf tu示为残差序列,并且 为一平稳时间序列。t一般我们讨论的只有线性趋势平稳的时间序列。所以可以表示为: ttuy对于线性趋势平稳的时间序列,去掉完全确定
24、的线性趋势后所形成的时间序列就是一个平稳时间序列。即: )(tyutt为一平稳的时间序列。所以我们可以采用最小二乘法估计这个趋势,然后利用所估计出来的趋势进行预测。判断一个时间序列是否能用线性模型拟合这种上升趋势,就要对的平稳性进行检验。因为 和 未知,所以通过最小二乘法估)(tyutt计出 和 ,然后对估计的残差 进行平稳性检验。)(tyut92、差分平稳时间序列经过一次或者多次差分后的平稳时间序列称为差分平稳时间序列12,13。非平稳时间序列转化为平稳序列所要经过的差分的次数被称为差分平稳序列的阶。记为 为差分阶数, 。dI)( ,21d一般一阶差分记为 ,即:Y为差分运算符,1tY同样
25、阶差分记为 ,即dd11ttd一般来说一个非平稳时间序列经过 次差分以后都会变成一个平稳的时间序列。1.3.3 随机平稳时间序列样本的数字特征1、时间序列的样本均值(mean)ntY12、时间序列的样本方差(variance) 2102)(nttY3、时间序列样本的自协方差(Auto coefficient)knt kttk Y1)(4、时间序列样本自相关函数(Autocorrelation Coefficient)0212),cov()( ktnttkt kttk YY105、时间序列样本偏自相关函数(Partial Autocorrelation Coefficient),543,111s
26、sjjsjjsj 其中 代表滞后量,s 1,2,1,1 sjsjsj1.4 时间序列模型的建模步骤建立时间序列模型的整个过程由数据预处理、模型的识别、参数估计和模型检验四个部分组成14-20时间序列模型建立基础是平稳时间序列。因此,我们在得到一组样本数据后,应先检查该组数据的平稳性。1.4.1 判断时间序列的平稳性根据平稳时间序列的特征对其平稳性进行判断,常见的时间序列平稳性检验主要有以下几种:(1)利用散点图进行平稳性判断(2)根据自相关函数判断(3)单位根检验。(1)散点图检验yty t11图 2-1 平稳时问序列的散点图图 2-1 主要是看时间序列 的各观测值是否在 的均值上y,m21
27、y下来回波动,并且具有相等的方差。这种方法简单易行,但往往结果过于粗糙,精度不高。根据样本自相关函数判断 0212),cov()( ktnttktkttk yy如果样本自相关函数随着 k 的增大,而呈现迅速衰减的状态,则认为该序列是平稳的;如果衰减非常缓慢则认为该序列是非平稳的。(2)单位根检验考虑简单的 AR (1)过程ttty1其中, 是白噪声时间序列,而且只有 时序列 才是平稳的;t 1yt当 时,序列 呈现爆炸性,即 会逐渐增大为非平稳序列。1yt yt所以可以写成或者 ttty1 ttyL)( -1其中 为滞后算子,表示时间序列的滞后。如: 的一期滞后可表示为L t,即:)(ty1t
28、t12所以, ,21,)(nyLttn平稳的条件就是其特征方程 的根的绝对值大于 。此方程的唯yt 0L1一的根为 ,所以平稳性要 ,因此检验神平稳吐的原假设和备假设为:1L1:0H:1接收原假设 表明序列是非平稳序列,而拒绝原假设表明序列是平稳0序列;如果 ,则该过程为随机游走过程,是一种特殊的差分平稳过程,1是非平稳的。阶自回归过程 AP(p),则可以表示成:ptptttt yyy21其特征方程: 012pLL只有当此方程所有根的绝对值都大于 ,才能有过程1tptttt yyy21是平稳的,如果有一个特征方程根为 ,则必有一个单位根,这时方程1tptttt yyy21可以写成: 1211
29、ttpttttt yyy而对于 AR(1)模型,则有:ttty1-13因为大多数的经济事件序列 为正,所以假设可以写成:0:H:1通过这样变换,可以把检验原参数 ,转化为检验 是否成立,10这类检验可以分别用两个 检验进行:T由于统计量 和 并不服从 分布,而称之为 统计量,)(1t)(stt其极限分布由富勒(Fuller)所决定,迪基(Dickey)给出其分布经验上的粗略估计。所以此检验又称迪基一富勒检验,即 检验。后来麦金农(Mackinnon)通DF过蒙特卡洛模拟法系统模拟出了这些临界值,相比 检验,他们要大得多。T因为: 临界值依赖于回归方程的类型,所以,对于另外两种类型的方程: tt
30、tttt yyy 11和迪克一富勒还编制了另外两个 统计表。(3 ) ADF 检验(Augmented Dickey- Fuller Test)在 ADF 检验中,我们假设随机误差项是相互独立的,不存在自相关,但是大多数的经济事件序列是不满足此项调价的,当不满足时我们采用扩展的迪基一富勒检验(Augmented Dickey,一 Fuller Test)方法。所以原来模型变为:(1)pjtttt yy1(2)pjtttt yy1(3)pjtttt yy1检验步骤如下141、估计模型(3),在给定 ADF 临界值的显著水平下,如果参数 显著的不为零,则序列不存在单位根,序列平稳,结束检验,反之进
31、入第一步;2、给定 ,在给定 ADF 临界值的显著水平下,如果参数 显著的0 不为零,存在时间趋势,进入第 3 步;否则进入第 4 步;3、用 分布检验 ,如果参数 显著的不为零,则序列不存在单位T0s根,序列平稳,否则序列不平稳,结束检验。4、估计模型(2),在给定 ADF 临界值的显著水平下,如果参数 显著的不为零,则序列不存在单位根,序列平稳,结束检验,反之进入第 5 步;5、给定 ,在给定 ADF 临界值的显著水平下,如果参数 显著的0不为零,表明含有常数项,则进入第 3 步,否则进行下一步;6、估计模型(1),在给定 ADF 临界值的显著水平下,如果参数 显著的不为零,则序列不存在单
32、位根,序列平稳:结束检验,反之序列不平稳。1.4.2 模型的识别ARMA 模型识识别的方法21-22有很多种,这里我们只考虑使用自相关函数和偏才函数的拖尾和截尾性,来初步判断所采用的模型类型。移动平均过程的自相关系数特征对于移动平均过程则有: )(tYE221)var qt 所以,15qj qjr jqjj,0 ,21,)(21即 qjqjqjjjj ,21,0122 所以,当移动平均的阶为 时,间隔期大于 的自相关函数值为零。在样本充分大的条件下,自相关函数的 95%置信区间为 ,nkk2,所以如果自相关函数 在大样本的情况下如果落入 区间内,则,0kn,2在 5%的显著水平下不拒绝 的假设
33、。所以在实践中当 时,如果平均 20 个 中至多有一个使 ,qKj nj2那么我们认为 在 处截尾。j自回归过程的自相关系数特征因为是自回归过程,则有: ptYE21)( 2210 tppjjj 211所以, kpjjjj 2116解得: jpjjzC1其中, 为任意常数, 为特征多项式 的特jzpzzz21)(征根,所以在原模型平稳性条件下, 被负指数所控制,随 的增大, 绝对jjj值下降,但是不会到某一点以后突然被截断,所以是非截尾的。自回归过程的偏相关函数特征偏相关系数的定义: 与 的偏相关系数是去掉 的线性影tYjt 121,jttY响后简单的相关系数。表示如下: ),(121jttt
34、tjj yyEcor例如在 AR (1)过程中 , ,其中 代表ttte1tttt ey212偏相关系数。偏相关系数的计算基于 Yule-Walker 方程组:kpppp1212212 1解得: 1s212-)(s1sjjsjjssj ,4317其中 代表滞后量, 因此对于 AR (p)s 。1,2,1,1 sjsjsj过程,当 时, 和 之间不存在直接相关,所以这时所有的 都为零,呈psty1t s现 阶截尾状态。所以在实践中当 时,“如果平均 20 个 中至多有一pKs个使 ,那么我们认为 截尾在 处。ns2sk自回归滑动平均模型自相关函数和偏相关函数的特征若 序列与 序列皆不截尾,被负指
35、数函数控制收敛到零,则 很有js tY可能是 ARMA 序列。总结零均值平稳序列模型的自相关和偏相关函数的统计特征如下:表 1 ARMA(p, g)模型的白相关系数和偏相关系数特征模型 相关系数 偏相关系数AR(p) 拖尾 p 阶截尾MA(q) q 阶截尾 拖尾ARMA(p,q) 拖尾 拖尾1.4.3 模型的定阶基本思想:确定一个函数,该函数既要考虑用某一模型拟合原始数据的接近程度,同时又考虑模型中所含参数的个数。当该函数取最小值时,就是最合适的阶数。基于基本思想,如果选择的滞后长度与真实的滞后长度相同时,模型估计值与观测值的误差应该最小,所以可以用误差平方和或者均方误表示:18或者 Tttt
36、ySE12)( TyMSEttt12)(但是由于随着解释变量的增加,SSE 和 MSE 都呈现减小状态,这样的模型拟合度很高,但是拟合效果不一定高,考虑到自由度的影响我们通常都采用 AIC 准则和 BIC 准则。AIC 准则(Akaikes Information Criterion), AIC 准则又称为最小信息准则,它是由日本学者赤池首先提出并成功地应用于 AR 模型的分析定阶中,该方法也可用来辨识 ARMA 模型的阶数。舒瓦茨准则(Schwaz Bayesian Information Criterion)比赤池准则增加了更严格的惩罚条件。舒瓦特信息准则通常简写为 BIC 准则(有的书本
37、也称 SBC 准则或者 SC 准则,本文中采用 BIC准则)AIC 及 BIC 的定义函数为:TeBICkAtkTt1212xp其中有不同的变形:取对数可得: TInqpInqpBICA)(2)(),(, 2、根据对数似然函数变换: TInqpTLInqpBICA)(2),(其中 为样本容量。 代表模型中参数的个数,如果有常数项,k被 代替, 是噪声项方差的估计, ,在对数函数中qpl2Tet12219, 是与参数无关的量。KInTIL)(2理论上,AIC 和 BIC 要尽可能的小,当模型拟合优度上升时,AIC 和BIC 的值会趋近于 。若模型 A 的 AIC(或者是 BIC)小于模型 B,则
38、称模型 A优于模型 B。对于每个模型回归变量的增加会导致 的增加,但残差平方和qp会减少。如果回归变量对模型没有解释力,在模型中增加回归变量只会使 AIC和 BIC 增加。因为 ,这样 BIC 增加回归变量的边际成本较大,BIC 与2)(TInAIC 相比总是倾向于选择更简练的模型。在这两个准则中,BIC 更具有大样本特性,在样本容量无限大时,AIC原则的模型阶数要大于 BIC,准则选择的模型阶数,BIC 准则渐趋一致,而 AIC更倾向于选择参数过多的模型,然而在小样本的情况下 AIC 准则的效用要优于BIC 准则。1.4.4 模型参数的估计模型参数的估计主要采用最小二乘或者极大似然估计,这两
39、种方法的估计精度较高,所以称为精估计。本文主要采用 Eviews 软件,直接给出了参数的估计值。1.4.5 模型检验模型的检验主要从以下几个方面判断:(1)、所有的系数是否都显著不为零;(2)、残差序列是否为白噪声;(3)、预测是否准确;(4)、是否有更大的拟合优度和更小的 AIC 值和 BIC 值;(5)、是否有更简单的模型;(6)、是否有直观意义和经济理论基础:1、对于残差序列是否为白嗓声,要绘制残差得自相关和偏相关图,看自相关系数和偏相关系数是否在 0.05 的置信区间内。2、Box-Piece Q 统计量20给出 统计量计算函数 , 为样本长度, 是样本子相关系数,QmkTQ12*2k
40、主观给定,一般在 15-20 之间,一般令 。mT原假设残差 是白噪声过程,统计量 渐进服从 分布,如果t* )(2qpm模型中含有常数项,则模型渐进服从 的,所以给定置信度)1(2qp( 通常为 0.05 或者 0.01),若 ,则不能拒绝残差是白噪1Q音的假设,检验通过,否则检验不能通过。3、D. W 值D. W 值源于 Durbin-Wstson 检验,主要是检查残差序列的自相关特性。D. W 统计量又称 统计量,其函数表达式为:d)1(212)(22 ntttnttt uud因为 可以看作是 与 之间的自相关系数,又由于自相关系数处于 和t1-t 1-之间,所以 统计量位于 0 到 4
41、 之间。又以下关系:1d时,残差之间存在正相关;2d时,残差之间不存在相关;时,残差之间存在负相关。2dDurbin-Wstson 检验给出了不同的样本容量和不同的自变量个数在不同的显著水平 的检验临界值。一般来说如果 D. W 值距离 2 较远,就认1%50,为有一定程度的自相关。但同时值得注意的一点是:Durbin-Wstson 检验只能检验残差序列的一阶相关,不能检验残差序列的高阶相关。214、样本决定系数和修正的 2R因为模型的总方差进行分解为:nt nt ntttt yyy111222 )()()(即 SERT而 )1()(22122 RknSTRSTEyntttt 修正 的取值范围
42、一般为0,1,也可能是绝对值很小的负数。同一类型2的模型,修正 越高,越接近 1,拟合越理想。当修正 等于 1 时,表明模型2R完全拟合。1.5 预测评价中的其他指标预测评价中的其他指标是误差均值nttyME1)(绝对误差 nttyA122绝对误差百分比nttyMAPE10均方根误差率 nttyRS12Theil inequality coefficient= ,Theil 不等系数nTttnTtttttyy1212)(取值在 0-1 之间。当等于 0 时,表示 100%的拟合;偏倚比率(bias proportion)= ,偏倚比率侧量预测平nTtttttty122)(均值与实际平均值之差的
43、平方占误差均方的比率;方差比率(variance proportion)= ,方差比率测量的是nTtttyStt12)(的预测值和实际值的分布偏倚标准之差的平方占误差均方的比;ty协方差比率(covariance proportion)= ,协方差比率是测nTtttySrt12)(占误差均方的比率,其中 表示样本容量,n 表示样本外预测数,tySr)1(2表示预测值, 表示实际值。t t2ARlMA 模型在同德化工(002360)股票中的定量分析232.1 同德化工(002360)股票的日开盘指数选样同德化工是由山西同德化工有限公司整体变更设立的股份有限公司,股本总额 4000 万元。2006
44、 年 1 月 18 日,同德化工在山西省工商行政管理局办理了变更登记,注册号为:1400002004534。2007 年 12 月 20 日,公司注册资本增加到 4500 万元,并在山西省工商行政管理局办理了变更登记,注册号为:140000200045347。本文选取同德化工(002360)股票从 2010 年 3 月 3 日到 2016 年 4 月 25 日的每日收盘价的对数收益率作为样本数据,其中每日股票的对数收益率 为相tR邻交易日收盘价 的自然对数一阶差分,即 ,数据来源于同tP )()1ttt PInR花顺软件。2.2 时间序列的平稳性检验2.2.1 散点图检验由图 3-1 可以看出
45、,序列符合零均值同方差的特征。可以大致的估计,同德化工股票日线时间序列的一阶差分是平稳的。2.2.2 自相关系数判断由图 3-2 所示,残差序列的自相关系数在滞后期 1 后都显著落在置信区间内,可大致断定一阶差分序列是平稳的。24图 3-1 同德化工股票日线时间序列的一阶差分图25图 3-2 同德化工日线时间序列自相关和偏相关系数图目标 主要因素河北省城镇居民消费结构体系食品 1X263 河北省消费结构的描述性统计分析3.1 恩格尔系数分析恩格尔系数指的是食品支出占消费总支出的比重。由恩格尔定律可知:一个家庭收入越少,家庭收入中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中
46、用来购买食物的支出比例则会下降。恩格尔系数是反映居民消费水平的重要指标,它的值越低,居民的消费水平越高。恩格尔系数达 59%以上为贫困,50-59%为温饱,40-50%为小康,30-40%为富裕,低于 30%为最富裕。由表 2 和表 3 可以得到如下的恩格尔系数变化折现对比图:衣着 2X居住 3家电与服务 4X医疗 5交通通讯 6X文教 7其他 8X27图 1 河北省恩格尔系数对比图从上图中可以清楚的看到许多现象。第一,从变化趋势看,十年中城乡居民恩格尔系数都有所下降。这充分说明在这十年中,随着我省经济的发展,我省城市和乡村居民的消费水平都有所提高。第二,从变化幅度看,农村居民恩格尔系数变化幅度较大,城镇恩格尔系数变化幅度较小。说明农村在这十年的发展中,消费水平提高的幅度比城市大,也展示了农村消费水平提高,消费结构转型的巨大潜力。第三,从具体细节看,在 2008 年城乡恩格尔系数较上一年有所上升,可能是经济危机导致居民消费水平下降。特别是在 2011 年农村居民恩格尔系数小于了城市,这可能和国家在经济危机后为了促进农村消费而实行的家电下乡等的一系列政策有关。随着经济的复苏,和消费水平的稳步提高,到 2014 年城市居民的恩格尔系数又低于乡村。3.2 衣着和房屋消费分析根据表 2 和表 3 可以得到如下的城乡居民衣着和房屋消费对比图如图 2 和图 3。