1、第十二章 因子分析因子分析是一种在许多变量中提取出隐藏的具有代表性的共性因子、构造因子模型的统计技术。因子分析模型设 m 个可能存在相关关系的观测变量 z1,z2,zm(经过标准化后)含有 p 个独立的公共因子 F1,F2,Fp(mp),观测变量 zi 含有独特因子 Ui(i=1m),诸Ui 间互不相关,且与 Fj(j=1p)也互不相关,每个 zi 可由 p 个公共因子和自身对应的独特因子 Ui 线性表出:(模型 1)mpmmmpUcFaFaZc 21 22212 111mpmij UcFaZ 212121.)(简记为 (模型 2))1()()1( mCAA 称为因子负荷矩阵(即模型 1 中各
2、方程的系数 aij 的矩阵) ,a ij 表示第 i 个变量 zi 在第 j 个公共因子 Fj 上的负荷,简称因子负荷。因子负荷反映了某一变量与某个因子的相关关系。每一个因子也可以表示各观测变量的线性组合:Fj=Wj1Z1+ Wj2Z2+ Wj3Z3+.+ WjmZmWj1:权重或因子得分系数,用于计算因子得分。因子分析步骤:一、形成问题二、基于原始数据构造相关矩阵Correlation Matrix1.000 -.053 .873 -.086 -.858 .004-.053 1.000 -.155 .572 .020 .640.873 -.155 1.000 -.248 -.778 -.01
3、8-.086 .572 -.248 1.000 -.007 .640-.858 .020 -.778 -.007 1.000 -.136.004 .640 -.018 .640 -.136 1.000V1V2V3V4V5V6Correlation V1 V2 V3 V4 V5 V6KMO and Bartletts Test.660111.31415.000Kaiser-Meyer-Olkin Measure of SamplingAdequacy.Approx. Chi-SquaredfSig.Bartletts Test ofSphericity三、确定因子分析方法主成分分析法(Princ
4、ipal components analysis 简称 PCA)和主因子分析法(Principal factor analysis 简称 PFA,也称 common factor analysis) 。主成分解释了变量的总方差,主因子解释了协方差。当主要目的是要减少变量时,采用主成分分析;当为了寻找对协方差有贡献的潜在因子时,采用主因子分析。常用主成分分析法。四、提取因子提取因子原则:按照能够解释方差的大小逐序提取因子。所有公因子(与其他变量所共有)能够解释某个变量方差的比例称为公因子方差(communality) ,记作 h2。公因子方差反映了各个因子对该变量的解释程度。某变量的 h2 越大
5、,说明这些因子对该变量的解释程度越强,用这些因子来描述该变量就越有效。Communalities1.000 .9261.000 .7231.000 .8941.000 .7391.000 .8781.000 .790V1V2V3V4V5V6Initial ExtractionExtraction Method: Principal Component Analysis.因子的特征值揭示了各个因子能够解释总方差的多少,反映了因子的重要程度,可作为提取因子的依据。五、确定因子的数量方法一:依据经验知识确定。方法二:选择特征值大于 1 的因子。方法三:scree 检验,即将各因子的特征值用折线图表示
6、出来,寻找平滑递减的特征值在图的右边停止不前的位置。Scree PlotComponent Number654321Eigenvalue3.02.52.01.51.0.50.0六、旋转因子若确定两个因子,得出因子/成分矩阵图如下,展示了两个因子与 6 个变量之间的相关关系,即因子负荷,体现了因子对变量的解释作用。但是,由于公因子是从多个变量中提取出来的,很有可能出现很多变量甚至所有变量在一个因子上的负荷都较大的情形,从而难以将变量归类和解释因子。故此,将因子矩阵进行正交旋转,采用方差最大正交旋转法,使得每个因子只和少数变量之间显著相关,或者每个变量都只和个别因子(最好是一个)强相关。旋转不会影
7、响公因子方差,但每一个因子能够解释的方差会发生变化,从而使得因子负荷发生变化。Component Matrixa.928 .253-.301 .795.936 .131-.342 .789-.869 -.351-.177 .871V1V2V3V4V5V61 2ComponentExtraction Method: Principal Component Analysis.2 components extracted.a. Rotated Component Matrixa.962 -2.66E-02-5.72E-02 .848.934 -.146-9.83E-02 .854-.933 -8.4
8、0E-028.337E-02 .885V1V2V3V4V5V61 2ComponentExtraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.Rotation converged in 3 iterations.a. 六、解释因子基于旋转后的因子矩阵进行解释。变量1、3、5和因子1相关,变量2、4、6和因子2相关。七、计算因子得分可根据研究需要计算因子得分:即每一个样本在每一个因子上的得分。计算方法:对于每个样本,用其各个标准化变量值乘以相应的因子得分
9、系数Wij,再加总。Component Score Coefficient Matrix.358 .011-.001 .375.345 -.043-.017 .377-.350 -.059.052 .395V1V2V3V4V5V61 2ComponentExtraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.八、模型评估即评估模型的拟合程度。因子分析的原假设:变量之间的相关关系可以由一个共同的因子来描述,即变量间的相
10、关程度可以转化为变量与因子间的相关程度/ 可由变量与因子间的相关关系来反映变量间关系。把通过变量与因子的关系反映出的变量间关系称为再生相关系数,初始的变量间相关系数与再生相关系数之间的差异反映了模型的拟合效果。Reproduced Correlations.926b -7.76E-02 .902 -.117 -.895 5.662E-02-7.76E-02 .723b -.177 .730 -1.79E-02 .746.902 -.177 .894b -.217 -.859 -5.13E-02-.117 .730 -.217 .739b 1.999E-02 .748-.895 -1.79E-0
11、2 -.859 1.999E-02 .878b -.1525.662E-02 .746 -5.13E-02 .748 -.152 .790b2.440E-02 -2.92E-02 3.115E-02 3.770E-02 -5.25E-022.440E-02 2.224E-02 -.158 3.763E-02 -.105-2.92E-02 2.224E-02 -3.13E-02 8.138E-02 3.327E-023.115E-02 -.158 -3.13E-02 -2.66E-02 -.1073.770E-02 3.763E-02 8.138E-02 -2.66E-02 1.574E-02-
12、5.25E-02 -.105 3.327E-02 -.107 1.574E-02V1V2V3V4V5V6V1V2V3V4V5V6Reproduced CorrelationResidualaV1 V2 V3 V4 V5 V6Extraction Method: Principal Component Analysis.Residuals are computed between observed and reproduced correlations. There are 5 (33.0%)nonredundant residuals with absolute values greater
13、than 0.05.a. Reproduced communalitiesb. 第十三章 时间序列分析时间序列分析是对于按时间顺序观测的系列数据进行分析的方法。例 1:表 1 为中国海关出口商品总额的有关数据(亿美元) ,计算环比、定基、平均发展速度和增长速度。 年份 出口总额 逐期增长量环比发展速度环比增长速度定基发展速度定基增长速度1990 620.91 100.00 1991 718.43 97.52 115.71 15.71 115.71 15.711992 849.40 130.97 118.23 18.23 136.80 36.801993 917.44 68.04 108.01
14、8.01 147.76 47.761994 1210.06 292.62 131.90 31.90 194.88 94.881995 1487.80 277.74 122.95 22.95 239.62 139.621996 1510.66 22.86 101.54 1.54 243.30 143.301997 1827.92 317.26 121.00 21.00 294.39 194.391998 1837.09 9.17 100.50 0.50 295.87 195.871999 1949.31 112.22 106.11 6.11 313.94 213.942000 2492.03 5
15、42.72 127.84 27.84 401.35 301.352001 2661.55 169.52 106.80 6.80 428.65 328.652002 3255.96 594.41 122.33 22.33 524.39 424.39例 2:某地区国内生产总值 1999-2001 年间平均每年递增 12%,2002-2005 年间平均每年递增 10%,2006-2008 年平均每年递增 8%。请计算:(1)该地区国内生产总值在这 10 年间(1999-2008)的总发展速度; (2)该地区国内生产总值在这 10 年间(1999-2008)的平均增长速度;(3)若该地区 2008 年的国内生产总值为 500 亿元,以后平均每年增长 6%,则到 2010 年可达到多少?