收藏 分享(赏)

SAS因子分析简介.doc

上传人:gnk289057 文档编号:6113144 上传时间:2019-03-27 格式:DOC 页数:5 大小:69KB
下载 相关 举报
SAS因子分析简介.doc_第1页
第1页 / 共5页
SAS因子分析简介.doc_第2页
第2页 / 共5页
SAS因子分析简介.doc_第3页
第3页 / 共5页
SAS因子分析简介.doc_第4页
第4页 / 共5页
SAS因子分析简介.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、SAS/STAT/FACTOR 过程使用SAS/STAT 的 FACTOR 过程可以进行因子分析、分量分析和因子旋转。对因子模型可以使用正交旋转和斜交旋转,可以用回归法计算得分系数,同时把因子得分的估计存贮在输出数据集中;用 FACTOR 过程计算的所有主要统计量也能存贮在输出数据集中。FACTOR 过程用法很简单,主要使用如下语句:PROC FACTOR DATA= 数据集 选项 ;VAR 原始变量 ;RUN;输出结果包括特征值情况、因子载荷、公因子解释比例,等等。为了计算因子得分,一般在 PROC FACTOR 语句中加一个 SCORE 选项和“OUTSTAT=输出数据集”选项,然后用如下

2、的得分过程计算公因子得分:PROC SCORE DATA=原始数据集 SCORE=FACTOR 过程的输出数据集 OUT=得分输出数据集;VAR 用来计算得分的原始变量集合;RUN;PROC FACTOR ;The following options are available in the PROC FACTOR statement. ALL ALPHA=pCONVERGE=p CORRCOVARIANCE COVER DATA=SAS-data-set EIGENVECTORSGAMMA=p HEYWOODHKPOWER=p MAXITER=nMETHOD=name MINEIGEN=pM

3、SA NFACTORS=nNOBS=n NOCORRNOINT NOPRINTNORM=COV | KAISER | NONE | RAW | WEIGHT NPLOT=nOUT=SAS-data-set OUTSTAT=SAS-data-setPLOT POWER=nPREPLOT PREROTATE=namePRINT PRIORS=namePROPORTION=p RANDOM=nRCONVERGE=p REORDERRESIDUALS RITER=nROTATE=name SCORESCREE SESIMPLE SINGULAR=pTARGET=SAS-data-set ULTRAHE

4、YWOODVARDEF=DF | N | WDF | WEIGHT | WGT WEIGHT三、例子DATA example8_2;INPUT diqv$ x1-x6; Cards;北京 10265 30.81 6235 3223 65 4955天津 8164 49.13 4929 2406 21 3182河北 3376 77.76 3921 1668 47 10266山西 2819 33.97 3305 1206 26 5922内蒙 3013 54.51 2863 1208 19 4915辽宁 6103 124.02 3706 1756 61 6719吉林 3703 28.65 3174 1

5、609 43 3891黑龙江 4427 48.51 3375 1766 38 7637上海 15204 128.93 7191 4245 45 5286江苏 5785 101.09 4634 2456 67 12039浙江 6149 41.88 6221 2966 37 8721安徽 2521 55.74 3795 1302 35 6593福建 5386 18.35 4506 2048 30 4537江西 2376 26.28 3376 1537 31 5423山东 4473 102.54 4264 1715 48 10463河南 2475 71.36 3299 1231 50 7661湖北

6、3341 37.75 4028 1511 56 9744湖南 2701 43.1 4699 1425 47 9137广东 6380 51.82 7438 2699 42 8848广西 2772 32.52 4791 1446 27 5571海南 4820 5.35 4770 1519 5 1653四川 2516 80.97 4002 1158 64 18885贵州 1553 22.07 3931 1086 22 3934云南 2490 48.48 4085 1010 26 6395陕西 2344 26.31 3309 962 46 6215甘肃 1925 14.84 3152 880 17 4

7、131青海 2910 4.16 3319 1029 7 1176宁夏 2685 7.94 3382 998 7 1028新疆 3953 26.65 4163 1136 21 3932;proc factor data= example8_2;var x1-x6; run;程序运行的结果:Initial Factor Method: Principal ComponentsPrior Communality Estimates: ONEEigenvalues of the Correlation Matrix: Total = 6 Average = 1Eigenvalue Difference

8、 Proportion Cumulative1 3.32465039 1.53397281 0.5541 0.55412 1.79067758 1.29809455 0.2984 0.85263 0.49258303 0.22859204 0.0821 0.93474 0.26399099 0.17552552 0.0440 0.97875 0.08846547 0.04883292 0.0147 0.99346 0.03963255 0.0066 1.00002 factors will be retained by the MINEIGEN criterion.Factor Pattern

9、Factor1 Factor2x1 0.83173 -0.48814x2 0.73239 0.43062x3 0.77993 -0.43431x4 0.89373 -0.40302x5 0.69159 0.60703x6 0.45951 0.80462(默认采用主成分法确定因子载荷矩阵)前两个主成份解释了85.26%的方差,按照缺省的选择因子个数的准则MINEIGEN,取大于1的特征值,所以取两个因子。因子模式阵(factor pattern,即因子载荷阵 )是最重要的结果。Variance Explained by Each FactorFactor1 Factor23.3246504 1.

10、7906776Final Communality Estimates: Total = 5.115328x1 x2 x3 x4 x5 x60.93005305 0.72182667 0.79692502 0.96118012 0.84678120 0.85856190上述是公因子的方差贡献,和各原始变量的共同度。反映了公因子对各原始变量的解释能力。第一主成份(因子)在所有五个变量上都有正的载荷,可见这个因子综合反映了发展状况。第二主成份在人均 GDP,人均收入,和农村家庭人均纯收入上有负的载荷。但是我们得到的因子解释不够清楚,于是考虑用因子旋转。proc factor data= exampl

11、e8_2 rotate=varimax;var x1-x6; run;Rotation Method: VarimaxOrthogonal Transformation Matrix1 21 0.81035 0.585952 -0.58595 0.81035Rotated Factor PatternFactor1 Factor2x1 0.96002 0.09178x2 0.34117 0.77810x3 0.88650 0.10505x4 0.96038 0.19709x5 0.20474 0.89714x6 -0.09910 0.92127Variance Explained by Eac

12、h FactorFactor1 Factor22.7979881 2.3173399Final Communality Estimates: Total = 5.115328x1 x2 x3 x4 x5 x60.93005305 0.72182667 0.79692502 0.96118012 0.84678120 0.85856190这时的两个公因子的实际意义要好解释一些。为了产生因子得分函数,需要在 FACTOR 过程中使用 SCORE 选项。为了产生各样品的因子得分值,还要用 OUTSTAT=选项输出得分系数数据集并调用 SCORE过程。比如,为了计算方差最大正交旋转的主成分得分,可以用

13、如下程序:PROC FACTOR DATA= example8_2 ROTATE=VARIMAX SCORE OUTSTAT=OUTF;TITLE2 主成分分析及 VARIMAX 正交旋转;RUN;PROC SCORE DATA= example8_2 SCORE=OUTF OUT=OUTS;TITLE2 VARIMAX 正交旋转后的主成分得分;RUN;Rotation Method: VarimaxScoring Coefficients Estimated by RegressionSquared Multiple Correlations of the Variables with Each FactorFactor1 Factor21.0000000 1.0000000Standardized Scoring CoefficientsFactor1 Factor2x1 0.36246 -0.07432x2 0.03760 0.32395x3 0.33222 -0.05909x4 0.34971 -0.02487x5 -0.03007 0.39659x6 -0.15129 0.44511

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报