收藏 分享(赏)

SAS 相关与回归模型.doc

上传人:ysd1539 文档编号:6784371 上传时间:2019-04-22 格式:DOC 页数:12 大小:210.50KB
下载 相关 举报
SAS 相关与回归模型.doc_第1页
第1页 / 共12页
SAS 相关与回归模型.doc_第2页
第2页 / 共12页
SAS 相关与回归模型.doc_第3页
第3页 / 共12页
SAS 相关与回归模型.doc_第4页
第4页 / 共12页
SAS 相关与回归模型.doc_第5页
第5页 / 共12页
点击查看更多>>
资源描述

1、 相关与回归模型 SAS 程序主要内容1、散点图2、相关分析3、一元回归模型建立及检验4、一元回归模型的拟合图与残差图5、多元回归模型与数据标准化系数6、共线性检验(VIF,7、变量的逐步选择8、模型的自相关 DW 检验相关与回归分析指导一、散点图例:一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清不良贷款形成的原因,管理者希望利用银行业务的有关数据进行定量分析,以便找出控制不良贷款的办法。下面是该银行所属的 25 家分行 2002

2、年的有关业务数据 分行编号 不良贷款 (y) 各项贷款余额 (x)1 0.9 67.32 1.1 111.33 4.8 173.04 3.2 80.85 7.8 199.76 2.7 16.27 1.6 107.48 12.5 185.49 1.0 96.110 2.6 72.811 0.3 64.212 4.0 132.213 0.8 58.614 3.5 174.615 10.2 263.516 3.0 79.317 0.2 14.818 0.4 73.519 1.0 24.720 6.8 139.421 11.6 368.222 1.6 95.723 1.2 109.624 7.2 19

3、6.225 3.2 102.2Data e41;Input x y ;Label y= 不良贷款 x= 各项贷款余额;Cards ;0.9 67.3 1.1 111.3 4.8 173.0 3.2 80.8 7.8 199.7 2.7 16.2 1.6 107.4 12.5 185.41.0 96.1 2.6 72.8 0.3 64.2 4.0 132.2 0.8 58.6 3.5 174.6 10.2 263.5 3.0 79.30.2 14.8 0.4 73.5 1.0 24.7 6.8 139.4 11.6 368.2 1.6 95.7 1.2 109.6 7.2 196.23.2 10

4、2.2;proc gplot data=e41; plot y*x; run;二、相关系数分析Proc corr data=e41 ;Var x y;Run;2、计算协方差与相关矩阵Proc corr data=e41 cov;Var x y;Run;例:10 个企业的销售收入和销售利润资料企业编号 销售收入 x 销售利润 y1 5 082 10 13 12 124 15 25 15 226 20 257 25 258 28 289 30 310 30 3Data e42;input x y ;Cards;5 0.8 10 1 12 1.2 15 2 15 2.220 2.5 25 2.5 2

5、8 2.8 30 3 30 3;Proc corr data=e42;Var x y;Run;例,分析变量年龄,体重,跑步 时间和需氧量的关系data fitness;input Age Weight Runtime Oxygen ;datalines;57 73.37 12.63 39.407 54 79.38 11.17 46.08052 76.32 9.63 45.441 50 70.87 8.92 .51 67.25 11.08 45.118 54 91.63 12.88 39.20351 73.71 10.47 45.790 57 59.08 9.93 50.54549 76.32

6、. 48.673 48 61.24 11.5 47.92052 82.78 10.5 47.467 44 73.03 10.13 50.54145 87.66 14.03 37.388 45 66.45 11.12 44.75447 79.15 10.6 47.273 54 83.12 10.33 51.85549 81.42 8.95 40.836 51 77.91 10.00 46.67248 91.63 10.25 46.774 49 73.37 10.08 50.38844 89.47 11.37 44.609 40 75.07 10.07 45.31344 85.84 8.65 54

7、.297 42 68.15 8.17 59.57138 89.02 9.22 49.874 47 77.45 11.63 44.81140 75.98 11.95 45.681 43 81.19 10.85 49.09144 81.42 13.08 39.442 38 81.87 8.63 60.055;proc corr data=fitness pearson spearman hoeffding;var weight oxygen runtime;run;三、一元回归分析模型建立及检验 01yx回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化,因变

8、量 y 是随机变量,自变量 x 是非随机的确定变量,回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 u 残差(residual) 12Ntttttx01yProc reg data=e42;Model y= x ;Run;模型的检验,模型系数 T 检验与模型拟合优度 R2简单模型Proc reg data=e41 ;Model y=x;Run;加描述统计量的简单模型 ,加 allProc reg data=e41 all;Model y=x;Run;Proc GLM data=e41;Model y= x ;Run;四、一元回归模型的拟合图和残差图和异方差

9、画出残差图Proc reg data=e41 all;Model y=x;plot r.*p./ vref=0;Run;PROC REG DATA=e41;MODEL Y = X;Plot ;Plot y*x;RUN;Proc REG data=e41;Model y=x;Plot y*x p.*x/overlay ;Run;symbol;proc reg data=e41;model y=x;plot y*x/pred nostat mse aic bic ;plot y*x / conf pred;plot r.*nqq./ noline mse ;plot rstudent.*obs.;

10、output out=regout p=rhat;run;计算预测值与残差Proc reg data=e41;Model y=x/r cli clm;Run;残差Q-Q图,P-P图symbol i=spline v=star h=2 color=pink width=2;proc reg data=e41 outest=kk;model y=x/r aic bic edf gmsep jp pc sbc sp selection=rsquare;plot r.*nqq. / aic bic mse ; plot npp.*r./ nostat ;run;proc print data=kk;r

11、un;预测区间图Proc reg data=e41 all;Model y=x;plot (y PREDICTED. u95. l95.)*x/overlay;Run;身高H与体重W的关系data wh1001;input h w ;cards;172.4 75.0 169.3 54.8 169.3 64.0 171.4 64.8 166.5 47.4 171.4 62.2168.2 66.9 165.1 52.0 168.8 62.2 167.8 65.0 165.8 62.2 167.8 65.0164.4 58.7 169.9 57.5 164.9 63.5 160.3 55.2 175

12、.0 66.6 172.5 73.5172.0 64.0 168.4 57.0 155.0 57.0 175.5 63.9 172.3 69.0 168.6 58.0176.4 56.9 173.2 57.5 167.5 50.0 169.4 52.2 166.7 72.0 169.5 57.0165.7 55.4 161.2 48.5 172.8 57.0 175.1 75.5 157.5 50.5 169.8 62.9168.6 63.4 172.6 61.0 163.8 58.5 165.1 61.5 166.7 52.5 170.9 61.0166.1 69.5 166.2 62.5

13、172.4 52.6 172.8 60.0 177.8 63.9 162.7 56.8168.8 54.0 169.1 66.2 177.5 60.0 177.0 66.2 169.9 55.9 167.4 54.4169.3 58.4 172.8 72.8 169.8 58.0 160.0 65.3 179.1 62.2 172.3 49.8163.3 46.5 172.9 66.7 165.4 58.0 175.8 63.2 162.3 52.2 165.4 65.7171.5 59.3 176.6 66.3 181.7 68.6 175.2 74.9 169.5 59.5 169.6 6

14、1.5169.1 63.1 185.5 77.0 173.9 65.5 162.5 50.0 171.5 58.5 175.6 59.8166.0 75.5 167.2 63.3 171.9 57.0 176.6 58.4 177.3 67.0 169.2 71.8166.2 49.8 181.7 63.0 175.8 68.3 172.3 55.5 172.7 58.5 174.3 64.0171.2 59.0 174.8 68.0 165.4 55.5 169.1 64.8 167.9 62.0 176.8 64.0183.5 69.9 165.5 48.6 171.0 70.5 170.

15、3 58.5;Proc reg data=wh1001 corr;model w=h;plot p.*r.;title QQ Plot;plot r.*nqq./ noline mse;run;Proc reg data=wh1001;model w=h;plot (w PREDICTED. u95. l95.)*h/overlay ; plot W*H / pred nostat;run;五、多元回归模型与数据标准化系数 0123yxx回归方差分析表变异来源source离差平方和SS自由度df均方MSF 统计量FP 概率值P回归 R SkkRSM/MSERkN/1,P误差 E 1N)(E总变

16、异 T例 某学校 20 名一年级女大学生体重(公斤)、胸围(厘米)、肩宽(厘米)及肺活量(升)实测值如表所示,试对影响女大学生肺活量的有关因素作多元回归分析。20 名一年级女大学生肺活量及有关变量测量结果编号 体重 X1(公斤) 胸围 X2(厘米) 肩宽 X3(厘米) 肺活量 Y(升)1 51.3 73.6 36.4 2.992 48.9 83.9 34.0 3.113 42.8 78.3 31.0 1.914 55.0 77.1 31.0 2.635 45.3 81.7 30.0 2.866 45.3 74.8 32.0 1.917 51.4 73.7 36.5 2.988 53.8 79.

17、4 37.0 3.289 49.0 72.6 30.1 2.5210 53.9 79.5 37.1 3.2711 48.8 83.8 33.9 3.1012 52.6 88.4 38.0 3.2813 42.7 78.2 30.9 1.9214 52.5 88.3 38.1 3.2715 55.1 77.2 31.1 2.6416 45.2 81.6 30.2 2.8517 51.4 78.3 36.5 3.1618 48.7 72.5 30.0 2.5119 51.3 78.2 36.4 3.1520 45.2 74.7 32.1 1.92data ex43;input x1 x2 x3 y

18、;cards;51.3 73.6 36.4 2.9948.9 83.9 34.0 3.1142.8 78.3 31.0 1.9155.0 77.1 31.0 2.6345.3 81.7 30.0 2.8645.3 74.8 32.0 1.9151.4 73.7 36.5 2.9853.8 79.4 37.0 3.2849.0 72.6 30.1 2.5253.9 79.5 37.1 3.2748.8 83.8 33.9 3.1052.6 88.4 38.0 3.2842.7 78.2 30.9 1.9252.5 88.3 38.1 3.2755.1 77.2 31.1 2.6445.2 81.

19、6 30.2 2.8551.4 78.3 36.5 3.1648.7 72.5 30.0 2.5151.3 78.2 36.4 3.1545.2 74.7 32.1 1.92;proc reg;model y=x1 ;model y=x1 x2 ;model y= x2 x3;model y=x1 x2 x3/ stb mse aic bic caxis=red ctext=blue ;run; quit;六、共线性检验(VIF,共线性(collinearity, multicollinearity)问题是指独立变量间存在线性关系共线性的诊断可使用方差膨胀因子、条件指数和方差比例方差膨胀因子(

20、VIF)是对由于共线性而引起的参数估计量的方差增加的一个相对度量, 一般采用 VIF 10 表明存在共线性问题容忍度 Tol,为 VIF 的倒数,当 TOL 小于 0.0001 时程序会自动拒绝一个自变量。 VIF10,有多重共线性;TOL=1/VIF;条件数 ,C20,共线性严重maxinCproc reg data=xiaoshou;model y=x1 x2/ COLLIN vif tol;run;collin 对自变量之间的共线性进行分析collinoint 对自变量之间的共线性进行分析,不包括截距项collin 对自变量之间的共线性进行分析collinoint 对自变量之间的共线性进

21、行分析,不包括截距项proc reg data=ex43 simple corr ;model y=x1 x2 x3 / p cli clm r vif influence partial collin tol collinoint;run; 七、变量的逐步选择一、 stepwise 逐步回归过程stepwise 过程对逐步回归提供了九种方法。当你有许多自变量且想找出哪些自变量是该选入回归模型时,stepwise 是有用的。常用的自变量的选择法, BACKWARD,FORWARD , STEPWISE proc reg data=xiaoshou;model y=x1 x2/ selectio

22、n=stepwise CP details=summary;run;标准回归系数proc reg data=xiaoshou;model y=x1 x2/ selection=stepwise std details=summary;run;八、模型的自相关 DW 检验212()/NtttDWeES04当 DW 值愈接近 2 时,残差项间愈无相关。当 DW 值愈接近 0 时,残差项间正相关愈强。当 DW 值愈接近 4 时,残差项间负相关愈强。SAS 回归 分析程序Proc Reg 选项串 ; 1) data=输入文件名,缺省则为最后一个 sas 文件 2)0utest=输出文件名 3)all

23、印出所有分析结果4)corr 印出相关系数阵 1) Tol(rance) (定义为 1-R2)印出各参数的容忍量2) Vif (Variance Inflance) 变异数的膨胀值3) Collin 执行多自变量间的共线性分析4) P 因变量的实际值与预测值及误差的表5) R 比 7)更多,包括(cook)D 值(用于发现奇异样本)6) clm 各个预测值均值的 95%的置信区 间上下限7) Partial 对每一个自 变量作净回归图8) selection=stepwise (forward backward Rsquare Adjrsq MaxR )(分别为)逐步回归(向前回归,向后回归,

24、复相关系数平方法,修正的复相关系数平方法,最大相关法)Plot 图形指令串/选项串;1)Plot 纵轴变量名.*横轴变量名.回归模型收入与消费的关系Data datareg;Input dq $1-8 x1 y1 x2 y2;Lable dq=“省区 “ x1=“城镇居民年人均可支配收入“y1=“城镇居民年人均消费“ x2=“农民人均纯收入“ y2=“农民人均生活消费“ ;cards;Hebei 10305 7343 3802 2495Liaoning 10370 7987 4090 3067Jiangsu 14084 9629 5813 4135Zhejiang 18265 13349 73

25、35 6057Fujian 13753 9808 4835 3591Shandong 12192 8468 4368 3144Hainan 9395 7127 3256 2232Guangdon 16016 12432 5080 3886Shanxi 10028 7171 3181 2253InnerMon 10358 7667 3342 2772Jilin 9775 7353 3641 2701Heilongj 9182 6655 3552 2618Anhui 9771 7295 2969 2421Jiangxi 9551 6646 3460 2677Henan 9810 6685 3261

26、 2229Hubei 9803 7397 3419 2732Hunan 10505 8169 3390 3013Chongqin 11570 9399 2874 2205Guangxi 9899 6792 2770 2414Sichuan 9350 7525 3002 2395Guizhou 9117 6848 1985 1627Yunnan 10070 7380 2250 2196Tibet 8941 6193 2435 2002Shaanxi 9268 7553 2260 2181Gansu 8921 6974 2134 1855Qinghai 9000 6530 2358 2179Ningxia 9177 7206 2760 2247Xinjiang 8871 6730 2737 2032;proc reg data=datareg;model y1=x1;plot y1*x1;model y2=x2;plot y2*x2;run;

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报