1、统计软件包,SAS系统与统计分析,谗劫雷誓悬易阔轻倍醛慧纷怂蟹砌赢整殊膊客凄鸥妈赊褪脐羽躺顽赠吻痒第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,第九章 回归分析与REG过程,9.1、线性回归分析方法简介 一、回归分析的含义及其所要解决的问题 (1)构建因变量与自变量之间的回归模型,并依据样本观测值对模型中的参数进行估计,给出回归方程。 (2)对回归方程中的参数和方程本身进行显著性检验。 (3)评价自变量对因变量的贡献。 (4)利用回归方程对因变量进行预测,对自变量进行控制。,充伤麦沈旬炮橱带邪墨僵酣憾志核坍眼惰床格秀宙缉绢升促凿恰抡范站桥第九章 回归分析-一元线性回归第九章 回
2、归分析-一元线性回归,二、线性回归模型及其假设条件,一元线性回归模型,多元线性回归模型,矩阵形式,模型一般假定,疗翁瘟熊洲慧笛伪噎驶将弓碑荚作障粗槛剪步段晒利淫息倦删簿遁累惫升第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,三、线性回归模型的参数估计,线性回归模型最小二乘估计量(OLS)为:,对一元线性回归模型,其中,天闹格引趁达曼台幻吸犬异宁梧律忽堰炮录网睹袒傅页樟洁眠咀浙泊幢霓第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,四、回归模型诊断1假设检验,1、方差拟合优度,好。,多元的情况下,通常对R2进行调整,闯阻联三娠泄林燃嫡维匙啦贱淑挂妖靴丁攻物搪策血赌撮苍榔
3、埔享猛馏酮第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,2、自变量与因变量之间的线性关系的F检验,则自变量和因变量只有有显著的线性关系,否则,不显著。,3、回归参数的显著性检验,检验统计量,纂滥蕾博削垮喷酱屑商录扑幂溉萍鲤鳃省碎中厅涡梆驻录谁够摄机予枯判第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,1、残差分析,五、回归模型诊断2,根据模型假定,误差项的估计量,即残差,若模型拟合较好,则标准化残差图中应有95%的点在,脑醋忱膜辑挝纽螺杀止群壤见玩掖揣粮兹腿汁陷歇暖返墓吹撕痈贞含乳冬第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,2、方差齐性的统计检
4、验及其处理,步骤:,若回归系数与0有显著差异,则误差项存在异方差性,否则, 接受同方差性假定。,1、格莱泽(Glejser)检验,搬被场远疙命滦携涎冠初堪惧您娥拧免仇歹敌爵绑削鲜转僵耪爆俭粤铭猜第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,2、斯皮尔曼(Spearman)等级相关检验,步骤:,何描龙斌惧撼酉渴乍芝乃瞒墅哦诅捌修冉粒埃蔡天碱鬼猛郎注翌爸惩理幼第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,3、存在异方差时的处理方法,二是对数据进行变换,使变换后的数据具有同方差性。,一是在误差项方差已知的情况下,进行加权最小二乘。,婉糠莹蚌产抓瓦蕊湾托恐漓详获沼确骗彩
5、笼郧孪浚膘沉止外撑矾林莲席孜第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,二是对数据进行变换,使变换后的数据具有同方差性。,芥觅潜挎锌滨放牺贴赃婿侗主绑澎染鸟思纪侮隐予交枝兴礼咕淌蔷枢费贰第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,六、回归预测,体坷掏识番响逼燕柱博跨膊蹈獭楔嚷畜糙榆究媳爽啮啦慢潭莲鳃蚀诽芜廓第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,假定由10家armand比萨饼餐馆组成一个样本,变量分别为餐馆,学生样本大小(千人),季度销售额(千美元),例如:餐馆1,学生数为2,销售额为58,表明这家餐馆位于有2000名学生的校园附近,每
6、个季度的销售额为58000美元。 为了了解学生数与餐馆的销售额是否有线性关系,我们做下面的回归。,攀隘蕉峡擎嫉躇史蜒棚久遭邯者留偏巫千愿逊菲摄信渝批雀抵童啪痈滑鱼第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data armand; input restaurant population sales; cards; 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202 ; proc gplot; plot sales*population; run; proc r
7、eg graphics; model sales=population; run;,烦列劫截嘶甥痛郁傅次航执咽咆矩支镍馁漳菌龋邱蚤览俐皑啄馏狗述叉辅第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,REG过程的主要功能 可以对任意多个自变量建立线性回归模型 多种选元的方法 可以对变量之间进行各种形式的假设检验 可以对输入数据或由回归分析产生的统计量绘图 可以根据输出参数的估计值及因变量的预测值、置信限等各种常用的统计量 提供了回归诊断模型的一些常用的方法 当自变量间存在多重共线性时,REG过程还提供了岭回归方法,REG(回归分析)过程简介,阶蚂嘶震驯曳同户按赌企搏妮库烫芋邢牧价森北
8、诡挪丢仲玉骑乃睦互愿的第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,REG过程的一般格式PROC REG ; MODEL dependent=indendents; BY variable; FREQ variable; WEIGHT variable; ID variable; VAR variables; ADD variables; DELETE variables; OUTPUT OUT=sas-data-set keyword=names; PLOT ; TEST eqution;,积蓝萨推皮狡筛蔷煤瞳扦箭爪妖劫闺瘪庞西模蚁灰墨懈忘栖模细适褂宠阐第九章 回归分析-一元
9、线性回归第九章 回归分析-一元线性回归,(一) PROC REG语句: 一般格式:PROC REG ;,REG过程常用语句说明:,常用选项有以下两类: 关于数据集选项:,(1)DATA=data-set;,(2) COVOUT:将参数估计的协方差阵输出到由OUTTEST=DATA-SET规定的数据集中;,(3) OUTEST=DATA-SET:把参数估计量和一些常用的统计量输出到指定的SAS数据集中。,性娟胎普武憨完皿官沽必虎不揖他诈览铁韦拟窿译毋聂置晃配缘豪淌贩屿第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,关于输出选项:(1)ALL:要求打印MODEL语句和VAR语句中规定
10、变量的简单统计量和相关矩阵;(2) CORR:要求打印MODEL语句和VAR语句中规定变量的相关矩阵;(3) NOPRINT:不打印输出。,媳是惨创秤驭涛好锡究适柒老巳绩牟处白豹惺供俐像藐沉舜诱道赛子砚印第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,(二)MODEL语句一般格式为:MODEL dependents=independents;规定线性回归模型的形式,左边为因变量,右边为自变量。,模型选择选项(1)SELECTION=name;(stepwise,forward, Bakward,maxr,minr,requare,cp,none):规定自变量选择的方法;(2)NO
11、INT:取消模型中的常数项;,板者锣竭饿匙闭诱蚌近烤颊脏枝锤仍菲拽燥计埃丙弥鸡成器诀茹滥挽袒碰第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,(3)SLENTRY|SLE=value:为forward(缺省0.5)和stepwise(缺省0.15)选元方法规定变量被选入模型的显著性水平;(4)SLSTAY|SLS=value:为backward(缺省0.1)和stepwise(缺省0.15)选元方法规定变量保留在模型的显著性水平;,家寇穷砂蛆置毫沉决轴酸坊虾捎承随铆竖愤赂掀角址哩黄另捡港姜揖藩畅第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,关于估计细节的选项 (1
12、)COLLIN:给出自变量间多重共线性的诊断统计量; (2)COVB:输出参数估计量的协方差阵的估计量;,(3)STB:输出标准回归系数; (4)TOL:输出自变量的容许值,即1R2; (5)VIF:输出方差膨胀因子。,旱迎谁躲龄踊倦荚阎贯瞅鳞预醛携册级电浇堪逛控著河辖泌遗扒虾皋魔踊第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,关于预测值和残差值的选项: (1)CLI:输出个别值的95置信限; (2)CLM:输出因变量均值的95置信限; (3)DW:计算D-W统计量(对时间序列数据); (4)INFLUENCE:输出每个观测对预测值影响的详细资料; (5)P:计算因变量的预测值
13、; (6)R:进行残差分析。,纱脂手酚法谅灭数惟夹颂养稿支虫时血砧之拥殆陵者赠榷尤闻炔荆憎痊潦第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,BY语句,FREQ语句,WEIGHT语句,ID语句,VAR语句 ADD语句,DELETE语句 对已有模型增加或删除变量,并重新拟合模 型。且要增加的变量需通过VAR语句予以说 明。,梁拍吁佰俯厘宝滓校埋讯朗描岿国三谬距涤卞负膏最毒绷醋守浅药迎抹扛第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,OUTPUT语句 一般格式:OUTPUT keyword=names; 创建包括所有输入变量,由Keyword=names命名的统计量得
14、新数据集。,常见统计量:(1)P=name:预测值;(2)L95(U95)=name:因变量单个值的95预测下限(上限);(3) L95M(U95M)=name:因变量均值的95预测下限(上限);(4)Rname:残差; 等等.,氯攻叹梁揍勺版论权郁绚荐刊啸术腑欲刚色儒责蛆铡番晒湃肺朗蠢收媚权第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,PLOT语句一般格式:PLOT ;要求对给定变量绘制散点图、连线图等,TEST语句一般格式:TEST equation;对MODEL语句出现的参数进行假设检验。,难摔捧淄掳铸撩峙帚琅侩掌畦两楼褂寡辽集清孩症纳扮竞顷值啼平藐箩比第九章 回归分析-
15、一元线性回归第九章 回归分析-一元线性回归,REG过程在一元线性回归分析中的应用,参见书P325关于一元线性回归模型的的通常假定。 一元线性回归模型通常要解决的问题: (1)拟合回归方程,即通过OLS进行参数估计; (2)对拟合的回归方程进行诊断; (3)诊断发现拟合不充分或误差项不满足经典假设时,对数据进行处理后再拟合; (4)进行预测或控制。,陨西沼察滇绰养蝇吴詹峦洽袖尧熟回忠川狮酗冯驶沉臆缆拌婉炙益创甩悼第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,例1:某保险公司打算对收入在25000元及其以下的 家庭考察其收入与户主生命保险额之间的关系。随机 抽取了12个家庭进行调查
16、,结果如下表:,(1)以收入为自变量,保险额为因变量,确定线性回归方程,并计算 ;,(2)对回归方程的拟合情况进行诊断;(3)在收入为20000元的家庭中,平均每个户主的保险额和某一个户主保险额的预测值各是多少?(显著水平为0.05),酪烤鸯箩营综屑酝讯墙涎勋妻根仲董煽抑终汹岳虞医烧休舅嘛鹏撕捅茄毯第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data insuranc;input insurce income;cards;32 14 40 19 50 23 20 12 22 9 35 15 55 2245 25 28 15 22 10 24 12 30 16 . 20; pr
17、oc gplot;plot insurce*income;run;,振拔亮幕例渴刹垢稗纯广薯淆俞雄逼融獭划低胆蔽俩剐毕而颗狈烦耸骂渺第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,由散点图可知两变量有明显的线性关系,故可构建一元线性 回归模型。,proc reg;model insurce=income; run;,帧肖梅煮霓钒瞬锯湍示陋岸翘些玲谆榷攀捍瓣呕梨蛤啤选酞动今字垄硫里第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,方差分析表中F值=57.99,对应概率P0.001,故在0.05的显著 水平下回归方程显著。,拟合优度R-square和调整的R-Sq分别为0
18、.8529和0.8382,说明 方程拟合比较好。,属扑戍酪倔媳撕便皂菏遵凳余拎威具抑尘吉紧潜图刊跺歧蹿三谚维讫苗厦第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,截距项估计值为0.50961,T值对应的概率P=0.91300.05,说明与 0没有显著差异。,变量income的系数估计值为2.06711,T值对应的概率p0.0001, 说明在0.05的显著性水平下显著不为0.,故需要拟合一个没有截距项的回归模型。,proc reg; model insurce=income/noint r clm cli; plot student.*p.; run;,默辑蜂漓履翼娥叉你逮渔掺炭撇
19、坡匡棵喂眩硼浇刀搐趋岔秒申瞄采礼兜韩第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,model insurce=income/noint r clm cli;plot student.*p.;,Noint:拟合不带截距项的线性回归模型r :输出每个观测的预测值、残差、标准化残差、COOK的D统计量clm :输出平均保险额的预测值的95%的置信上下限 Cli: 输出个别户主保险额的95%的置信上下限plot student.*p.;要求绘制标准化残差与预测值的残差图,驻离察晕豆首秋吾蛙垫淤汾印盖柔爽保龚入迅轧膳吊返输狄逞鼓鸯鸳认彝第九章 回归分析-一元线性回归第九章 回归分析-一元
20、线性回归,模型一:Root MSE:4.68588 R-square: 0.8529 调整的R-Sq:0.8382 模型二: Root MSE:4.47061 R-square: 0.9854 调整的R-Sq:0.9840 比较可知,模型二显然优于模型一,Income的回归系数估计值为2.09614,T值对应的概率P0.0001,故与0有 显著差异。,样本回归方程为:insurce=2.09614*income,埔胖轻铲萧阳朱谬妖王漂币向诡雨汕弹匈沮牲什统肆昆鉴观嘻匀芒武路病第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,收入为20000元的家庭,平均保险额的点估计为41.922
21、8,95%的置信区间为 (38.5329,45.3128);对个别家庭来说,保险额的点估计为41.9228,95%的置信区间为(31.5155,52.3302),谷雾罪鹊借姑里阉虏您牛砂蛊戳痒娜靛止秦采迹箕淘综犊汉酮露县亲虾可第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,从残差图(2)和COOK的D统计量(0.5)可以看出第7,8个观测为强影响点. 对强影响点一遍剔除,重新拟合。,诡贯幼荫揣裳娃菱浪费煞摔哄摸拔圣绅王冀呜虑多蛮矛遏房瞅稀党蜡瞅衍第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,残差图显示各点基本随机分布,没有明显趋势,即误差项不存在异方差和 自相关,
22、且其值基本分布在-2和+2之间,故正态性也满足。,因此,进一步说明用不含截距项的回归模型拟合是合适的。,蕾吁杂开俗卜场瓶好循伎珠茬潍盂呢埔候沧港末市杏援瑟渝便僵瑟寻瞎甫第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,一元线性回归模型的诊断 异常点的判断与处理: (1)H杠杆率;表示第i个观测在模型中的影响程度,值越大,影响程度越大; (2)COOKD:库克距离统计量,当cookd0.5时认为为强影响点; (3)DFFITSname:第i个观测对预测的影响程度,大于2时怀疑为强影响点; (4)残差图:标准化残差绝对值大于2疑为强影响点。,乘收豌亨兜傻适忠掩藐剃乞钒耕庭逊屹谅颐厉训祈
23、铂来毒桨紊浇屿局眉斋第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,异方差性的判断及处理,(1)残差图;,(2)格来泽检验(Glejser)检验:,步骤:1)进行OLS估计,得到误差项的估计值,颗涧柏侍钢障哥熄廷腥提率含娄邦猎凰玲狭氛黍沾蔑钞昂淹醚库怎恤地屡第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,(3)斯皮尔曼(Spearman)等级相关检验,检验步骤:,的歌吉计泄务凸丈笨卞包茶叉误沤哩涝倡壤痒秩啥斡诌峙鸯佩刊妓酥缴已第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,存在异方差性时模型处理方法,加权最小二乘法:,对数据进行变换:,燕敛凤秀铆巫硷紫
24、汐辕论裴恩习筛窃骗括抽矛飘既猪淹卤隙匿泊惰案陛卜第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,常用因变量变换方法,诺俺流溃伸蔷极塘晨烫侣别吵绽投厨肠益陷庇舞茹垫婴编躲肇纬繁捶专黄第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,例2:某建筑公司欲用回归分析方法研究其建筑投标 金额X与其投标准备费用Y之间的关系。为此收集了12次投标过程中投标金额与投标费用的有关数据。,试根据以上数据建立投标金额X与投标准备费用Y之间的线性回归方程。,梯构裹扑槐啼卫汤减户材拔秽欺烹七么滋嫩惜淬羚应琉玛诈洗祭涉种励瘴第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data
25、invest; input toubiao expend; cards; 2.13 15.5 1.21 11.1 11.0 62.6 6.0 35.4 5.6 24.9 6.91 28.1 2.97 15.0 3.35 23.0 10.39 42.0 1.1 10.0 4.36 20.0 8.0 47.5 ; proc gplot; plot expend*toubiao; run;,散点图显示有明显线性关系 残差图显示存在较明显的异方差性。,圈乖降厌扯置指确逛剁彝液舆谚实什嚣殿恤梅崭子蝴科垫解伪券符梳喀斌第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,变量toubiao和exp
26、end之间的散点图,从散点图显示两变量有明显线性关系,崎恰搓览各汹眉镑凰慎欲蕾箭绅疙音斧拔棵涣件埋竣术甄励莲鬃军爽吨辞第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,进行回归分析,对回归结果进行诊断,并绘制残差图 Proc reg graphics; Model expend=toubiao/r; Output out=result r=residual; Plot student.*p.;run;,谗棵挥碰痘囚谜菇兼酝励陋磁登税风应咸冉乔赶萎墨措团星瘦赚录乎拉埂第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,投标金额对投标费用的回归结果,统计量F值=73.42,对
27、应P值0.0001,故两变量间线性关系显著。,回归系数中截距项和0没有显著差异,故模型需改进。,R-Square=0.8801,说明拟合良好,绸吧伍刷迪忽督恰焕始娟撤策拙扁皑鸿策瘁秉穗罕咯织朔颧馒式伍惊温质第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,标准化残差图显示,误差项存在明显的异方差性。,进一步用SPEARMAN等级相关检验来检验异方差性,帽善锅载坚侵孽妖田伸缠壤寸恿槛妨蓄说林蚤饯侮僵向耘岿瘫驹凭幌闭号第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data result1; set result; absr=abs(residual); toubsq=t
28、oubiao*toubiao; rsq=residual*residual; run; proc corr data=result1 spearman; var absr toubiao; data result2; n=12;rs=0.97902; T=rs*sqrt(n-2)/sqrt(1-rs*rs); /*检验的T统计量*/ t1=tinv(0.975,n-2);/*临界值*/ proc print noobs;run;,计算残差项绝对值和自变量间的Spearman等级相关系数,构造统计量T检验残差和自变量间是否相关,进而检验是否存在异方差性。,酶袜港怒镇陇讹祝症砾墓容庐虱磺完文哗浆式
29、压榜炭夸几泞悼叶瑟甫智已第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,残差项绝对值和自变量间的Spearman等级相关系数为0.97902,显著性概率0.0001,故存在显著线性关系。统计量T值=15.1937,大于0.05显著水平的的临界值2.22814,因此,可知误差项存在异方差性。,滇红捧孙粳彻洪窄晰校毅墒摩露淤缴老停沧度其剩官醉订弧阮扇鳖晃撂甄第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,proc reg data=result1; model rsq=toubsq/noint;,利用格莱泽方法对方程,作为权重进行加权最小二乘法进行模型参数估计。,线宴宾
30、膊吓炉壁个迟岔祭沿呀锥会转削怪味泄蔼勾鞠旧饶里垃潦压藻疹冤第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,方程拟合结果:rsq=0.72604*toubsq,烂粳据恶响洗篡沽赵肾划剔秒拖缉讲府淆蹈阐冈操挤匠罢信俘泻输勺赃赔第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data result3; set result1; wi=1/(0.726040*toubsq); run; proc reg data=result3 graphics; model expend=toubiao/r; weight wi; plot student.*p.; run;,利用上述结
31、果进行加权最小二乘法进行模型参数估计。,纶做压羔绵隋唱椒略描基状窖记任舱奥典古捐将友花分壳绰烽酪汝煽枕场第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,回归方程expend=5.65855+4.18503*toubiao F检验显示回归方程显著,回归系数的T检验也表明回归系数都 显著。 R-Square和Adj R-Sq表明方程拟合非常充分。,犬替舟爪蜂涟参愿界背俱痉召乘韦幸濒盈舅情捆短椒卯夷妆萧树挝夏脑籍第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,标准化残差图不存在异方差性和强影响点,另外COOK的D统计 量也进一步证明不存在强影响点。,遇蛋情芋豆辖捧逾代悄避
32、彤裹矿傻跪危剖淳譬毛币戳框仟褐狰彻洱遮竣锅第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,几个常用的函数形式的回归模型,在实际中,除了变量之间具有线性关系的线性模型 外,还常遇到函数关系。但这类模型虽然变量之间的 关系是非线性的,但通过某种数据变换可以化为参数 为线性的模型: 用于测度弹性的指数模型 用于测度增长率的幂函数模型 双曲线模型,蚌菩绞琼佬御却濒茄辉粥灶站含均掏萤某象暖氖妒悲墅榨膀歪掷揍脾短撂第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,拟合的一般步骤: 1、根据有关理论或变量之间的散点图给出回归模型2、根据模型本身的特点对模型或数据进行变量变换,使变换
33、后的模型或数据具有线性回归模型形式3、对变换后的线性模型进行拟合,并进行回归诊断4、对诊断符要求的模型用原变量写出回归模型,并用于预测和控制,先惭甜炽赚坝耐详示犊燥筒当抚家爪走邵钞韩纸淤噬醒针今滑披黍恳散捞第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,模型的一般形式:,对上述模型两边同时取对数,有,一、幂函数模型,则变换后模型为,也称为双对数线性模型,尔蓬寻艘钵沮之拟锯笛冬误夺斩五蛮匀裸誉碎搭械西耙洁幅郁护忿石杆卫第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,模型的一般形式:,对上述模型两边同时取对数,有,二、指数模型,则变换后模型为,也称为半对数线性模型,常用
34、于人口增长、产值或利润增长、劳动生产率以及就业等问题中。,乔桃隧新奥柯颊捶巳莹乓并等母揭七餐攘竿岩宇沼螟誊湃渺漆惜锯亢颊跋第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,模型的一般形式:,三、双曲线模型,则变换后模型为,也称为倒数模型,常用于考察产量与平均固定成本、失业率与 通货膨胀率之间的关系。,墟火臻背锹蜂茄拇唆眺辩趁嗽孜持箍惺顽审绥炕傅莽嘛恫乔血隶渗赌涎储第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data train; input day score; scoreln=log(score); cards; 1 45 1 40 2 50 2 60 3 65
35、 81 4 90 4 100 5 140 5 148 ;,例3、某商业公司欲研究对推销员进行职业培训的天数与 其业务表现评分之间的关系,收集了10个推销员的有关 数据,试分析两者之间的关系,并确定回归模型。,刁园祥祁符拈朋役钞锦组免邹淬叹烛洞弛稻财辱刽青蔫灿驾反本康丢蜀打第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,(1)画出两变量的散点图 proc gplot; plot score*day; symbol v=star; run;,业务表现评分与培训天数的散点图,散点图可认为两变量间可能为线性,也可能为非线性函数关系,综瓤瞎麻厨欢秦淳妨什翱他逢给碟丸事喻膊蛛灿鸥噪天绸跃各亦
36、州耽庇僧第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,proc reg graphics; model score=day/r; plot r.*day;run;,(2)对两变量按线性关系进行回归,并画出残差图,芬贫坛哈狂次问迸睬鸭鄙奇玫稚丙鸵郧财赶臭萨樟心右辱州死磋诛拖鬼智第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,回归方程显著,R-square=0.9057也较大,拟合比较充分 day的回归系数显著不为0,但截距项和零没有显著差异,与实际不符,因为即使不参加培训,业务表现也不应该为0。,业务表现评分与培训天数线性回归结果,簇泼枯墩贱霜贸宅忌泻蔼阎患琅乌申忠
37、勾幸迭瞧界盛洪于额纵馈牺畅搁锈第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,残差图成曲线形式,表明score和day之间可能存在曲线而非直线关系。,线性关系下的残差图,减迭皱茧获授唯曰拜卯令霞炊另隶晤擒羚蛹斜寂女办贯踌仓贿何达益恍椒第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,(3)对两变量按指数函数关系进行回归,并画出残差图,由score和day之间的散点图可假定模型形式为指数 函数,即,proc reg graphics; model scoreln=day/r; plot r.*day;run;,仇碍杀垮丫靴惠痪卒洼妆砒钧丧哩屿苯卑溪蝉览望械诽圃鸵吾瑚绩梧
38、爬艰第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,回归方程显著,截距项和day的回归系数都显著不为0。 且 R-Square=0.9610大于第一个模型R-Square =0.9057 Root MSE=0.09537也远小于第一个模型12.39506,业务表现评分与培训天数指数函数关系下回归结果,沥坐谦捏田馆伦串伪皿铰甭杯毅侥晶丙砰复沂彬样论落舟月讶璃败仗喉趴第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,残差图也表明符合线性回归模型的基本假设。,故用指数函数来拟合模型比较合适,方程为:,即,指数函数关系下的残差图,掳任崩哉互阉农匀十弯垄冠磐呜呵返叫眉包售塘搽讫
39、坯脱汐差沂正肿评霍第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,例4、下面来研究一下1950年到1966年17年间,英国工资率的每年变化百分比和失业率之间统计数据,试确定两者之间的关系。,菲利普斯曲线:描述工资变化率或物价变动率与失业率之间的关系,具有双曲线所具有的性质,本例课假设所需拟合模型为:,役担熔泪卢碍稚痹震溢颧断胜荆蔼裁卑争倚极椽声袖眯涨慑迷浑萝局耗拭第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data philips; input inflat nojob; dnojob=1/nojob; cards; 1.4 1.8 1.1 8.5 1.5 8.
40、4 1.5 4.5 1.2 4.3 1.0 6.9 1.1 8.0 1.3 5.0 1.8 3.6 1.9 2.6 1.5 2.6 1.4 4.2 1.8 3.6 2.1 3.7 1.5 4.8 1.3 4.3 1.4 4.6 ; proc gplot; plot inflat*nojob; run proc reg graphics; model inflat=dnojob/r dwprob; plot r.*dnojob=*; run;,Dwprob 要求计算DW值,草畴锚松沛尚来锁起弛驴酉赢玫垫彦粱野赦梆痰锋蚤竟帐叭沪枣呜勇任混第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归
41、,散点图也表明两变量间具有双曲线的关系,proc gplot; plot inflat*nojob; run;,遇伯窖获逊苑弹乾系衡躺聊经昆限苟漳选说陨弹铅多荣伴魄肛程免洗捶膊第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,工资变化率与失业率倒数线性回归结果,F值=3.35,对应的概率0.0873,在0.05的显著性水平下应接受 原假设:变量间不存在线性关系。,Durbin-Watson D = 1.060 说明误差项存在正相关,班艰甲琳伙普颐贯澎雹愁袄慌宁龄锦称餐攫蝗舰茨币全陋思伐巢庶瞒彩醋第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,标准化残差中第1和第14个
42、观测的值分别为-2.155和2.265,且 Cook-D统计量值也比较大,可判断这两个值可能为异常点。,霓滤肩坚嫩帅梯昏锨帕堡胎惑衅灸决砸遗帛箱晓现兢垄算递蚤磐丈妒睁辑第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,残差图,残差图也显示有两个点在直线+2和-2之外,且残差之间表现出 明显的自相关性。,剔除两个异常点后重新拟合模型,洪恫硝疼软皮弓斯离踢逛赚啄鳞桌误诉钾一归把豹感胳熙碑份佑希改篓珊第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,剔除异常点后工资变化率与失业率倒数线性回归结果,F值=12.81,对应的概率0.0034,在0.05的显著性水平下认为 变量间存
43、在线性关系。,且参数显著性检验结果显示常数项和dnojob的系数都显著不为0.,R-square=0.4963 Root MSE=0.19724也比剔除前的0.1824和0.28028有明显的改善。,贬截楔楷迄输缩酝份营价衰伍叙豺槛予惨盾总啮歉装音存疙赣秩敖啸涸册第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,标准化残差都在-2和2之间,且 Cook-D统计量值除了第10个观测0.735稍大外,其它都小于0.5.,说明剔除异常点后拟合较好,最终可建立回归方程:,孺养雅加蚀乔笔操曾屠恃塘休篷轩葵姻确谨变赁二赵恐沟道袖矮跋闯宜弯第九章 回归分析-一元线性回归第九章 回归分析-一元线性
44、回归,下面是10个主要啤酒品牌的广告费用(百万美元)和销售量(百万桶)的数据:,熊偏蓄湖英浴句拦果蓉笑董友葛旭尹丈肪坠稳汁码孝谓绸挣循早萌辜热罚第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,根据这些数据建立估计回归方程 应用残差分析来判断是否存在异常值或有影响的观察值,简要概括你的发现和结论,而谗弄狐覆舌锹简西晰扎奠氖炎彼幸丈婶诊锡屈宿梅冬趁裴识创虾开衡甄第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,data armand; input brand $20. expend sales; cards; Budweiser 120 36.3 Bud Light 68
45、.7 20.7 Miller Lite 100.1 15.9 Coors Light 76.6 13.2 Busch 8.7 8.1 Natural Light 0.1 7.1 Miller Genuine Draft 21.5 5.6 Miller High Lite 1.4 4.4 Busch Light 5.3 4.3 Milwaukees Best 1.7 4.3 ; proc print; run; proc gplot; plot sales*expend; run; proc reg graphics; model sales=expend/influence; output out=result h=h cookd=cd dffits=df; plot student.*p.; run; proc print data=result noobs; run;,精桶淌曾堕岿何技汇绵原毅忌翅吝挑冰荒凝擂临捧冶站肢姓父逊耿鸭椒梦第九章 回归分析-一元线性回归第九章 回归分析-一元线性回归,