收藏 分享(赏)

统计回归模型.ppt

上传人:tkhy51908 文档编号:8023591 上传时间:2019-06-04 格式:PPT 页数:52 大小:1.46MB
下载 相关 举报
统计回归模型.ppt_第1页
第1页 / 共52页
统计回归模型.ppt_第2页
第2页 / 共52页
统计回归模型.ppt_第3页
第3页 / 共52页
统计回归模型.ppt_第4页
第4页 / 共52页
统计回归模型.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

1、数学建模之,统计回归模型,人群中各个体收入有区别吗?,不同性别的收入是否不同? 是否少数民族的收入是否不同? 不同工种的收入是否不同? 不同性别和工种的收入是否不同? 是否少数民族不同工种的收入是否不同?,方差分析方法,全球吃死的人比饿死的人多?,据世界卫生组织统计,全球肥胖症患者达3亿人,其中儿童占2200万人,11亿人体重过重。肥胖症和体重超常早已不是发达国家的“专利”,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人数已高于因饥饿死亡的人数。(引自光明日报刘军/文) 问题: 肥胖症和体重超常与死亡人数真有显著的数量关系吗?,相关分析与回归分析方法,统计方法利用从一定总体中随机抽取一部分即

2、样本的性质,来推断和预测总体的性质的方法。,内容纲要,5,2019年6月4日,数理统计中的一些基本概念,方差分析法,回归分析法,案例分析:教学评估,一.数理统计中的一些基本概念,总体,样本,抽样,简单随机样本,统计量,平均值 中位数 分位数,方差 标准差 极差,k 阶矩,偏度 峰度,1. 样本与统计量,参数估计,矩估计法、最大似然估计法,点估计:,区间估计:,正态总体下均值与方差的区间估计,假设检验,正态总体下参数的检验,分布拟合检验,一.数理统计中的一些基本概念,2. 参数估计与假设检验,方差分析(Analysis of Variance,简称ANOVA),又称 “变异数分析”或“F检验”,

3、是R.A.Fisher发明的,用于 两个及两个以上样本均数差别的显著性检验。 由于各 种因素的影响,研究所得的数据呈现波动状。造成波 动的原因可分成两类,一是不可控的随机因素,另一 是研究中施加的对结果形成影响的可控因素。,二.方差分析法,1. 方差分析法概念,在试验中,有可能影响试验指标并且有可能加以控制的试验条件称为因素。通过试验的设计,在试验中只安排一个因素有所变化、取不同的状态或水平,而其余的因素都在设计的状态或水平下保持不变的试验称为单因素试验。即指标值X只受一个因素A的影响,检验A在取不同的状态或水平时,对指标值X的影响。,二.方差分析法,1.单因素方差分析,因素A的水平 观测值,

4、试验次数 (n1+n2+nr= n),1. 单因素方差分析,二.方差分析法,在单因素试验中,假设有r 个编号为i =1至r的正态总体,它们分别服从N( i,2)分布,当 i及2未知时, 要根据取自这r个正态总体的r个相互独立且方差相同的样本检验原假设 H0:各i(i=1至r)相等,所作的检验以及对未知参数的估计称为方差分析。,1. 单因素方差分析,二.方差分析法,(组内平均值),(总平均值),总离均差平方和的分解,1. 单因素方差分析,二.方差分析法,考虑样本全体观测值xij对总平均值的偏差平方和,记,结论1)SST=SSE+SSA,结论2),结论3)当H0为真时,,结论4)当H0为真时,SS

5、E、SSA相互独立,1. 单因素方差分析,二.方差分析法,结论5)当H0为真时,,切胚乳试验用小麦种子进行切胚乳试验,设计分3种处理,同期播种在条件较为一致的花盆内,出苗后每盆选留2株,成熟后测量每株粒重(单位:g),得到数据如下:,处理未切去胚乳切去一半胚乳切去全部胚乳,每株粒重21,29,24,22,25,30,27,2620,25,25,23,29,31,24,26,20,2124,22,28,25,21,26,1. 单因素方差分析,二.方差分析法,分析结果,1. 单因素方差分析,二.方差分析法,(F0.05(2,21)=3.47),变量间的相互关系,确定性的函数关系 Y=f (X) 不

6、确定性的统计关系相关关系 Y= f(X)+ (为随机变量) 没有关系 变量间关系的图形描述:坐标图(散点图),三.回归分析,1.相关与回归分析的概念, 从涉及的变量数量看简单相关 多重相关(复相关),相关关系的类型, 从变量相关关系的表现形式看线性相关散布图接近一条直线(左图)非线性相关散布图接近一条曲线(右图),三.回归分析,1.相关与回归分析的概念, 从变量相关的程度看完全相关 (B)不完全相关 (A) 不相关 (C), 从变量相关关系变化的方向看正相关变量同方向变化同增同减 (A)负相关变量反方向变化 一增一减 (B),A,B,C,三.回归分析,1.相关与回归分析的概念,回归的古典意义:

7、高尔顿遗传学的回归概念,三.回归分析,1.相关与回归分析的概念,父母身高与子女身高的关系:无论高个子或低个子的子女都有向人的平均身高回归的 趋势,一个因变量对若干解释变量依存关系的研究回归的目的(实质):由固定的自变量去估计因变量的平均值,回归的现代意义,三.回归分析,1.相关与回归分析的概念,共同的研究对象:都是对变量间相关关系的分析,相关分析中相关系数的确定建立在回归分析的基础上,只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义,相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析,三.回归分析,1.相关与回归分析的概念,相关分析

8、与回归分析的联系,一般形式,三.回归分析,2.一元线性回归模型,根据样本及其观测值可以得到、及2的估计量及估计值,得到回归方程的估计式或经验回归方程,进行n次独立试验,测得数据如下:,三.回归分析,2.一元线性回归模型,确定未知参数 的方法:最小二乘法。,的值最小。,a称截距,b称回归系数,而,三.回归分析,2.一元线性回归模型,根据最小二乘法的要求,由,三.回归分析,2.一元线性回归模型,一元回归方程的显著性检验,(即检验=0是否为真),残差平方和,回归平方和,且SSR与SSE相互独立,三.回归分析,2.一元线性回归模型,三.回归分析,2.一元线性回归模型,利用回归方程进行预测,Y的个别值置

9、信度为1的预测区间:,三.回归分析,2.一元线性回归模型,多元线性回归模型的一般形式,三.回归分析,3.多元线性回归模型,2007.12.25,多元回归分析数据格式,三.回归分析,3.多元线性回归模型,2007.12.25,多元线性回归分析的一般步骤,三.回归分析,3.多元线性回归模型,拟合优度公式,参数估计公式,多元回归分析的几个公式,多元回归方程的假设检验,三.回归分析,3.多元线性回归模型,相关系数:描述两个变量间的线性相关程度。,任何事物的存在都不是孤立的,而是相互联系、相互 制约的。说明客观事物相互间关系的密切程度并用适 当的统计指标表示出来,这个过程就是相关分析。,事物之间有相关,

10、不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。,三.回归分析,4.相关分析,相关性检验:,样本相关系数,检验的依据: 如果X和Y都服从正态分布,在总体相关系数 的假设下,与样本相关系数rXY 有关的t 统计量服从 自由度为n-2的t分布:,三.回归分析,4.相关分析,给定显著性水平 ,查自由度为n-2的临界值 ; 若 ,表明相关系数 r在统计上是显著的, 应否定 而接受 的假设; 反之,若 ,应接受 的假设。,三.回归分析,4.相关分析,三.回归分析,4.相关分析,手掌“生命线”的长度能反映人的寿命吗?,有人认为人的寿命与手掌上的“生命线”的长度相关,“生命

11、线”长的人寿命就长些,反之,寿命就短些。为检验此说法, 现抽取50位自然死亡的人的生存年龄x(年)及“生命线”长 度y(cm) 的数据.,即x与y之间的线性相关关系是不显著的.,为了考评教师的教学质量,教学研究部门设计了一个 教学评估表,对学生进行一次问卷调查,要求学生对 12位教师的15门课程(其中3名教师有两门课程)按以 下7项内容打分,分值为15分(5分最好,1分最差),:课程内容组织的合理性;,:主要问题展开的逻辑性;,:回答学生问题的有效性;,:课下交流的有助性;,:教科书的帮助性;,:考试评分的公正性;,:对教师的总体评价。,三.案例分析:教学评估,1.问题,收回问卷调查表后,得到

12、了学生对12位教师、15门课程各项评分的平均值,见表。,三.案例分析:教学评估,1.问题,三.案例分析:教学评估,1.问题,定每项都对教师总体评价Y 有显著影响,并且各项内 之间也可能存在很强的相关性,他们希望得到一个总 体评价与各项具体内容之间的模型,模型应尽量简单 和有效,并且由此能给教师一些合理的建议,以提高 评价总体评价.,教学研究部门认为,所列各项具体内容 不一,三.案例分析:教学评估,1.问题,逐步回归,这个问题给出了6个自变量,但我们希望从中选出对因变量,影响显著的那些来建立回归模型。变量选择的标准应该是将所 有对因变量影响显著的自变量都选入模型,而影响不显著的自 变量都不选入模

13、型,从便于应用的角度,应使模型中的自变量 个数尽量少。逐步回归就是一种从众多自变量中有效的选择重 要变量的方法。,三.案例分析:教学评估,2.问题分析,逐步回归的基本思路是:先确定一个包含若干自变量的初始 集合,然后每次从集合外的变量中引入一个对因变量影响最 大的,再对集合中的变量进行检验,从变得不显著的变量中 移出一个影响最小的,依次进行,直到不能引入和移出为止。引入和移出都以给定的显著性水平为标准。 利用MATLAB系统工具箱中的逐步回归命令stepwise可以实现 逐步回归。Stepwise提供人机交互式画面,可以在画面上自由 引入和移出变量,进行统计分析。具体用法参见MATLAB丛书.

14、,三.案例分析:教学评估,2.问题分析,利用MATLAB命令得到各个变量的回归系数,置信区间 及剩余标准差(RMSE),决定系数(R-square), 值、 值,见表.,三.案例分析:教学评估,3.回归模型的建立与求解,可以看到,除 外其他自变量的回归系数置信区间都 包含零点, 在临界状态,将 一一移去(与 次序无关),当模型中仅含 时结果见下表。,三.案例分析:教学评估,3.回归模型的建立与求解,回归终得到的模型为,其中,,分别是,的平均值。利用逐步,三.案例分析:教学评估,3.回归模型的建立与求解,在最终模型里回归变量只有,是一个简单易用的模型,据,此可把课程内容组织的合理性( ),和回答

15、学生问题的有效性,( )列入考评的重点。上式表明,,的分值每增加一分,对,教师的总体评价就增加约0.5分;,的分值每增加一分,对教师,的总体评价就增加约0.77分。应建议教师注重这两方面的工作。 为了分析其它变量没有进入最终模型的原因,可以计算,的相关系数,利用MATLAB系统工具箱中的corrcoef命令直接得到这7个变量的相关系数矩阵:,三.案例分析:教学评估,4. 模型解释,三.案例分析:教学评估,4.模型解释,如果初步看来影响因变量的因素较多,并得到了大 量的数据。为了建立一个有效的、便于应用的模型, 可以利用逐步回归只选择那些影响显著的变量“入 围”。如果怀疑原有变量的平方项、交叉项等也会 对变量有显著影响也可以将这些项作为新的自变量 加入到候选行列,用逐步回归来处理。,三.案例分析:教学评估,5.模型评注,回归分析模型的相关应用,牙膏的销售量 软件开发人员的薪金 酶促反应 投资额与国民生产总值和物价指数 参考:姜启源数学模型,06B HIV病毒问题 08B 大学学费问题,相关赛题,练习题,下表给出了某工厂产品的生产批量与单位成本(元)的数 据,从散点图,可以明显的发现,生产批量在500以内时,单 位成本对生产批量服从一种线性关系,生产批量超过500时服 从另一种线性关系,此时单位成本明显下降。希望你构造一个 合适的回归模型全面地描述生产批量与单位成本的关系。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报