压缩包目录
-
全部
- 2016110311.ppt--点击预览
- 2016110312.ppt--点击预览
- 20161103123.doc--点击预览
- 20161103124.doc--点击预览
- 20161103125.doc--点击预览
- 20161103126.doc--点击预览
- 20161103128.doc--点击预览
- 20161103129.doc--点击预览
文件预览区
|
|
资源描述
知识结构收集数据 (随机抽样 )整理、分析数据估计、推断简单随机抽样 分层抽样 系统抽样用样本估计总体 变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析统计的基本思想实际 样本模 拟抽 样分 析问题 1: 正方形的面积 y与正方形的边长 x之间的 函数关系 是y = x2 确定性关系问题 2: 某水田水稻产量 y与施肥量 x之间是否 -------有一个确定性的关系?例如: 在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施 化肥量 x 15 20 25 30 35 40 45水稻产量 y 330 345 365 405 445 450 455复习、变量之间的两种关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做 相关关系 。1、定义:1):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫 回归分析 。2):2、 现实生活中存在着大量的相关关系。如:人的身高与年龄;如:人的身高与年龄;产品的成本与生产数量;产品的成本与生产数量;商品的销售额与广告费;商品的销售额与广告费;家庭的支出与收入。等等家庭的支出与收入。等等探索:水稻产量 y与施肥量 x之间大致有何规律?10 20 30 40 50500450400350300 ·· ·· ·· ·发现:图中各点,大致分布在某条直线附近。探索 2:在这些点附近可画直线不止一条, 哪条直线最能代表 x与 y之间的关系呢?xy施 化肥量水稻产量施 化肥量 x 15 20 25 30 35 40 45水稻产量 y 330 345 365 405 445 450 455散点图10 20 30 40 50500450400350300 ·· ·· · · ·xy施 化肥量水稻产量最小二乘法:称为样本点的中心 。3、对 两个 变量进行的线性分析叫做 线性回归分析 。2、回归直线方程 :2.相应的直线叫做 回归直线 。1、所求直线方程 叫做 回归直 ---线方程 ;其中相关系数• 1.计算公式• 2.相关系数的性质• (1)|r|≤1 .• (2)|r|越接近于 1,相关程度越大; |r|越接近于 0,相关程度越小.• 问题:达到怎样程度, x、 y线性相关呢?它们的相关程度怎样呢?负相关 正相关相关系数r>0正相关;r<0负相关.通常, r∈ [-1,-0.75]--负相关很强 ; r∈ [0.75,1]— 正相关很强 ; r∈ [-0.75,-0.3]--负相关一般 ; r∈ [0.3, 0.75]— 正相关一般 ; r∈ [-0.25, 0.25]--相关性较弱 ; · · ·· ·· ·10 20 30 40 50500450400350300xy施 化肥量水稻产量施 化肥量 x 15 20 25 30 35 40 45水稻产量 y 330 345 365 405 445 450 455解 : 1.画出散点图2.求出3.写出回归方程4.计算相关系数例题 1 从某大学中随机选出 8名女大学生,其身高和体重数据如下表:编号 1 2 3 4 5 6 7 8身高 165 165 157 170 175 165 155 170体重 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.3.通过探究栏目引入 “线性回归模型 ”。此处可以引导学生们体会函数模型与回归模型之间的差别。( 2)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次函数y=bx+a来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:y=bx+a +e其中a和b为模型的 未知参数, e是 y与 之间的误差 ,通常 e称为 随机误差 。( 1)由图形观察可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。线性回归模型y=bx+a +ey=bx+a +e其中a和b为模型的 未知参数 , e是 y与 之间的误差 ,通常 e称为 随机误差 。为了衡量预报的精度 ,需要估计的 σ 2值 ?( 1)根据散点图来粗略判断它们是否线性相关。( 2)是否可以用线性回归模型来拟合数据( 3)通过残差 来判断模型拟合的效 果 这种分析工作称为 残差分析使学生了解残差图的制作及作用。 P98• 坐标纵轴为残差变量,横轴可以有不同的选择;• 若模型选择的正确, 残差图中的点应该分布在以横轴为心的带形区域;• 对于远离横轴的点,要特别注意 。• 错误数据• 模型问题身高与体重残差图 异常点回归分析的基本思想及其初步应用比 《 数学 3》 中 “回归 ”增加的内容数学3 —— 统计• 画散点图• 了解最小二乘法的思想• 求回归直线方程y= bx+ a• 用回归直线方程解决应用问题选修 2-3—— 统计案例• 引入线性回归模型y= bx+ a+ e• 了解模型中随机误差项 e产生的原因• 了解相关指数 R2 和模型拟合的效果之间的关系• 了解残差图的作用• 利用线性回归模型解决一类非线性回归问题• 正确理解分析方法与结果复习回顾1、线性回归模型:y=bx+a+e, (3)其中 a和 b为模型的未知参数, e称为随机误差 。y=bx+a+e,E(e)=0,D(e)= (4) 2、数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为 残差 。3、对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号表示为: 称为 残差平方和 , 它代表了随机误差的效应。4、 两个指标:( 1)类比样本方差估计总体方差的思想,可以用作为 的估计量, 越小,预报精度越高。( 2)我们可以用 相关指数 R2来刻画回归的效果,其 计算公式是:R2 1,, 说明回归方程拟合的越好;说明回归方程拟合的越好; R20,, 说明回归说明回归方程拟合的越差。方程拟合的越差。在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用回归模型来拟合数据。5、残差分析与残差图的定义:然后,我们可以通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据, 这方面的分析工作称为残差分析 。我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为 残差图 。案例 2 一只红铃虫的产卵数 y和温度 x有关。现收集了 7组观测数据列于表中:( 1)试建立产卵数 y与温度 x之间的回归方程;并预测温度为 28oC时产卵数目。( 2)你所建立的模型中温度在多大程度上解释了产卵数的变化? 温度 xoC 21 23 25 27 29 32 35产卵数 y/个 7 11 21 24 66 115 325非线性回归问题假设线性回归方程为 : ŷ=bx+a选 模 型由计算器得:线性回归方程为 y=19.87x-463.73相关指数 R2=r2≈0.864 2=0.7464估计参数解:选取气温为解释变量 x, 产卵数 为预报变量 y。选变量所以,二次函数模型中温度解释了 74.64%的产卵数变化。探索新知画散点图0501001502002503003500 3 6 9 12 15 18 21 24 27 30 33 36 39方案 1分析和预测当 x=28时, y =19.87×28-463.73≈ 93一元线性模型奇怪?9366 ?模型不好?y=bx2+a 变换 y=bt+a非线性关系 线性关系方案 2问题1 选用 y=bx2+a , 还是 y=bx2+cx+a ?问题 3产卵数气温问题 2 如何求 a、 b ?合作探究t=x2二 次函数模型方案 2解答平方变换 : 令 t=x2, 产卵数 y和温度 x之间二次函数模型 y=bx2+a就转化为产卵数 y和温度的平方 t之间线性回归模型 y=bt+a温度 21 23 25 27 29 32 35温度的平方 t 441 529 625 729 841 1024 1225产卵数 y/个 7 11 21 24 66 115 325作散点图,并由计算器得: y和 t之间的线性回归方程为y=0.367t-202.543, 相关指数 R2=0.802将 t=x2代入线性回归方程得:y=0.367x2 -202.543当 x=28时 , y=0.367×28 2-202.54≈85 ,且 R2=0.802,所以,二次函数模型中温度解释了 80.2%的产卵数变化。t问题2变换 y=bx+a非线性关系 线性关系问题1 如何选取指数函数的底 ?产卵数气温指数函数模型 方案 3合作探究对数方案 3解答温度 xoC 21 23 25 27 29 32 35z=lny 1.946 2.398 3.045 3.178 4.190 4.745 5.784产卵数 y/个 7 11 21 24 66 115 325xz当 x=28oC 时, y ≈44 , 指数回归模型中温度解释了 98.5%的产卵数的变化由计算器得: z关于 x的线性回归方程为对数变换:在 中两边取常用对数得令 ,则 就转换为 z=bx+a.相关指数 R2=0.98最好的模型是哪个 ?产卵数气温产卵数气温线性模型 二次函数模型 指数函数模型比一比函数模型 相关指数 R2线 性回 归 模型 0.7464二次函数模型 0.80指数函数模型 0.98最好的模型是哪个?回归分析(二)则回归方程的残差计算公式分别为:由计算可得:x 21 23 25 27 29 32 35y 7 11 21 24 66 115 3250.557 -0.101 1.875 -8.950 9.230 -13.38134.67547.696 19.400 -5.832 -41.000-40.104-58.26577.968因此模型( 1)的拟合效果远远优于模型( 2)。总 结对于给定的样本点两个含有未知参数的模型:其中 a和 b都是未知参数。拟合效果比较的步骤为:( 1)分别建立对应于两个模型的回归方程与 其中 和 分别是参数 a和 b的估计值;( 2)分别计算两个回归方程的残差平方和与( 3)若 则 的效果比的好;反之, 的效果不如 的好。练习: 为了研究某种细菌随时间 x变化,繁殖的个数,收集数据如下:天数 x/天1 2 3 4 5 6繁殖个数y/个 6 12 25 49 95 190( 1)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图;( 2) 描述解释变量与预报变量之间的关系;( 3) 计算残差、相关指数 R2.天数繁殖个数解: ( 1) 散点图如右所示( 2)由散点图看出样本点分布在一条指数函数 y= 的周围,于是令 Z=lny,则x 1 2 3 4 5 6Z 1.79 2.48 3.22 3.89 4.55 5.25由计数器算得 则有6.06 12.09 24.09 48.04 95.77 190.9y 6 12 25 49 95 190( 3)即解释变量天数对预报变量繁殖细菌得个数解释了 99.99%.练习 假设关于某设备的使用年限 x和所支出的维修费用 y( 万元),有如下的统计资料。 使用年限 x 2 3 4 5 6维 修 费 用 y 2.2 3.8 5.5 6.5 7.0若由资料知 ,y对 x呈线性相关关系。试求:( 1)线性回归方程 的回归系数 ;( 2)求残差平方和;( 3)求相关系数 ;( 4)估计使用年限为 10年时,维修费用是多少?解:( 1)由已知数据制成表格。1 2 3 4 5 合 计2 3 4 5 6 202.2 3.8 5.5 6.5 7.0 254.4 11.4 22.0 32.5 42.0 112.34 9 16 25 36 90所以有1§3.2 回归分析(二)课时目标1.进一步理解回归分析的基本思想.2.了解一些非线性回归问题的解法.1.对相关系数 r 进行显著性检验的基本步骤如下:(1)提出统计假设 H0:变量 x, y________________________;(2)如果以 95%的把握作出推断,可以根据 1-0.95=0.05 与 n-2 在附录 2 中查出一个r 的____________(其中 1-0.95=0.05 称为____________);(3)计算________________;(4)作出统计推断:若____________,则否定 H0,表明有________的把握认为 x 与 y 之间具有________________;若____________,则没有理由拒绝原来的假设 H0,即就目前数据而言,没有充分理由认为 x 与 y 之间有________________.2.用相关系数可以对两个变量之间的______________进行较为精确的刻画,运用________的方法研究一些非线性相关问题.一、填空题1.下列说法正确的是________.(填序号)① y=2 x2+1 中的 x、 y 是具有相关关系的两个变量;②正四面体的体积与其棱长具有相关关系;③电脑的销售量与电脑的价格之间是一种确定性的关系;④传染病医院感染甲型 H1N1 流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量.2.两个变量成负相关关系时,散点图的点散布特征是________________________.3.已知 x 与 y 之间的一组数据如下表:x 0 1 2 3y 1 3 5 7则 y 关于 x 的线性回归直线必过________点.4.某种产品的广告费支出 x 与销售额 y 之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是______.x/万元 2 4 5 6 8y/万元 30 40 60 50 705.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 10 次试验,测得的数据如下:零件数 x/个 10 20 30 40 50 60 70 80 90 100加工时间 y/分 62 68 75 81 89 95 102 108 115 122则加工时间 y(分)与零件数 x(个)之间的相关系数 r=________.(精确到 0.000 1)6.对有关数据的分析可知,每一立方米混凝土的水泥用量 x(单位:kg)与 28 天后混凝土的抗压度 y(单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为 =0.30 x+9.99.y^ 根据建设项目的需要,28 天后混凝土的抗压度不得低于 89.7 kg/cm2,每立方米混凝土的水泥用量最少应为________kg.(精确到 0.1 kg)7.根据统计资料,我 国能源生产自 1986 年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:年份 1986 1991 1996 20012产量 8.6 10.4 12.9 16.1根据有关专家预测,到 2010 年我国能源生产总量将达到 21.7 亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种________.(填序号)① = x+ (a≠0);y^ a^ b^ ② y= ax2+ bx+ c(a≠0);③ y= ax(a0 且 a≠1);④ y=log ax(a0 且 a≠1).8.下列说法中正确的是_ _______(填序号).①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分 析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.二、解答题9.假设学生在初一和初二的数学成绩是线性相关的.若 10 名学生的初一( x)和初二( y)数学分数如下:x 74 71 72 68 76 73 67 70 65 74y 76 75 71 70 76 79 65 77 62 72试求初一和初二数学分数间的线性回归方程.10.在某化学实验中,测得如下表所示的 6 对数据,其中 x(单位:min)表示化学反应进行的时间, y(单位:mg)表示未转化物质的质量.x/min 1 2 3 4 5 6y/mg 39.8 32.2 25.4 20.3 16.2 13.3(1)设 y 与 x 之间具有关系 y= cdx,试根据测量数据估计 c 和 d 的值(精确到 0.001);(2)估计化学反应进行到 10 min 时未转化物质的质量(精确到 0.1).3能力提升11.测得某国家 10 对父子身高(单位:英寸)如下:父亲身高(x) 60 62 64 65 66 67 68 70 72 74儿子身高(y)63.665.2 6665.566.967.167.468.370.1 70(1)对变量 y 与 x 进行相关性检验;(2)如果 y 与 x 之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为 73 英寸,估计儿子的身高.12.某种书每册的成本费 y(元)与印刷册数 x(千册)有关,经统计得到数据如下:x 1 2 3 5 10 20 30 50 100 200y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15检验每册书的成本费 y 与印刷册数的 倒数 之间是否具 有线性相关关系?如有,求出 y1x对 x 的线性回归方程.1.利用回归分析可对一些实际问题作出预测.2.非线 性回归方程有时并不给出回归模型,这时我们可以画出已知数据的散点图,把它与我们所学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象进行比较,挑选一种拟和比较好的函数,把问题通过变量转换,转化为线性的回归分析问题,使之得到解决.3.2 回归分析(二)4答案知识梳理1.(1)不具有线性相关关系 (2)临界值 r0.05 检验水平 (3)样本相关系数 r (4)|r|r0.05 95% 线性相关关系 | r|≤ r0.05 线性相关关系2.线性相关程度 转化作业设计1.④解析 感染的 医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.2.从左上角到右下角区域内解析 散点图的主要作用是直观判断两个变量之间的相关关系.一般 地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变 量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.3.(1.5,4)解析 在本题中,样本点的中心为(1.5,4),所以回归直线过(1.5,4)点.4.(6,50)5.0.999 8解析 =55, =91.7, x =38 500,x y ∑10 i= 12iy =87 777, xiyi=55 950,∑10 i= 12i ∑10 i= 1所以 r= ∑10i= 1xiyi- 10·x·y(\o(∑ ,\s\up6(10),\s\do4(i= 1))x\o\al(2,i)- n \x\to(x)2)(\o(∑ ,\s\up6(10),\s\do4(i= 1))y\o\al(2,i)- n \x\to(y)2)≈0.999 8.6.265.7 7.①8.④⑤解析 回归分析就是研究两个事件的相关性;回归模型是需要通过散点图模拟的;回归模型有线性和非线性之分.9. 解 因为 =71, =50 520, =72.3, iyi=51 467,x10∑i= 1x2i y10∑i= 1x所以, = ≈1.218 2.b^ 51 467- 10×71×72.350 520- 10×712=72.3-1.218 2×71=-14.192 2,a^ 线性回归方程是: =1.218 2 x-14.192 2.y^ 10.解 (1)在 y= cdx两边取自然对数,令 ln y= z,ln c= a,ln d= b,则 z= a+ bx.由已知数据,得x 1 2 3 4 5 6y 39.8 32.2 25.4 20.3 16.2 13.3z 3.684 3.472 3.235 3.011 2.785 2.588由公式得 ≈3.905 5, ≈-0.221 9,则线 性回归方程为 =3.905 5-0.221 9x.a^ b^ z^ 而 ln c=3.905 5,ln d=- 0.221 9,故 c≈49.681, d≈0.801,所以 c、 d 的估计值分别为 49.681,0.801.(2)当 x=10 时,由(1)所得公式可得 y≈5.4(mg).11.解 (1) =66.8, =67.01,x yx =44 794, y =44 941.93. =4 476.27,∑10 i= 12i ∑10 i= 12i xy52=4 462.24, 2=4 490.34, xiyi=44 842.4.x y ∑10 i= 1所以 r=∑10 i= 1xiyi- 10x y(∑10 i= 1x2i- 10x2)(∑10 i= 1y2i- 10y2)=44 842.4- 10×4 476.27(44 794- 44 622.4)(44 941.93- 44 903.4)= ≈ ≈0.980 2.79.76 611.748 79.781.31由于 r 非常接近于 1,所以 y 与 x 之间具有线性相关关系.(2)设线性回归方程为 = x+ .y^ b^ a^ 由 = = = ≈0.4645,b^ ∑10 i= 1xiyi- 10x y∑10 i= 1x2i- 10x2 44 842.4- 44 726.744 794- 44 622.4 79.7171.6= - =67.01-0.464 5×66.8≈35.98.a^ y b^ x故所求的线性回归方程为 =0.464 5 x+35.98.y^ (3)当 x=73 时, =0.464 5×73+35.98≈69.9,y^ 所以当父亲身高为 73 英寸时,估计儿子的身高约为 69.9 英寸.12.解 把 置换为 z,则有 z= ,1x 1x从而 z 与 y 的数据为z 1 0.5 0.333 0.2 0.1 0.05 0.033 0.02 0.01 0.005y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15可作出散点图,从图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.= ×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,z110= ×(10.15+5.52+4.08+…+1.15)=3.14,y110z =1 2+0.5 2+0.333 2+…+0.01 2+0.005 2∑10 i= 12i=1.415,y =10.15 2+5.52 2+…+1.21 2+1.15 2∑10 i= 12i=171.803,ziyi=1×10.15+0.5×5.52+…+0.005×1 .15∑10 i= 1=15.221 02,所以 = ≈8.976,b^ ∑10 i= 1ziyi- 10z y∑10 i= 1z2i- 10z2= - =3.14-8.976×0.225 1≈1.120,a^ y b^ z所以所求的 z 与 y 的线性回归方程为=8.976 z+1.120.y^ 6又因为 z= ,所以 = +1.120.1x y^ 8.976x1§3.2 回归分析(一)课时目标1.掌握建立线性回归模型的步骤.2.了解回归分析的基本思想和初步应用.1.对于 n 对观测数据( xi, yi)(i=1,2,3,…, n),直线方程____________称为这 n 对数据的线性回归方程.其中________称为回归截距,________称为回归系数,________称为回归值.2. , 的计算公式a^ b^ Error!3.相关系数 r 的性质(1)|r|≤1;(2)|r|越接近于 1, x, y 的线性相关程度越强;(3)|r|越接近于 0, x, y 的线性相关程度越弱.一、填空题1.下列关系中正确的是________(填序号).①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线 = + x 恒经过定点________.y^ a^ b^ 3.为了解决初中二年级平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测试成绩统计表的一部分,其 χ 2≈________(保留小数点后两位).70 和 70 分以下 70 分以上 合计对照班 32 18 50实验班 12 38 504.从某学校随机选取 8 名女大学生,其身高 x(cm)和体重 y(kg)的回归方程为 y^ =0.849 x-85.7 12,则身高 172 cm 的女大学生,由线性回归方程可以估计其体重为________ kg.5.设两个变量 x 和 y 之间具有线性相关关系,它们的相关系数是 r,且 y 关于 x 的回归直线的斜率是 ,那么 与 r 的符号________(填写“相同”或“相反”).b^ b^ 6.某小卖部为了了解冰糕销售量 y(箱)与气温 x(℃)之间的关系,随机统计了某 4 天卖出的冰糕的箱数与当天气温, 并制作了对照表(如下表所示),且由表中数据算得线性回归方程 = x+ 中的 =2,则预测当气温为 25℃时,冰糕销量为________箱.y^ b^ a^ b^ 气温(℃) 18 13 10 -1冰糕(箱) 64 38 34 247.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量 y(件)与月平均气温 x(℃)之间的关系,随机统计了某 4 个月的月销售量与当月平均气温,数据如下2表:月平均气温 x(℃) 17 13 8 2月销售量 y(件) 24 33 40 55由表中数据算出线性回归方程 = x+ 中的 ≈-2.气象部门预测下个月的平均气y^ b^ a^ b^ 温约为 6℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.8.已知线性回归方程为 =0.50 x-0.81,则 x=25 时, y 的估计值为________.y^ 二、解答题9.某企业上半年产品产量与单位成本资料如下:月份 产量(千件) 单位成本(元)1 2 732 3 723 4 714 3 735 4 696 5 68(1)求出线性回归方程;(2)指出产量每增加 1 000 件时,单位成本平均变动多少?(3)假定产量为 6 000 件时,单位成本为多少元?10.某电脑公司有 6 名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5工作年限 x/年 3 5 6 7 9推销金额 y/万元 2 3 3 4 5(1)求年推销金额 y 关于工作年限 x 的线性回归方程;(2)若第 6 名推销员的工作年限为 11 年,试估计他的年推销金额.能力提升11.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量 x(吨)与相应3的生产能耗 y(吨标准煤)的几组对照数据.x 3 4 5 6y 2.5 3 4 4.5则根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程是________.12.以下是某地搜集到的新房屋的销售价格 y 和房屋的面积 x 的数据:房屋面积(米 2) 115 110 80 135 105销 售价格(万元) 24.8 21.6 18.4 29.2 22(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为 150 m2时的销售价格.1.(1)求线性回归方程的步骤为①作出散点图;②利用公式计算回归系数 及 的值;③写出线性回归方程.b^ a^ (2)一般地,我们可以利用线性回归方程进行预测,这里所得到的值是预 测值,但不是精确值.2.计算相关系数 r 可以判断变量 x, y 的线性相关程度.3.2 回归分析(一)答案知识梳理1. = + x y^ a^ b^ a^ b^ y^ 作业设计1.①②④2.( , )x y3.16.234.60.316解析 当 x=172 时, =0.849×172-85.172=60.316.y^ 5.相同解析 可以分析 、 r 的计算公式.b^ 6.704解析 由线性回归方程必过点( , ),且 =2,得 =20,所以 当 x=25 时,x y b^ a^ =70.y^ 7.46解析 ∵样本点的中心为(10,38),∴38=-2×10+ ,a^ ∴ =58,∴当 x=6 时, =-2×6+58=46.a^ y^ 8.11.69解析 y 的估计值就是当 x=25 时的函数值,即 0.50×25-0.81=11.69.9.解 (1) n=6, xi=21, yi=426, =3.5,∑6 i= 1 ∑ 6 i= 1 x=71, x =79, xiyi=1 481,y ∑6 i= 12i ∑ 6 i= 1= = ≈-1.82.b^ ∑ 6 i= 1xiyi- 6x y∑ 6 i= 1x2i- 6x2 1 481- 6×3.5×7179- 6×3.52= - =71+1.82×3.5=77.37.a^ y b^ x线性回归方程为 = + x=77.37-1.82 x.y^ a^ b^ (2)因为单位成本平均变动 =-1.820,且产量 x 的计量单位是千件,所以根据回归b^ 系数 的意义有:b^ 产量每增加一个单位即 1 000 件时,单位成本平均减少 1.82 元.(3)当产量为 6 000 件时,即 x=6,代入线性回归方程:=77.37-1.82×6=66.45(元)y^ 当产量为 6 000 件时,单位成本约为 66.45 元.10.解 (1)设所求的线性回归方程为 = x+ ,y^ b^ a^ 则 = = =0.5, = - =0.4.b^ ∑ 5 i= 1 (xi- \x\to(x))(yi- \x\to(y))∑ 5 i= 1 (xi- \x\to(x))2 1020 a^ y b^ x所以年推销金额 y 关于工作年限 x 的线性回归方程为 =0.5 x+0.4.y^ (2)当 x=11 时, =0.5×11+0.4=5.9(万元).y^ 所以可以估计第 6 名推销员的年推销金额为 5.9 万元.11. =0.7 x+0.35y^ 解析 对照数据,计算得: x =86,∑4 i= 12i= =4.5, = =3.5.x3+ 4+ 5+ 64 y 2.5+ 3+ 4+ 4.54已知 xiyi=66.5,∑4 i= 1所以 = = =0.7.b^ ∑ 4 i= 1xiyi- 4x y∑ 4 i= 1x2i- 4(\x\to(x))2 66.5- 4×4.5×3.586- 4×4.52= - =3.5-0.7×4.5=0.35.a^ y b^ x5因此,所求的线性回归方程为 =0.7 x+0.35.y^ 12.解 (1)散点图如图所示:(2) = xi=109, (xi- )2=1 570,x15∑ 5 i= 1 ∑ 5 i= 1 x=23.2, (xi- )(yi- )=308.y ∑5 i= 1 x y设所求线性回归方程为 = x+ ,则 = ≈0.196 2,y^ b^ a^ b^ 3081 570= - =23.2-109× ≈1.816 6.a^ y b^ x 3081 570故所求线性回归方程为 =0.196 2 x+1.816 6.y^ (3)根据(2),当 x=150 m 2时,销售价格的估计值为=0.196 2×150+1.816 6=31.246 6≈31.2(万元).y^ 13.2 回归分析(2)教学目标(1)通过实例了解相关系数的概念和性质,感受相关性检验的作用;(2)能对相关系数进行显著性检验,并解决简单的回归分析问题;(3)进一步了解回归的基本思想、方法及初步应用.教学重点,难点相关系数的性质及其显著性检验的基本思想、操作步骤.教学过程一.问题情境1.情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?2.问题:思考、讨论:求得的线性回归方程是否有实际意义.二.学生活动对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量 x与 y的线性相关性进行检验(简称相关性检验) .三.建构数学1.相关系数的计算公式:对于 , 随机取到的 n对数据 (,)ixy1,23,)n ,样本相关系数 r的计算公式为 1 1222221 1()()(()()n nii iin nii i iiixyxyr x . 2.相关 系数 的性质:02468100 5 10 15系 列 102468100 5 10 15系 列 12(1) |r;(2) |越接近与 1, x, y的线性相关程度越强;(3) |r越接近与 0, , 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.3.对相关系数 进行显著性检验的步骤:相关系数 r的绝对值与 1 接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数 进行显著性检验 .对此,在统计上有明确的检验方法,基本步骤是 :(1)提出统计假设 0H:变量 x, y不具有线性相关关系;(2)如果以 95%的把握作出推断,那么可以根据 10.95.与 2n( 是样本容量)在附录 (教材 P111)中查出一个 r的临界值 .r(其中 0.5称为检验水平) ;(3)计算样本相关系数 r;(4)作出统计推断:若 0.5|,则否定 0H,表明有 95%的把握认为 变量 y与 x之间具有 线性相关关系;若 .|r,则没有理由拒绝 0,即就目前数据而言,没有充分理由认为变量 y与 x之间 具有线性相关关系.说明:1.对相关系数 进行显著性检验,一般取检验水平 .5,即可靠程度为95%.2.这里的 r指的是线性相关系数, r的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.3.这里的 是对抽样数据而言的.有时即使 |1,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.4.对于上节课的例 1,可按下面的过程进行检验:(1)作统计假设 0H: x与 y不具有线性相关关系;(2)由检验水平 .5与 29n在附录 中查得 0.562r;(3)根据公式 得相关系数 0.8r;(4)因为 0.98.6r,即 .5,所以有 9﹪的把握认为 x与 y之间具有线性相关关系, 线性回归方程为 2714.3yx是有意义的.3四.数学运用1.例题:例 1.下表是随机抽取的 8对母女的身高数据,试根据这些数据探讨 y与 x之间的关系.母亲身高 /xcm154715891601623女儿身高 y6245解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近, 因为 1547163859.2x, 156186y ,822221()543159ix,822221()1686iy,815413159.80ix, 所以 96.01.r,由检验水平 5及 2n,在附录 2中查得 70.5.0r,因为 .9630.7,所以可以认为 x与 y之间具有较强的线性相关关系.线性回归模型 yabx中,ab的估计值 ,分别为4812.345,iixyb 53.19aybx,故 y对 x的线性回归方程为 x4.例 2.要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一 年级学生中随机抽取 10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩如下表:学生编号 2345678910入学成绩 x67812576高一期末成绩 y593(1)计算入学成绩 与高一期末成绩 y的相关系数;(2)如果 与 之间具有线性相关关系,求线性回归方程;(3)若某学生入学数学成绩为 0分,试估计他高一期末数学考试成绩.解:(1)因为 1637670x , 165785760 ,10()894xyiiiLy,210()4xiiLx,102()056yii.因此求得相关系数为1010221()0.84()ii xyiiixyLr.结果说明这两组数据的相关程度是比较高的;小结解决这类问题的解题步骤:(1)作出散点图,直观判断散点是否在一条直线附近;(2)求相关系数 r;(3)由检验水平和 2n的值在附录中查出临界值,判断 y与 x是否具有较强的线性相关关系; (4)计算 a, b,写出线性回归方程.2.练习: 10P练习 第 题.五.回顾小结:1.相关系数的计算公式与回归 系数 b计算公式的比较;52.相关系数的性质;3.探讨相关关系的基本步骤.六.课外作业: 106P习题 3.2 第 1题.
展开阅读全文
相关搜索