1、第一章,1.1回归分析的基本思想及其初步应用,2 突破常考题型,题型一,题型二,题型三,3 跨越高分障碍,4 应用落实体验,随堂即时演练,课时达标检测,知识点一,知识点二,1 理解教材新知,线性回归方程,导入新知 1回归分析 (1)函数关系是一种 关系,而相关关系是一种 关系,即自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做 (2)回归分析是对具有 关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是 , ,并用 进行预报,确定性,非确定性,相关关系,相关,画出两个变量的散点图,求回归直线方程,回归直线方程,2线性回归模型 (1)线性回归模型y ,其中 和 是
2、模型的未知参数, 称为随机误差自变量x称为 ,因变量y称为 ,bxae,a,b,e,解释变量,预报变量,中心,线性回归分析,(3)残差分析: 残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:计算残差画残差图在残差图中分析残差特性 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度 ,回归方程的预报精度 ,越高,越高,化解疑难残差分析的注意点 在残差图中,可疑数据的特征表现为: (1)个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区域过于明显,需要确认在采集这些样本点的
3、过程中是否有人为的错误,如果采集数据有错误,那么需要纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,那么需要寻找其他原因 (2)残差图有异常,即残差呈现不随机的规律性,此时需要考虑所采用的线性回归模型是否合适,线性回归分析,例1炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:,(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗? (2)求回归方程; (3)预测当钢水含碳量为160时,应冶炼多少分钟? 解(1
4、)以x轴表示含碳量,y轴表示冶炼时间,作散点图如图所示:,从图中可以看出,各点散布在一条直线附近,即它们线性相关 (2)列出下表,并用科学计算器进行计算:,活学活用某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:,(1)试根据数据预报广告费支出1 000万元的销售额;(2)若广告费支出1 000万元的实际销售额为8 500万元,求误差,残差分析,例2某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:,(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差; (2)你认为这个模型能较好地刻画零件数和加工时
5、间的关系吗?,解(1)根据表中数据画出散点图,如图所示,残差数据如下表:,(2)以零件数为横坐标,残差为纵坐标画出残差图如图所示,由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好但需注意,由残差图可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误,活学活用 已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:,求y关于x的回归直线方程,并说明回归模型拟合效果的好坏,非线性回归分析,例3在一次抽样调查中测得样本的5个样本点,数值如下表:,试建立y与x之间的回归方程,解作出变量y与x之间的散点图如图所示,作出y与t的散点
6、图如图所示,类题通法非线性回归分析的步骤 非线性回归问题有时并不给出经验公式这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决其一般步骤为:,试求:电压U对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题),典例下列现象的线性相关程度最高的是() A某商店的职工人数与商品销售额之间的相关系数为0.87 B流通费用率与商业利润率之间的相关系数为0.94 C商品销售额与商业利润率之间的相关系数为0.51 D商品销售额与流通费用
7、率之间的相关系数为0.81,解析|r|越接近于1,相关程度越高 答案B,易错防范,1本题易错误地认为r越接近于1,相关程度越高,从而误选A. 2变量之间线性相关系数r具有如下性质: (1)r21,故变量之间线性相关系数r的取值范围为1,1 (2)|r|越大,变量之间的线性相关程度越高;|r|越接近0,变量之间的线性相关程度越低 (3)当r0时,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关;当r0时,一个变量增加,另一个变量有减少的趋势,称两个变量负相关;当r0时,称两个变量线性不相关,答案:C,解析:中y与x负相关而斜率为正,不正确;中y与x正相关而斜率为负,不正确,答案:D,解析:样本的相关系数应满足1r1.,答案:D,答案:85%15%,答案:450 kg,5某工厂为了对新研究的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:,课时达标检测,