1、本章整合知识网络专题探究专题一 回归分析的基本思想及其应用回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出两个变量的散点图,然后利用常见的函数模型去拟合样本点,拟合的效果如何借助于相关指数去分析(或利用残差图去分析 )【例 1】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨) 与相应的生产能耗 y(吨标准煤)的几组对照数据 .x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 x ;y b a (3)已知该厂技改前 100 吨甲产品的生产能耗为 90
2、 吨标准煤试根据 (2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435 464.566.5)思路点拨:画出散点图,再进行回归分析解:(1)由题意,作散点图如图(2)由表中数据,计算得, iyi66.5,4i 1x3 24 25 26 286, 4.5, 3.5,4i 1x2i x y 0.7,b 66.5 44.53.586 44.52 66.5 6386 81 3.50.74.50.35,a y b x所求的回归方程为 0.7x 0.35.y (3)当 x100 时,y1000.70.3570.35,9070.3519.65(吨标
3、准煤)即预测生产 100 吨甲产品的生产能耗比技改前降低 19.65 吨标准煤专题二 独立性检验的思想及方法独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量 K2 应该很小,如果由观测数据计算得到的 K2 的观测值 k很大,则在一定程度上说明假设不合理,根据随机变量 K2 的含义,可以通过概率P(K26.635) 0.01 来评价该假设不合理的程度,由实际计算出的 k6.635,说明该假设不合理的程度约为 99%,即“两个分类变量有关系 ”这一结论成立的可信程度约
4、为 99%.【例 2】考查小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:种子灭菌 种子未灭菌 总计黑穗病 26 184 210无黑穗病 50 200 250总计 76 384 460试分析种子灭菌与小麦是否发生黑穗病是否有关思路点拨:求出随机变量 K2 的观测值 k 进行判断解:利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间没有关系,再计算 K2 的观测值,如果 K2 的观测值比较大,则拒绝假设,若 K2 的观测值比较小,则接受假设,再参考临界值,得出判断的可信度由列联表所示数据可求 K2 的观测值为:knad bc2a bc da cb d 4.804.46026200 50184276384210250由此可知,有 95%的把握认为种子灭菌与小麦是否发生黑穗病有关系