1、1.1.1 回归分析的基本思想及其初步应用(一)学习目标 1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法-相关系数 .学习过程 一、课前准备(预习教材 P2 P4,找出疑惑之处)问题 1:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?复习 1:函数关系是一种 关系,而相关关系是一种 关系. 复习 2:回归分析是对具有 关系的两个变量进行统计分析的一种常用方法,其步骤:.二、新课导学 学习探究实例 从某大学中随机选取 8 名女大学生,其身高/cm
2、 和体重 /kg 数据如下表所示:编号 1 2 3 4 5 6 7 8身高 165 165 157 170 175 165 155 170体重 48 57 50 54 64 61 43 59问题:画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm 的女大学生的体重.解:由于问题中要求根据身高预报体重,因此 选 自变量 x, 为因变量.(1)做散点图:从散点图可以看出 和 有比较好的 相关关系.(2) = =xy81iy2ix所以812iiyxbayx于是得到回归直线的方程为(3)身高为 172cm 的女大学生,由回归方程可以预报其体重为y问题:身高为 17
3、2cm 的女大学生,体重一定是上述预报值吗?思考:线性回归模型与一次函数有何不同?新知:用相关系数 r 可衡量两个变量之间 关系.计算公式为r =r0, 相关, r0, 相关, rk) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0.455 0.708 1323 2.072 2.706 3.84 5.024 6.635 7.879 1083小结:用独立性检验的思想解决问题:第一步:第二步:第三步:例 2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取 300 名学生,得到如下列联表:喜欢数学课程不
4、喜欢数学总 计男 37 85 122女 35 143 178总计 72 228 300由表中数据计算得到 的观察值2K. 在多大程度上可以认为高中生4513k的性别与是否数学课程之间有关系?为什么? 动手试试练 1. 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?三、总结提升 学习小结1. 独立性检验的原理:2. 独立性检验的步骤: 知识拓展利用独立性检验来考察两个分类变量是否有关,能精确的给出这种判断的可靠程度.学习评价 自我评价 你完成本节导学案的情况为( ).A. 很好 B. 较好 C. 一般 D.
5、较差 当堂检测(时量:5 分钟 满分:10 分)计分:1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )A. 若 k=6.635,则有 99%的把握认为吸烟与患肺病有关,那么 100 名吸烟者中,有 99 个患肺病.B. 从独立性检验可知,有 99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有 99%的可能性患肺病 .C. 若从统计量中求出有 95%的把握认为吸烟与患肺病有关,是指有 5%的可能性使推断出现错误.D. 以上三种说法都不对.不健康 健 康 总计不优秀 41 626 667优 秀 37 296 333总 计 78 922 10002. 下面是一个 列联表
6、2则表中 a,b 的之分别是( )A. 94,96 B. 52,50 C. 52,54 D. 54,523.某班主任对全班 50 名学生进行了作业量多少的调查,数据如下表:则认为喜欢玩游戏与认为作业量多少有关系的把握大约为( )A. 99% B. 95% C. 90% D.无充分依据4. 在独立性检验中,当统计量 满足 2K时,我们有 99%的把握认为这两个分类变量有关系.5. 在 列联表中,统计量 = .22课后作业 为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表能以 97.5%的把握认为药物有效吗 ?为什么?统计案例检测题测试时间:90 分钟 测试总分:100 分一、选择题(本
7、大题共 12 小题,每题 4分)1、散点图在回归分析中的作用是 ( )A查找个体数目 B比较个体数据关系C探究个体分类D粗略判断变量是否呈线性关系2、对于相关系数下列描述正确的是 ( )Ar0 表明两个变量相关Br0 表明两个变量无关C 越接近 1,表明两个变量线性相关r性越强Dr 越小,表明两个变量线性相关性越弱3、预报变量的值与下列哪些因素有关 ( )A受解释变量影响与随机误差无关B受随机误差影响与解释变量无关C与总偏差平方和有关与残差无关D与解释变量和随机误差的总效应有关4、下列说法正确的是 ( )A任何两个变量都具有相关系B球的体积与球的半径具有相关关系C农作物的产量与施肥量是一种确定
8、性关系D某商品的产量与销售价格之间是非确定性关系5、在画两个变量的散点图时,下面哪个叙述是正确的 不健康 健 康 总计不优秀 a 21 73优 秀 2 25 27总 计 b 46 100认为作业多认为作业不多总计玩游戏 18 9 27不玩游戏8 15 23总 计 26 24 50患 病 未患病 总 计用 药 41 626 667不用药 37 296 333总 计 78 922 1000( )A. 预报变量在x 轴上,解释变量在 y 轴上 B. 解释变量在x 轴上,预报变量在 y 轴上C. 可以选择两个变量中任意一个变量在 x 轴上 D. 可以选择两个变量中任意一个变量在 y 轴上6、回归直线
9、必过 ybxa( )A B C (0,)(,0)(,)yD xy7、三维柱形图中,主、副对角线上两个柱形高度的 相差越大,要推断的论述成立的可能性就越大 ( )A和 B差 C积 D商8、两个变量 y与x 的回归模型中,求得回归方程为 ,当预报变量 0.23e10x( )A. 解释变量 B. 解释变量 大30yy于 30eC. 解释变量 小于 D. 解释变量 在30e左右309、在回归分析中,求得相关指数,则( )2.8RA. 解释变量解对总效应的贡献是 1%B. 解释变量解对总效应的贡献是 89C. 随机误差的贡献是C. 随机误差的贡献是 0.10、在吸烟与患肺病这两个分类变量的计算中,下列说
10、法正确的是 ( )A若 k=6.635,则有 99%的把握认为吸烟与患肺病有关,那么 100 名吸烟者中,有99 个患肺病.B从独立性检验可知,有 99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有 99%的可能性患肺病.C若从统计量中求出有 95%的把握认为吸烟与患肺病有关,是指有 5%的可能性使得推断出现错误.D以上三种说法都不对.11、3. 通过 来判断模拟型拟合12,ne的效果,判断原始数据中是否存在可疑数据,这种分析称为 ()A回归分析 B独立性检验分析C残差分析 D. 散点图分析12、在独立性检验时计算的 的观测值2K=3.99,那么我们有 的把握认为k这两个分类变量有关
11、系 ( ) A90% B 95%C99% D以上都不对二、填空题(本大题共 4 小题,每题 4 分)13、已知回归直线方程 ,则0.5.81yx时,y 的估计值为 .25x14、如下表所示:计算 = .2K15、下列关系中:(1)玉米产量与施肥量的关系;(2)等边三角形的边长和周长;(3)电脑的销售量和利润的关系;(4)日光灯的产量和单位生产成本的关系.不是函数关系的是 .16、在一项打鼾与患心脏病的调查中,共调查 1768 人,经计算的 =27.63,根据2K这一数据分析,我们有理由认为打鼾与患心脏病是 的.(填“有关 ”“无关”)三、解答题(本大题共 2 小题,每题 18分)18、为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表能以 97.5%的把握认为药物有效吗 ?为什么?不健康 健 康 总计不优秀 41 626 667优 秀 37 296 333总 计 78 922 1000患 病 未患病 总 计用 药 41 626 667不用药 37 296 333总 计 78 922 1000