1、【学习目标】1会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系;2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;3了解独立性检验(只要求 22 列联表)的基本思想、方法及其简单应用;4了解回归的基本思想、方法及简单应用【知识要点】1相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称之为 ;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为 2线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫 3回归方程(1)最
2、小二乘法:使得样本数据的点到回归直线的_ 最小的方法叫最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),(x n,y n),其回归方程为x,则 2ix.其中是回归方程的 _ ,是在 y 轴上的截距4样本相关系数ry)2,用来衡量两个变量间的线性相关关系(1)当 r0 时,表示两个变量 ;(2)当 r0.75 时,认为两个变量有很强的线性相关关系5线性回归模型(1)ybxae 中,a,b 称为模型的未知参数,e 称为随机误差(2)相关指数用相关指数 R2 来刻画回归的效果,其计算公式是:R 21y)2,R 2 的值越大,说明残差平方和越小,也
3、就是说模型的拟合效果 _ 在线性回归模型中,R 2 表示解释变量对预报变化的贡献率,R 2 越接近于 1,表示回归效果越好6独立性检验(1)用变量的不同“值”表示个体所需的不同类别,这种变量称为分类变量(2)列出的两个分类变量的频数表,称为列联表(3)一般地,假设有两个分类变量 X 和 Y,它们的值域分别为 x1,x 2和y 1,y 2,其样本频数列联表(称 22 列联表)为:y1 y2 总计x1 a b abx2 c d c d总计 ac bd ab cdK2Error!(其中 nab cd 为样本容量),可利用独立性检验判断表来判断“X 与 Y 的关系”这种利用随机变量 K2 来确定在多大
4、程度上可以认为“ 两个分类变量有关系”的方法称为两个分类变量的独立性检验【高考模拟】一、单选题1某种产品的广告费支出 与销售额 (单位:万元)之间的关系如下表:2 4 5 6 830 40 60 50 70若已知 与 的线性回归方程为 ,那么当广告费支出为 5 万元时,随机误差的效应(残差)为( )万元(残差=真实值-预测值)A 40 B 30 C 20 D 10【答案】D【解析】分析:把所给的广告费支出 5 万元时,代入线性回归方程,做出相应的销售额,这是一个预测值,再求出与真实值之间有一个误差即得.点睛:本题考查回归分析的初步应用,考查求线性回归方程,考查预测 y 的值,是一个综合题目,是
5、一个典型的题目.2已知变量 与 负相关,且由观测数据算得样本平均数 ,则由该观测的数据算得的线性回归方程可能是A B C D 【答案】C【解析】【分析】根据 与 负相关可知 b 为负数,将样本平均数点带入选项检验,可求得回归直线方程。【详解】因为变量 与 负相关,所以 ,排除 A、B 选项;因为 ,代入检验即可得到 C 是正确选项所以选 C【点睛】本题考查了回归直线方程的简单应用,属于基础题。3经过对 K2 的统计量的研究,得到了若干个观测值,当 K26.706 时,我们认为两分类变量 A、B( )A 有 67.06%的把握认为 A 与 B 有关系 B 有 99%的把握认为 A 与 B 有关系
6、C 有 0.010 的把握认为 A 与 B 有关系 D 没有充分理由说明 A 与 B 有关系【答案】B【解析】【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据 P(K 23.841)=0.05,得到我们有 1-0.05=95%的把握认为 A 与 B 有关系【详解】依据下表:P( K2k)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的
7、概率的意义,本题不用运算只要理解概率的意义即可4有如下几个结论: 相关指数 R2 越大,说明残差平方和越小,模型的拟合效果越好;回归直线方程: ,一定过样本点的中心: 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; 在独立性检验中,若公式,中的|ad-bc|的值越大,说明“两个分类变量有关系” 的可能性越强其中正确结论的个数有( )个A 1 B 2 C 3 D 4【答案】D【解析】【分析】根据相关指数定义、残差平方和含义可得为真,根据回归直线方程特征可得为真,根据残差点含义可得为真,根据卡方含义可得为真.【详解】【点睛】相关指数 R2 越大,残差平方和越小,残差点比较均匀地落在
8、水平的带状区域,则模型的拟合效果越好;在独立性检验中,若 回归直线方程:,一定过点 .5对两个分类变量 A,B 的下列说法中正确的个数为( )A 与 B 无关,即 A 与 B 互不影响;A 与 B 关系越密切,则 K2 的值就越大;K 2 的大小是判定 A 与 B 是否相关的唯一依据A 0 B 1 C 2 D 3【答案】B【解析】【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可【详解】对于,对事件 A 与 B 无关时,说明两事件的影响较小,不是两个互不影响,错误;对于,事件 A 与 B 关系密切,说明事件 A 与 B 的相关性就越强, K2 就越大,正确;对于,K 2 的大小
9、不是判定事件 A 与 B 是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,错误;故选:B 【点睛】本题考查了独立性检验思想的应用问题,属于基础题K 2 值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.6下列说法正确的是( )线性回归方程适用于一切样本和总体;线性回归方程一般都有时间性;样本的取值范围会影响线性回归方程的适用范围;根据线性回归方程得到的预测值是预测变量的精确值A B C D 【答案】B【解析】【分析】根据线性回归方程研究的是具有相关关系的两个变量,可对前三者进行判断,再者因为线性回归方程得到的预测值是预测变量的估计
10、值,可判断最后一个也是不正确的.【详解】【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映 x 与 Y 之间的关系,这条直线过样本中心点线性回归方程适用于具有相关关系的两个变量,对于具有确定关系的两个变量是不适用的, 线性回归方程得到的预测值是预测变量的估计值,不是准确值.7经过对 K2 的统计量的研究,得到了若干个观测值,当 K26.706 时,我们认为两分类变量 A、B( )A 有 67.06%的把握认为 A 与 B 有关系 B 有 99%的把握认为 A 与 B 有关系C 有 0.010 的把握认为
11、A 与 B 有关系 D 没有充分理由说明 A 与 B 有关系【答案】B【解析】【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据 P(K 23.841)=0.05,得到我们有 1-0.05=95%的把握认为 A 与 B 有关系【详解】依据下表:P( K2k)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828,我们在错误的概率不超过 0.01 的前提下有 99%的把握认为 A 与 B 有关系,故选:B【点睛】
12、本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可8某研究型学习小组调查研究学生使用智能手机对学习的影响部分统计数据如下表:附表:经计算 的观测值 ,则下列选项正确的是( )A 有 99.5的把握认为使用智能手机对学习有影响B 有 99.5的把握认为使用智能手机对学习无影响C 有 99.9的把握认为使用智能手机对学习有影响D 有 99.9的把握认为使用智能手机对学习无影响【答案】A【解析】【分析】由题意结合 的观测值 由独立性检验的数学思想给出正确的结论即可.【详解】【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多
13、大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释9下列说法中正确的是 ( )相关系数用来衡量两个变量之间线性关系的强弱, 越接近于 ,相关性越弱;回归直线 一定经过样本点的中心 ;随机误差 满足 ,其方差 的大小用来衡量预报的精确度;相关指数 用来刻画回归的效果, 越小,说明模型的拟合效果越好.A B C D 【答案】D【解析】【分析】运用相关系数、回归直线方程等知识对各个选项逐一进行分析即可【详解】相关系数用来衡量两个变量之间线性关系的强弱, 越接近于 ,相关性越强,故错误回归直线 一定经过样本
14、点的中心 ,故正确随机误差 满足 ,其方差 的大小用来衡量预报的精确度,故正确相关指数 用来刻画回归的效果, 越大,说明模型的拟合效果越好,故错误综上,说法正确的是故选【点睛】本题主要考查的是命题真假的判断,运用相关知识来进行判断,属于基础题10通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得 参照附表,得到的正确结论是( ).A 在犯错误的概率不超过 0.01 的前提下认为“ 爱好该项运动与性别有关 ”B 在犯错误的概率不超过 0.01 的前提下认为“爱好该项运动与性别无关”C 在犯错误的概率不超过 0.001 的前提下,认为“爱好该项运动与性别有关
15、”D 在犯错误的概率不超过 0.001 的前提下, 认为“爱好该项运动与性别无关”【答案】A【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】由独立性检验的结论,观测值 ,结合临界值表: ,据此可给出结论:在犯错误的概率不超过 0.01 的前提下认为“爱好该项运动与性别有关”.本题选择 A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题11春节期间,某销售公司每天销售某种取暖商品的销售额 (单位:万元)与当天的平均气温 (单位: )有关现收集了春节期间这个销售公司 4 天的 与 的数据列于下表:平均气温( )
16、销售额(万元) 20 23 27 30根据以上数据,求得 与 之间的线性回归方程 的系数 ,则 _【答案】【解析】【分析】根据表中的数据,得到 的值,代入回归直线的方程,即可求解.【详解】【点睛】本题主要考查了回归直线方程的应用问题,其中熟记回归直线方程的基本特征和准确计算样本中心 是解答的关键,着重考查了推理与运算能力.12某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校 200 名高三学生的课外体育锻炼平均每天运动的时间进行调查,如下表:(平均每天锻炼的时间单位:分钟 )将学生日均课外体育运动时间在 上的学生评价为“课外体育达标”.平均每天锻炼的时间(分钟)总人数 20 36 4
17、4 50 40 10(1 )请根据上述表格中的统计数据填写下面 列联表,并通过计算判断是否能在犯错误的概率不超过 的前提下认为“课外体育达标”与性别有关?课外体育不达标 课外体育达标 合计男女 20 110合计(2 )从上述 200 名学生中,按“课外体育达标”、 “课外体育不达标”分层抽样,抽取 4 人得到一个样本,再从这个样本中抽取 2 人,求恰好抽到一名 “课外体育不达标” 学生的概率.参考公式: ,其中 .参考数据:0.10 0.05 0.025 0.010 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828【答案】 (1)见解析;(2) .
18、【解析】【分析】根据题意,由频率分布表可得 列联表,计算出 与临界值作比较即可得到结论由题意,样本中“课外体育不达标”的学生有 人,记为: , “课外体育达标” 的学生有 人,记为 ,列举从 名学生中任意选出 人以及恰好抽到一名“课外体育不达标” 的学生的情况,再由古典概型的计算公式计算即可求得答案【详解】(1)由题意可得如下列联表:课外体育不达标 课外体育达标 合计男 60 30 90女 90 20 110合计 150 50 200由上表可得 . 所以在犯错误的概率不超过 0.01 的前提下不能判断“课外体育达标” 与性别有关. (2)由题意,样本中“课外体育不达标 ”的学生有 3 人,记为
19、: ;“ 课外体育达标”的学生有 1 人,记为: . 从这 4 人中抽取 2 人共有 6 种情况,其中“ 恰好抽到一名课外体育不达标 学生 ”有 3 种情况,设“恰好抽到一名课外体育不达标学生”为事件 ,则 .【点睛】本题主要考查了独立性检验以及古典概型的计算公式,考查了学生分析问题解决问题的能力,考查了对数学知识的实际应用,属于常考题型。13下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程 ,若变量 增加一个单位时,则 平均增加 5 个单位;线性回归方程 所在直线必过 ;曲线上的点与该点的坐标之间具有相关关系;在一个 列联表中,由计算得 ,则其两个变量之
20、间有关系的可能性是.其中错误的是_【答案】【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.14博鳌亚洲论坛 2018 年年会于 4 月 8 日至 11 日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了 50 名记者担任对外翻译工作在右面“性别与会俄语”的 列联表中,_会俄语 不会俄语 总计男 20女 6总计 18 50【答案】28【解析】【分析】根据 22 列联表,分别计算出 a,b,d,再求 的值.【详解】【点睛】本题主要考查 22 列联表,意在考查学生对该知识的掌握水平和分
21、析推理能力.15某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如表玩手机 不玩手机 合计学习成绩优秀 4 8 12学习成绩不优秀 16 2 18合计 20 10 30经计算 的值,则有_ 的把握认为玩手机对学习有影响附:0.15 0.10 0.05 0.025 0.010 0.005 0.0012.072 2.706 3.841 5.024 6.635 7.879 10.828, .【答案】99.5【解析】分析:由已知列联表计算出 后可得详解: , ,有 99.5%的把握认为玩手机对学习有影响点睛:本题考查独立性检验,解题关键是计算出 ,然后根据对照表比较即可16随机询问中山市某
22、中学的 名学生是否爱吃零食,得到如下的列联表:男生 女生 总计爱吃零食不爱吃零食总计由 算得 .据此我们有_以上的把握认为“是否爱吃零食与性别有关”附表:【答案】【解析】分析:计算出 后,比较数据可得详解: ,有 的把握认为“是否爱吃零食与性别有关 ”故答案为 95%点睛:本题考查独立性检验,此类问题关键是求出 ,然后只要与给出的数据比较就可得出是否有关以及有多少把握17某工厂为研究某种产品产量 (吨)与所需某种原材料 (吨)的相关性,在生产过程中收集 4 组对应数据( )如下表所示:(残差 =真实值-预测值)3 4 5 62.5 3 4根据表中数据,得出 关于 的线性回归方程为: .据此计算
23、出在样本 处的残差为-0.15,则表中 的值为_【答案】【解析】分析:据题意计算出在样本 处的残差为 可得 ,则在 处由线性回归方程必过样本中心点 ,则 得到关于 的方程,解出即可详解:据题意计算出在样本 处的残差为 可得 ,则在 处由题意可知:产量 的平均值为由线性回归方程为 过样本中心点 ,则解得:故答案为:4.5点睛:本题考查线性回归方程的应用,考查线性回归方程必过样本中心点 ,考查计算能力,属于基础题18某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的 50 份调查问卷,得到了如下的列联表:同意限定区域停车 不同意限
24、定区域停车 合计男 20 5 25女 10 15 25合计 30 20 50则认为“是否同意限定区域停产与家长的性别有关”的把握约为_附: ,其中 .0.050 0.005 0.0013.841 7.879 10.828【答案】99.5%. 【解析】分析:利用公式求得 K2,与临界值比较,即可得到结论.详解:因为 K2= 8.333又 P(k 27.789)=0.005=0.5% 故答案为:99.5%.所以,我们有 99.5%的把握恩威是否同意限定区域停车与家长的性别有关点睛:本题考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题19 回归分析中,相关指数 的值越大
25、,说明残差平方和越大;对于相关系数, 越接近 1,相关程度越大, 越接近 0,相关程度越小;有一组样本数据 得到的回归直线方程为 ,那么直线必经过点 ; 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合;以上几种说法正确的序号是_【答案】.【解析】分析:根据回归直线方程与独立性检验的实际意义作出判断.点睛:本题考查线性回归方程的意义和独立性检验的应用,本题解题的关键是正确理解线性回归方程与独立性检验的意义,属于基础题20 2018 年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取 100 只健康小鼠进行试验,得到如
26、下列联表:感染 未感染 总计注射 10 40 50未注射 20 30 50总计 30 70 100参照附表,在犯错误的概率最多不超过_的前提下,可认为 “注射疫苗”与“ 感染流感”有关系(参考公式: .)0.10 0.05 0.025 0.010 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828【答案】0.05【解析】分析:直接利用独立性检验 公式计算即得解.详解:由题得 ,所以犯错误的概率最多不超过 0.05 的前提下,可认为“注射疫苗” 与“感染流感” 有关系故答案为:0.05. 点睛:本题主要考查独立性检验和 的计算,意在考查学生对这些知识的
27、掌握水平和解决实际问题的能力.三、解答题21一则“ 清华大学要求从 2017 级学生开始,游泳达到一定标准才能毕业” 的消息在体育界和教育界引起了巨大反响.其实,已有不少高校将游泳列为必修内容.某中学拟在高一-下学期开设游泳选修课,为了了解高-学生喜欢游泳是否与性别有关,该学校对 100 名高一新生进行了问卷调查,得到如下 列联表:喜欢游泳 不喜欢游泳 合计男生 40女生 30合计已知在这 100 人中随机抽取 1 人,抽到喜欢游泳的学生的概率为 .(1).请将上述列联表 补充完整,并判断是否可以在犯错误的概率不超过 0.001 的前提下认为喜欢游泳与性别有关.(2)已知在被调查的学生中有 6
28、 名来自高一(1) 班,其中 4 名喜欢游泳,现从这 6 名学生中随机抽取 2 人,求恰有 1 人喜欢游泳的概率.附:0.10 0.050 0.025 0.010 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828【答案】 (1)可以(2)【解析】分析:(1)根据题意计算喜欢游泳的学生人数,求出女生、男生多少人,完善列联表,再计算观测值 ,对照临界值表即可得出结论;(2 )设“恰有一人喜欢游泳”为事件 A,设 4 名喜欢游泳的学生为 ,不喜欢游泳的学生为 ,通过列举法即可得到答案.详解:(1)解:根据条件可知喜欢游泳的人数为 人 完成 列联表: 喜欢
29、游泳 不喜欢游泳 合计男生 40 10 50女生 20 30 50合计 60 40 100根据表中数据,计算可以在犯错误的概率不超过 0.001 的前提下认为喜欢游泳与性别有关.(2 )解:设“恰有一人喜欢游泳”为事件 A,设 4 名喜欢游泳的学生为 ,不喜欢游泳的学生为 ,基本事件总数有 15 种: 其中恰有一人喜欢游泳的基本事件有 8 种:所以点睛:本题考查了独立性检验与运算求解能力,同时考查通过列举法求概率的应用,属于中档题.22支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比从全国随机抽取了 100 个地区作为研究样本,计算了各个地区样
30、本的使用人数,其频率分布直方图如图(1 )记 A 表示事件“微信支付人数低于 50 千人”,估计 A 的概率;(2 )填写下面列联表,并根据列联表判断是否有 99%的把握认为支付人数与支付方式有关;支付人数50 千人 支付人数50 千人 总计微信支付支付宝支付总计(3 )根据支付人数的频率分布直方图,对两种支付方式的优劣进行比较附:P(K 2K) 0.050 0.010 0.001K 3.841 6.635 10.828K2=【答案】 (1)0.62 (2)有 99%的把握认为支付人数与支付方式有关;(3)支付宝支付更加优于微信支付【解析】【分析】(1 )由微信支付人数的频率分布直方图可知,微
31、信支付人数低于 50 千人的概率为。(2 )补全列联表,由卡方公式判断独立性。(3 )根据平均数和方差比较两种支付方式的优劣。【详解】(1)根据题意,由微信支付人数的频率分布直方图可得:.(2 )根据题意,补全列联表可得:支付人数 千人 支付人数 千人 总计微信支付 62 38 100支付宝支付 34 66 100总计 96 104 200则有 ,故有 99%的把握认为支付人数与支付方式有关.【点睛】本题考查了频率分布直方图,频率为小长方形的面积,求某范围内的概率,那么概率为范围内的小长方形的面积之和。平均数和方差是比较数据优劣的两个重要数据,当平均数一致时,我们比较方差的大小。23某市为迎接
32、“ 国家义务教育均衡发展综合评估” ,市教育行政部门在全市范围内随机抽取了 所学校,并组织专家对两个必检指标进行考核评分. 其中 、 分别表示“ 学校的基础设施建设”和“ 学校的师资力量” 两项指标,根据评分将每项指标划分为 A(优秀)、B(良好) 、C(及格)三个等级,调查结果如右表所示. 例如:表中“ 学校的基础设施建设” 指标为 B 等级的共有 20+21+2=43 所学校. 已知两项指标均为 B 等级的概率为 0.21.(1 )在该样本中,若“ 学校的基础设施建设”优秀率是 0.4,请填写下面 22 列联表,并根据列联表判断是否有 90的把 握认为“学校的基础设施建设”和“ 学校的师资
33、力量”有关;师资力量(优秀) 师资力量(非优秀)基础设施建设(优秀)基础设施建设(非优秀)(2 )在该样本的“ 学校的师资力量”为 C 等级的学校中,若 , ,记随机变量,求的分布列和数学期望.【答案】 (1)见解析;(2)见解析.【解析】【分析】(1 )依题意求得 n、a 和 b 的值,填写列联表,计算 K2,对照临界值得出结论;(2 )由题意得到满足条件的(a,b) ,再计算 的分布列和数学期望值【详解】()依题意得 ,得由 ,得由 得师资力量(优秀) 师资力量(非优秀)基础设施建设(优秀) 20 21基础设施建设(非优秀) 20 39.因为 ,所以没有 90的把握认为“ 学校的基础设施建
34、设” 和“学校的师资力量”有关. () , ,得到满足条件的有: , , , , 故的分布列为1 3 5 7故【点睛】本题主要考查了独立性检验和离散型随机变量的分布列与数学期望问题,属于中档题24 2018 年 6 月 19 日凌晨某公司公布的年中促销全天交易数据显示,天猫年中促销当天全天下单金额为 1592 亿元.为了了解网购者一次性购物情况,某统计部门随机抽查了 6 月18 日 100 名网购者的网购情况,得到如下数据统计表,已知网购金额在 2000 元以上(不含2000 元 )的频率为 0.4.网购金额(元) 频数 频率5 0.0515 0.1525 0.2530 0.3合计 100 1
35、()先求出 的值,再将图中所示的频率分布直方图绘制完整;()对这 100 名网购者进一步调查显示:购物金额在 2000 元以上的购物者中网龄 3 年以上的有 35 人,购物金额在 2000 元以下(含 2000 元)的购物者中网龄不足 3 年的有 20 人,请填写下面的列联表,并据此判断能否在犯错误的概率不超过 0.025 的前提下认为网购金额超过 2000 元与网龄在 3 年以上有关?网龄 3 年以上 网龄不足 3 年 总计购物金额在 2000 元以上 35购物金额在 2000 元以下 20总计 100参考数据:0.15 0.10 0.05 0.025 0.010 0.005 0.0012.
36、072 2.076 3.841 5.024 6.635 7.879 10.828参考公式: 其中 .()从这 100 名网购者中根据购物金额分层抽出 20 人给予返券奖励,为进一步激发购物热情,在 和 两组所抽中的 8 人中再随机抽取 2 人各奖励 1000 元现金,求 组获得现金奖的数学期望.【答案】() 见解析; ()在犯错误的概率不超过 0.025 的前提下认为网购金额超过 2000 元与网龄在 3 年以上有关 ( )1500.【解析】【分析】()由题意可知 2000 元以上(不含 2000 元)的频率为 0.4,所以网购金额在(2500,3000的频率为 0.40.3=0.1,由此再结
37、合频率分布直方图与频率分布表可分别求得 的值。再由数据补全频率分布直方图。() 先补全 22 列联表,由表中数据求得K2 。 ()在(2000,2500组获奖人数 X 为 0,1 ,2,求得概率及期望。【详解】()相应的 22 列联表为:由公式 K2= ,因为 5.565.024,所以据此列联表判断,在犯错误的概率不超过 0.025 的前提下认为网购金额超过 2000 元与网龄在 3 年以上 ()在(2000,2500和(2500,3000 两组所抽出的 8 人中再抽取 2 人各奖励 1000 元现金,则(2000,2500组获奖人数 X 为 0,1,2 ,且 ,故(2000,2500组获得现
38、金奖的数学期望 +1000 +2000 =1500【点睛】本题综合考查频数分布表、频率分布直方图、补全 22 列联表、卡方计算及应用、随机变量分布列及期望,需要对概念公式熟练运用,同时考查学生的运算能力。25为了解少年儿童的肥胖是否与常喝碳酸饮料有关, 现对 30 名六年级学生进行了问卷调查得到如下列联表:平均每天喝 500ml 以上为常喝,体重超过 50kg 为肥胖。 常喝 不常喝 合计肥胖 6 2 8不肥胖 4 18 22合计 10 20 30已知在全部 30 人中随机抽取 1 人,抽到肥胖的学生的概率为 。 (1 )是否有 的把握认为肥胖与常喝碳酸饮料有关?说明你的理由 (2 )现从常喝
39、碳酸饮料且肥胖的学生中(2 名女生) ,抽取 2 人参加电视节目,则正好抽到一男一女的概率是多少?参考数据: (参考公式: ,其中 )【答案】 (1)见解析;(2)【解析】【分析】(1 )由已知数据可求得 K28.5227.879 ,从而有 99.5%的把握认为肥胖与常喝碳酸饮料有关;(2 )设常喝碳酸饮料的肥胖者男生为 A、B、C、D,女生为 E,F,任取两人,利用列举法能求出抽到一男一女的概率【详解】【点睛】本题考查概率的求法,考查古典概型概率计算公式、列举法等基础知识,考查运算求解能力,考查函数与方程思想,是基础题26随着电子商务的发展, 人们的购物习惯正在改变, 基本上所有的需求都可以
40、通过网络购物解决. 小韩是位网购达人, 每次购买商品成功后都会对电商的商品和服务进行评价 . 现对其近年的 200 次成功交易进行评价统计, 统计结果如下表所示 .对服务好评 对服务不满意 合计对商品好评 80 40 120对商品不满意 70 10 80合计 150 50 200(1) 是否有 的把握认为商品好评与服务好评有关? 请说明理由 ;(2) 若针对商品的好评率 , 采用分层抽样的方式从这 200 次交易中取出 5 次交易, 并从中选择两次交易进行观察, 求只有一次好评的概率.( ,其中 )【答案】(1)有; (2) .【解析】【分析】根据列联表计算 ,对照观测值表即可得到结论利用分层
41、抽样法抽取 次交易,计算好评的交易次数和不满意次数,用列举法计算对应的概率值即可【详解】(1)由上表可得 ,所以有 的把握认为商品好评与服务好评有关 【点睛】本题主要考查了古典概型概率计算公式,利用列举法计算基本事件数及事件发生的概率,属于基础题。27为推行“ 新课堂 ”教学法,某化学老师分别用传统教学和“ 新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验,为了比较教学效果,期中考试后,分别从两个班级中各随机抽取 20 名学生的成绩进行统计,结果如下表:记成绩不低于 70 分者为“成绩优良”分数 50,59) 60,69) 70,79) 80,89) 90,100甲班频数 5 6
42、4 4 1乙班频数 1 3 6 5 5(1 )由以上统计数据填写下面 22 列联表,并判断“成绩优良与教学方式是否有关”?甲班 乙班 总计成绩优良成绩不优良总计现从上述 40 人中,学校按成绩是否优良采用分层抽样的方法抽取 8 人进行考核在这 8 人中,记成绩不优良的乙班人数为 ,求 的分布列及数学期望附: 临界值表【答案】 (1)在犯错概率不超过 0.05 的前提下认为“成绩优良与教学方式有关”.(2)见解析【解析】【分析】(1)根据数据对应填写,再根据卡方公式求 ,最后对照参考数据作判断, (2)先根据分层抽样得成绩不优良的人数,再确定随机变量取法,利用组合数求对应概率,列表得分布列,最后
43、根据数学期望公式求期望.【详解】解:(1)根据 22 列联表中的数据,得 的观测值为 ,在犯错概率不超过 0.05 的前提下认为“成绩优良与教学方式有关”. (2)由表可知在 8 人中成绩不优良的人数为 ,则 的可能取值为 0,1,2,3 ; ; ; 的分布列为:所以 【点睛】求解离散型随机变量的数学期望的一般步骤为:第一步是“判断取值” ,即判断随机变量的所有可能取值,以及取每个值所表示的意义;第二步是“探求概率” ,即利用排列组合,枚举法,概率公式,求出随机变量取每个值时的概率;第三步是“写分布列” ,即按规范形式写出分布列,并注意用分布列的性质检验所求的分布列或某事件的概率是否正确;第四
44、步是“求期望值” ,一般利用离散型随机变量的数学期望的定义求期望的值.点睛:求解离散型随机变量的数学期望的一般步骤为:第一步是“判断取值” ,即判断随机变量的所有可能取值,以及取每个值所表示的意义;第二步是“探求概率” ,即利用排列组合、枚举法、概率公式(常见的有古典概型公式、几何概型公式、互斥事件的概率和公式、独立事件的概率积公式,以及对立事件的概率公式等),求出随机变量取每个值时的概率;第三步是“写分布列” ,即按规范形式写出分布列,并注意用分布列的性质检验所求的分布列或某事件的概率是否正确;第四步是“求期望值” ,一般利用离散型随机变量的数学期望的定义求期望的值,对于有些实际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布 ),则此随机变量的期望可直接利用这种典型分布的期望公式( )求得.因此,应熟记常见的典型分布的期望公式,可加快解题速度.28学校对甲、乙两个班级的同学进行了体能测验,成绩统计如下(每班 50 人):