1、 高考考点 命题分析 三年高考探源 考查频率抽样方法2017 江苏 32015 四川 32015 福建 13用样本估计总体2017 课标全国22017 课标全国32017 课标全国192017 课标全国192016 课标全国4变量间的相关关系2017 课标全国192016 课标全国182015 课标全国3独立性检验本部分的主要内容有:抽样方法、用样本估计总体、变量间的相关关系、独立性检验,其中随机抽样和总体估计是高考考查的热点内容,一般以选择题、填空题的形式出现,主要考查对抽样方法的理解与选择,各种统计图表的识别以及有关样本数据、数字特征的计算等独立性检验一般在解答题中出现,常结合概率考查,一
2、般难度不大.2017 课标全国19 考点 1 抽样方法题组一 系统抽样调研 1 某学校在高一新生入学后的一次体检后,为了解学生的体质情况,决定从该校的 名高一新生10中采用系统抽样的方法抽取 名学生进行体质分析,已知样本中第一个号为 号,则抽取的第 个学50 7生的编号为A B107 097C D2 18【答案】D【解析】由题意知组距为 则抽取学生的编号组成以 7 为首项,20 为公差的等差数列,其通项102,5公式为 故选 D1072,7018.naa技巧点拨利用系统抽样分段时,若分段间隔不为整数,应先随机剔除部分元素,再分组,但每个个体被抽到的概率仍为 .此问题易忽视样 本 容 量总 体
3、个 数题组二 分层抽样调研 2 分层抽样是将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,组成一个样本的抽样方法.在九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持钱,乙持 钱,丙持 钱 ,甲、乙、丙三人一起出关,关税共 钱,要按照各人带多少的比例进行交税,560 350 180 100问三人各应付多少税?则下列说法错误的是A甲应付 钱 B乙应付 钱5141109 3224109C丙应付 钱 D三者中甲付的钱最多,丙付的钱最少1656109【答案】B【解
4、析】依题意,由分层抽样可知, = ,则甲应付: = 钱;乙应付:100560+350+18010109 101095605141109= 钱;丙应付: = 钱.故选 B101093503212109 101091801656109考点 2 用样本估计总体题组一 数字特征的应用调研 1 若一组数据 的方差为 1,则 的方差为1,2, 21+4,22+4,2+4A1 B2 C4 D8【答案】C【解析】若 的方差为 ,则 , , , 的方差为 ,故可得当 的1,2, 2 1+ 2+ + 22 1,2,方差为 1 时, 的方差为 ,故选 C21+4,22+4,2+4 221=4调研 2 已知一组数据分
5、别是 ,若这组数据的平均数、中位数、众数成等差数列,则数据 的,10,2,5,2,4,2 所有可能值为_【答案】 或 3 或 171【解析】由题得这组数据的平均数为 ,众数是 2,+10+2+5+2+4+27 =+257若 x2,则中位数为 2,此时 x= ;1若 2 x4,则中位数为 x,此时 2x= ,得 x=3;25+7 +2若 x4,则中位数为 4,此时 24= ,得 x=17,25+7 +2故数据 的所有可能值为 ,3,17. 1题组二 茎叶图的应用调研 3 为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的 6 次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、
6、乙两人的平均成绩分别是 , ,则下列说法正确的是甲 乙A ,乙比甲成绩稳定,应选乙参加比赛甲 乙B ,甲比乙成绩稳定,应选甲参加比赛甲 乙C ,甲比乙成绩稳定,应选甲参加比赛甲 6 24.59即至少需要投入促销费用 万元.24.59技巧点拨利用回归直线方程可以进行预测与估计,但要注意回归直线方程表明的是两组数据之间的相关关系,而不是函数关系,所以利用该方程求出的数值都是估计值,而不是一个确定的数值题组二 非线性回归方程及应用调研 3 禽流感一直在威胁我们的生活,某疾病控制中心为了研究禽流感病毒繁殖个数 (个)随时间(天)变化的规律,收集数据如下:天数 1 2 3 4 5 6繁殖个数 6 12
7、25 49 95 190作出散点图可看出样本点分布在一条指数型函数 的周围.=1+2(1)求出 关于 的回归方程(保留小数点后两位数字) ; (2)已知 ,估算第四天的残差 .3.8848.42参考公式: .1122 ,nniiiii iixyxyb aybx保留小数点后两位数的参考数据:, , , , ,=3.536137iy612.8iu6217.5iix62146.83iiy, , ,其中 .6218.4iiu6159.iiixy61.0iiixu =【解析】 (1) ,令 ,则 .=1+2 = =1+2, .612.08.69175iiiiixuc=3.5,2=1=3.530.693.
8、51.1151.12, ,=0.69+1.12=0.69+1.12所以 关于 的回归方程为 . =0.69+1.12(2)当 时, , ,=4 =49=0.694+1.12=3.8848.42,=4948.42=0.58所以第四天的残差估计为 0.58.技巧点拨如果两个变量呈非线性相关关系,则可通过恰当的变换,将其转化成线性关系,再求线性回归方程.考点 4 独立性检验题组一 两类变量相关性的判断调研 1 为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取 50 名学生,得到 22 列联表:理科 文科 总计男 13 10 23女 7 20 27总计 20 30 50已知 P(K23.84
9、1)0.05, P(K25.024)0.025.根据表中数据,得到 K2 4.844,则认为选修文理科与性别有关系出错50 1320 107 223272030的可能性约为_【答案】5%【解析】由 K24.8443.841,得可以认为选修文理科与性别有关系出错的可能性约为 5%.题组二 独立性检验与概率、统计的综合调研 2 2018 年 2 月 22 日,在平昌冬奥会短道速滑男子 500 米比赛中,中国选手武大靖以连续打破世界纪录的优异表现,为中国代表队夺得了本届冬奥会的首枚金牌,也创造了中国男子冰上竞速项目在冬奥会金牌零的突破.某高校为调查该校学生在冬奥会期间累计观看冬奥会的时间情况,收集了
10、 200 位男生、100位女生累计观看冬奥会时间的样本数据(单位:小时),又在 100 位女生中随机抽取 20 个人,已知这 20 位女生的数据茎叶图如图所示.(1)将这 20 位女生的时间数据分成 8 组,分组区间分别为 ,请画出频率分布直0,5),5,10),.,30,35),35,40方图;(2)以(1)中的频率作为概率,求 1 名女生观看冬奥会时间不少于 30 个小时的概率;(3)以(1)中的频率估计 100 位女生中累计观看时间小于 20 个小时的人数.已知 200 位男生中累计观看时间小于 20 个小时的男生有 50 人,请完成下面的 22 列联表,并判断能否在犯错误的概率不超过
11、0.01 的前提下认为“该校学生观看冬奥会的累计时间与性别有关”?男生 女生 总计累计观看时间小于 20 小时累计观看时间不小于 20 小时总计参考数据:(20) 0.10 0.05 0.010 0.0050 2.706 3.841 6.635 7.879参考公式: .2= ()2(+)(+)(+)(+)(=+)【解析】 (1)由题意知样本容量为 ,频率分布表如下:20分组 频数 频率 频 率组 距0,5) 1 120 0.015,10) 1 120 0.0110,15) 4 15 0.0415,20) 2 110 0.0220,25) 4 15 0.0425,30) 3 320 0.0330
12、,35) 3 320 0.0335,40) 2 110 0.02合计 20 1频率分布直方图为:(2)因为(1)中 的频率为 ,30,40320+110=14所以 名女生观看冬奥会时间不少于 个小时的概率为 .1 3014(3)因为(1)中 的频率为 ,故可估计 位女生中累计观看时间小于 个小时的人数是0,20)25 100 20.所以累计观看时间与性别的 22 列联表如下:10025=40男生 女生 总计累计观看时间小于 20 个小时 50 40 90累计观看时间不小于 20 个小时 150 60 210总计 200 100 300结合列联表可算得 的观测值为 ,2=300(50601504
13、0)220010021090 =5077.1436.635所以,能在犯错误的概率不超过 0.01 的前提下认为“该校学生观看冬奥会的累计时间与性别有关”.技巧点拨求解与独立性检验相交汇的问题(1)读懂列联表:明确列联表中的数据(2)计算 K2:根据提供的公式计算 K2的值(3)作出判断:依据临界值与犯错误的概率得出结论 (4)利用给定数据分析变量取值,计算概率1 (四川省绵阳市 2018 届高三第三次诊断性考试)为了解某高校高中学生的数学运算能力,从编号为0001,0002,2000 的 2000 名学生中采用系统抽样的方法抽取一个容量为 50 的样本,并把样本编号从小到大排列,已知抽取的第一
14、个样本编号为 0003,则最后一个样本编号是A0047 B1663C1960 D1963【答案】D2 (2017-2018 学年贵州省遵义市遵义四中高三第三次月考)一支田径队有男运动员 40 人,女运动员 30 人,要从全体运动员中抽取一个容量为 28 的样本来研究一个与性别有关的指标,则抽取的男运动员人数为A20 B18C16 D12【答案】C【解析】因为田径队男运动员 40 人,女运动员 30 人,所以这支田径队共有 40+30=70 人,用分层抽样的方法从该队的全体运动员中抽取一个容量为 28 的样本,所以每个个体被抽到的概率是 ,因为田径队2870=25有男运动员 40 人,所以男运动
15、员要抽取 人,故选 C4025=163 (北京师范大学附中 2018 届高三下学期第二次模拟)已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,则甲组数据的平均数为A30 B31C32 D33【答案】B4 (黑龙江省齐齐哈尔市 2018 届高三第二次模拟)某高校调查了 320 名学生每周的自习时间(单位:小时) ,制成了下图所示的频率分布直方图,其中自习时间的范围是 ,样本数据分组为17.5, 30, , , , .根据直方图,这 320 名学生中每周的自17.5, 20 20, 22.5 22.5, 25 25, 27.5 27.5, 30习时间不足 22.5 小时的人数是A68 B7
16、2C76 D80【答案】B【解析】由频率分布直方图可得,320 名学生中每周的自习时间不足 22.5 小时的人数是选 B320( 0.02+0.07) 2.5=725 (江西省景德镇市第一中学等盟校 2018 届高三第二次联考)已知某 7 个数的平均数为 4,方差为 2,现加入一个新数据 4,此时这 8 个数的平均数为 ,方差为 ,则 2A , B ,=4 2=2 =4 22C , D ,=4 24 22【答案】C【解析】根据题意有 ,而 ,故选 C478x2278s6 (2018 届河南省郑州市第一中学高三上学期第二次月考)为了调查民众对最新各大城市房产限购政策的了解情况,对甲、乙、丙、丁四
17、个不同性质的单位做分层抽样调查.假设四个单位的人数有如下关系:甲、乙单位的人数之和等于丙单位的人数,甲、丁单位的人数之和等于乙、丙单位的人数之和,且丙单位有36 人,若在甲、乙两个单位抽取的人数之比为 1:2,则这四个单位的总人数 为A96 B120C144 D160【答案】B7 (辽宁省丹东市 2018 年高三模拟(二) )已知某种商品的广告费支出 x(单位:万元)与销售额 y(单位:万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 50 60 70根据上表可得回归方程 ,计算得 ,则当投入 10 万元广告费时,销售额的预报值为=+ =7_万元【答案】85【解析】由上表可知:
18、.=2+4+5+6+85 =5,=30+40+50+60+705 =50得样本点的中心为 ,代入回归方程 ,得 .(5,50) =+ =5075=15所以回归方程为 ,=7+15将 代入可得: .=10 =858 (吉林省长春市第十一高中、东北师范大学附属中学、吉林一中,重庆一中等五校 2018 届高三 1 月联合模拟)已知下列命题:在线性回归模型中,相关指数 表示解释变量 对于预报变量 的贡献率, 越接近于 1,表示回2Rxy2R归效果越好;两个变量相关性越强,则相关系数的绝对值就越接近于 1;在回归直线方程 中,当解释变量 每增加一个单位时,预报变量 平均减少 0.5 个单0.52yxxy
19、位;对分类变量 与 ,它们的随机变量 的观测值 来说, 越小, “ 与 有关系”的把握程度越XY2KkXY大其中正确命题的序号是_【答案】9 (东北三省三校(哈尔滨师范大学附属中学)2018 届高三第三次模拟考试)哈师大附中高三年级统计了甲、乙两个班级一模的数学分数(满分 分) ,现有甲、乙两班本次考试数学的分数如下列茎叶图所150示:(1)根据茎叶图求甲、乙两班同学成绩的中位数,并将乙班同学的成绩的频率分布直方图填充完整;(2)根据茎叶图比较在一模考试中,甲、乙两班同学数学成绩的平均水平和分数的分散程度(不要求计算出具体值,给出结论即可) ;(3)若规定分数在 的成绩为良好,分数在 的成绩为
20、优秀,现从甲、乙两班100 , 120) 120 , 150)成绩为优秀的同学中,按照各班成绩为优秀的同学人数占两班总的优秀人数的比例分层抽样,共选出位同学参加数学提优培训,求这 位同学中恰含甲、乙两班所有 分以上的同学的概率.12 12 140【答案】 (1)甲班数学分数的中位数为 118,乙班数学分数的中位数为 128,频率分布直方图见解析;(2)见解析;(3) .523410 (湖南省益阳市 2018 届高三 4 月调研考试)某校高一年级共有 名学生,其中男生 名,女生1000 400名,该校组织了一次口语模拟考试(满分为 分).为研究这次口语考试成绩为高分是否与性别有关,600 100
21、现按性别采用分层抽样抽取 名学生的成绩,按从低到高分成 , , , ,100 30,40) 40,50) 50,60) 60,70), , 七组,并绘制成如图所示的频率分布直方图.已知 的频率等于 的70,80) 80,90) 90,100 40,50) 80,90)频率, 的频率与 的频率之比为 ,成绩高于 分的为“高分”.80,90) 90,100 3:2 80(1)估计该校高一年级学生在口语考试中,成绩为“高分”的人数;(2)请你根据已知条件将下列 列联表补充完整,并判断能否在犯错误的概率不超过 0.001 的前22提下认为该校高一年级学生在本次口语考试中的成绩是否及格( 分以上(含 分
22、)为及格)与性别60 60有关?口语成绩及格 口语成绩不及格 合计男生 =18 =女生 = =合计 =100附临界值表:(20) 0.100 0.050 0.025 0.010 0.0010 2.706 3.841 5.024 6.635 10.828参考公式: , .22()(nadbcKnabcd【答案】 (1)200;(2)见解析.故估计该校高一年级学生在口语考试中,成绩为“高分”的频率为 .0.12+0.08=0.20故估计该校高一年级学生在口语考试中,成绩为“高分”的人数为 .10000.20=20011 (2018 届河南省中原名校高三第六次质量考评)前几年随着网购的普及,线下零售
23、遭遇挑战,但随着新零售模式的不断出现,零售行业近几年呈现增长趋势,下表为 年中国百货零售业的销售额20142017(单位:亿元,数据经过处理, 分别对应 ):14 20142017年份代码 1 2 3 4销售额 95 165 230 310(1)由上表数据可知,可用线性回归模型拟合 与 的关系,请用相关系数加以说明; (2)建立 关于 的回归方程, 并预测 2018 年我国百货零售业的销售额; (3)从 年这 4 年的百货零售业销售额及 2018 年预测销售额这 5 个数据中任取 2 个数据,20142017求这 2 个数据之差的绝对值大于 200 亿元的概率.参考数据: .444211180
24、,235,58.9,236ii iiyxyy参考公式:相关系数 ,回归方程 中斜率和截距的最小二乘估1221()()niiiniiiirxy=+计公式分别为 . 12 ,niiiiibaybxx【答案】(1) 与 的相关系数近似为 0.999,说明 与 的线性相关程度相当高,从而可以用线性回归 模型拟合 与 的关系;(2) 关于 的回归方程为 ,预测 2018 年我国百货零售业的 =22.5+71销售额为 377.5 亿元;(3) .310, ,共 10 个.(165,377.5)(230,310),(230,377.5),(310,377.5)所取 2 个数据之差的绝对值大于 200 亿元的
25、结果有: ,共 3 个,(95,310),(95,377.5),(165,377.5)所以所求概率为 .=3101(2017 新课标全国文科)为评估一种农作物的种植效果,选了 n 块地作试验田这 n 块地的亩产量(单位:kg)分别为 x1, x2, xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A x1, x2, xn的平均数 B x1, x2, xn的标准差C x1, x2, xn的最大值 D x1, x2, xn的中位数【答案】B2(2015 新课标全国文科)根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是A逐年比较
26、,2008 年减少二氧化硫排放量的效果最显著B2007 年我国治理二氧化硫排放显现成效C2006 年以来我国二氧化硫年排放量呈减少趋势D2006 年以来我国二氧化硫年排放量与年份正相关【答案】D3(2017 江苏)某 工 厂 生 产 甲 、 乙 、 丙 、 丁 四 种 不 同 型 号 的 产 品 , 产 量 分 别 为 200, 400, 300, 100 件 为检 验 产 品 的 质 量 , 现 用 分 层 抽 样 的 方 法 从 以 上 所 有 的 产 品 中 抽 取 60 件 进 行 检 验 , 则 应 从 丙 种 型 号 的 产 品 中抽 取 件 【答案】18【解析】应从丙种型号的产品
27、中抽取 件,故答案为 1830618【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即 ni Ni n N4(2017 新课标全国文科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg) ,其频率分布直方图如下:(1)记 A 表示事件“旧养殖法的箱产量低于 50 kg”,估计 A 的概率;(2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关;箱产量50 kg 箱产量50 kg旧养殖法新养
28、殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P( )2 0.050 0.010 0.001k 3.841 6.635 10.828.22()(nadbcK【答案】 (1)0.62;(2)见解析;(3)见解析.5( 2016 新 课 标 全 国 文 科 ) 下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图.()由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明;()建立 y 关于 t 的回归方程(系数精确到 0.01) ,预测 2016 年我国生活垃圾无害化处理量.附注:参考数据: , ,719.32iy7
29、140.ity, 2.646.721()0.5ii参考公式:相关系数 1221()(y)niiniiitr,回归方程 中斜率和截距的最小二乘估计公式分别为:yabt 12()niiityb, =.abt【答案】 ()因为 与 的相关系数近似为 0.99,说明 与 的线性相关程度相当高,从而可以用线t yt性回归模型拟合 与 的关系.(II) 关于 的回归方程为 ,预测 2016 年我国生活yyt t10.92.垃圾无害化处理量将约 1.82 亿吨.【方法点拨】判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数 的公式求出 ,然后根据 的大小进行判断求线性回归方程时严格rrr按照公式求解,一定要注意计算的准确性