收藏 分享(赏)

高考数学二轮透析副题05 统计-23题对对碰(原卷版).doc

上传人:eco 文档编号:4906277 上传时间:2019-01-22 格式:DOC 页数:15 大小:1.14MB
下载 相关 举报
高考数学二轮透析副题05 统计-23题对对碰(原卷版).doc_第1页
第1页 / 共15页
高考数学二轮透析副题05 统计-23题对对碰(原卷版).doc_第2页
第2页 / 共15页
高考数学二轮透析副题05 统计-23题对对碰(原卷版).doc_第3页
第3页 / 共15页
高考数学二轮透析副题05 统计-23题对对碰(原卷版).doc_第4页
第4页 / 共15页
高考数学二轮透析副题05 统计-23题对对碰(原卷版).doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、 2018 届学科网二轮透析高考数学 23 题对对碰【二轮精品】第二篇 副题 4 统计【副题考法】本副题考题形式为选择题或填空题,以实际问题为背景、与概率、框图等结合主要考查抽样方法、样本频率分布估计总体频率分布、样本数字特征估计总体数字特征、回归分析、独立性检验等统计知识与方法,考查应用意识、阅读理解能力、数据处理能力、运算求解能力,难度为基础题或中档题,分值为 5 至 10 分.【主题考前回扣】1.抽样方法简单随机抽样、分层抽样、系统抽样从容量为 N 的总体中抽取容量为 n 的样本,则每个个体被抽到的概率都为 ;nN分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本

2、容量2.统计中四个数据特征众数:在样本数据中,出现次数最多的那个数据;中位数:在样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数;学=科网平均数:样本数据的算术平均数,即 (x1x 2x n);x1n方差与标准差方差:s 2 (x1 )2(x 2 )2(x n )21n x x x标准差:s .1n x1 x 2 x2 x 2 xn x 23.直方图的三个结论小长方形的面积组距 频率;频 率组 距各小长方形的面积之和等于 1;小长方形的高 ,所有小长方形高的和为 .频 率组 距 1组 距4.回归分析(1)回归直线 x 经过样本点的中心点(

3、, ),若 x 取某一个值代入回归直线y b a xy方程 x 中,可求出 y 的估计值.y b a 5.独立性检验对于取值分别是x 1,x 2和 y1,y 2的分类变量 X 和 Y,其样本频数列联表是:y1 y2 总计x1 a b abx2 c d cd总计 ac bd n则 K2 (其中 nabcd 为样本容量).n( ad bc) 2( a b) ( c d) ( a c) ( b d)利用随机变量 K2 来判断“两个分类变量有关系 ”的方法称为独立性检验如果 K2 的观测值 k 越大,说明“两个分类变量有关系”的可能性越大【易错点提醒】1.混淆频率分布条形图和频率分布直方图,误把频率分

4、布直方图纵轴的几何意义当成频率,导致样本数据的频率求错2.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“ 重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和3.在独立性检验中,K 2 (其中 nabcd)所给出的检验随机n(ad bc)2(a b)(a c)(b d)(c d)变量 K2 的观测值 k,并且 k 的值越大,说明“X 与 Y 有关系”成立的可能性越大,可以利用数据来确定“X 与 Y 有关系”的可信

5、程度.4.混淆直线方程 yax b 与回归直线 x 系数的含义,导致回归分析中致误.y b a 【副题考向】考向一 抽样方法【解决法宝】 解决抽样问题的策略1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量较多且差别不大时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样2.系统抽样:学!科网(1)若从容量为 N 的总体中抽取容量为 n 的样本,用系统抽样时,应先将总体中的各个个体编号,再确定分段间隔 k,以便对总体进行分段(2)当 是整数时,取 k 作为分段间隔即可,当 不是整数时,应先从总体中随机剔除一些个体,使Nn Nn Nn剩余个体数

6、 N能被 n 整除,这时分段间隔 k .Nn(3)利用简单随机抽样确定在第一组中抽取的个体的号码数,譬如第一组号码为 ,则第 n 组号码0为 .)1(0kn3.分层抽样:若总体有差异的几部分组成,用分层抽样方法,按同比例比例抽样.例 1【广东省中山市 2018 届上学期期末】某班运动队由足球队员 18 人、篮球队员 12 人、乒乓球队员 6 人组成(每人只参加一项) ,现从这些运动员中抽取一个容量为 的样本,若分别采用系统抽样和分层抽样法,n则都不用剔除个体;当样本容量为 时,若采用系统抽样法,则需要剔除 1 个个体,那么样本容量 为1n n_【分析】根据分层抽样和系统抽样的意义,即可得出 n

7、 值.【解析】n 为 18+12+6=36 的正约数,因为 18:12:6=3:2:1,所以 n 为 6 的倍数,因此,因为当样本容量为 时,若采用系统抽样法,则需要剔除 1 个个体,所以6,1284,306 n+1 为 35 的正约数,因此 n考向二 总体估计【解决法宝】1频率分布直方图中横坐标表示组距,纵坐标表示 ,频率组距 .频 率组 距 频 率组 距2频率分布直方图中各小长方形的面积之和为 1.3利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分

8、布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和4.茎叶图图中的中位数:数据从小到大排成一排,中间为一个数或两个数的平均值.5.样本数据的算术平均数,即 = x)(12nxn6.标准差的平方就是方差,方差的计算基本公式 )()()( 22212 xxxs n例 2【河南安阳 2018 届二模】在某校连续 次考试成绩中,统计甲,乙两名同学的数学成绩得到如图所示5的茎叶图.已知甲同学 次成绩的平均数为 ,乙同学 次成绩的中位数为 ,则 的值为( )58173xyA. B. C. D. 3456【分析】由甲同学乘积的均值即可求出 x,由乙同学成绩的中无数即可

9、求出 y,即可求出 x+y 的值.例 3【山东省聊城市 2018 届一模】某工厂从生产的一批产品中随机抽出一部分,对这些产品的一项质量指标进行了检测,整理检测结果得到如下频率分布表:质量指标分组 10,330,550,7频率 0.1 0.6 0.3据此可估计这批产品的此项质量指标的方差为_【分析】每组数据的中点值乘以对应概率的和就是频率分布直方表的均值,各组的中间值与均值差的平方和就是方差.【解析】由题意得这批产品的此项质量指标的平均数为 ,20.14.60.34故方差为 2204.104.63考向三 回归分析【解决法宝】1.散点图:表示具有相关关系的两个变量的一组数据的图形叫散点图.2.正相

10、关:如果散点图中的点分布在从左下到右上的区域内,称为正相关.负相关:若散点图中的点分布在从左上角到右下角的区域内,称为负相关.3求回归直线方程的关键(1)正确理解和合理选择回归方程系数的计算公式并能准确地进行运算,若样本数据较小,选第二个公式,若样本数据较大但与样本均值差较小用第 1 个公式(2)根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值(3)计算线性回归方程公式: ,其中 .yabx1122nniiiii iixyxyaybx4.回归直线一定过样本中心点( , ). xy例 4【河北邢台市一中 2018 届二模】某产品

11、的广告费用 x 与销售额 y 的统计数据如下表:广告费用 x/万元 4 2 3 5销售额 y/万元 49 26 39 54根据上表可得回归方程 x+ 中的 为 9.4,据此模型预报广告费用为 6 万元时销售额约为_元.=【分析】先计算出 ,将 代入回归直线方程即可求出 ,再将 x=6 代入回归直线方程即可求出销yx,),( a售额.【解析】 =3.5, =42, ,回归方程为 , 当 时,=9.4+9.1考向四 独立性检验【解决法宝】独立性检验的基本方法一般地,假设有两个分类变量 X 和 Y,它们的取值分别为x 1,x 2和y 1,y 2,其样本频数列联表如表:y1 y2 总计x1 a b a

12、bx2 c d cd总计 ac bd abcd根据实际问题需要的可信度确定临界值 ;0k利用公式 = ,由观测数据计算得到随机变量 的观测值 ;2K2()(nadbc2Kk如果 ,就以 的把握认为“ 与 有关系”;否则就说样本观测值没有提供k02011%PkXY“ 与 有关系” 的充分证据.XY例 5【湖南师大附中 2018 届月考(三) 】在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果 ,现随机抽取 100 只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过 _(填百分比)的前提下 ,可认为“该种疫苗有预防埃博拉病毒感染的效

13、果”参考公式:K 2 2nadbcd【分析】由题中数据计算出 K2 的观测值,对照开方分布表即可求出结果.【副题集训】1.【湖南省郴州市一高 2018 届二练】从 名学生中选取 名学生参加全国诗词大会,若采用下面的方法选取;先用简单随机抽样从 人中剔除 人,剩下的 人再用系统抽样的方法抽取,则每人入选的概率( ).2503A. 都相等, 且为 B. 都相等, 且为 C. 不全相等 D. 均不相等【答案】B【解析】由题意,由于研究对象的总数较大,所以先用简单随机抽样剔除极少部分,再用系统抽样选出样本,操作过程符合抽样抽样原则,即每人入选的概率相等,且为 .故选 B.2.【山东省实验中学 2017

14、 届高三第一次诊,4】高三学生体检,某班级随机抽取 5 名女学生的身高 (厘x米)和体重 (公斤)的数据如下表:yx165 160 175 155 17058 52 62 43 60根据上表可得回归直线方程为 ,则 ( ) 0.92yxaA B C D96.868104.104.【答案】A【解析】回归直线方程过点 ,而 ,所以 ,选 A.yx( , ) 5,63y63.9256.8a3.【湖南省怀化市 2018 届上学期期末】总体由编号为 01,02,19,20 的 20 个个体组成.利用下面的随机数表选取 5 个个体,选取方法是从第 1 行的第 5 列和第 6 列数字开始由左往右依次选取两个

15、数字,则选出来的第 5 个个体的编号为( )A. 01 B. 02 C. 14 D. 19【答案】A4.【山东肥城市 2017 届高三上学期升级统测,3】如图是某居民小区年龄在 岁到 岁的居民上网情况2045的频率分布直方图,现已知年龄在 的上网人数呈现递减的等差数列, 则年龄在30,5,405的频率是( )35,40A B C D0.40.60.20.3【答案】C【解析】 的概率和为 ,又3,5,4,51(.7)5.6的概率依次成等差数列,所以 的频率为 选 C.0,0, 3,400.235.【甘肃省兰州市西北师范大学附中 2017 届二诊】近日,一种牛奶被查出含有致癌物质,国家质监局调查了

16、这种牛奶的 100 个相关数据,绘制成如图所示的频率分布直方图,再对落在6,11),21,26 两组内的数据按分层抽样方法抽取 8 个数据,然后从这 8 个数据中抽取 2 个,则最后得到的 2 个数据分别来自两组的取法种数是( )A. 10 B. 13 C. 15 D. 18【答案】C6.【河北省唐山一中 2017 届高三上学期 12 月调研考试】右图是一容量为 10的样本的重量的 频率分布直方图,则由图可估计样本的重量的中位数为( )来源:Zxxk.Com学科网A11 B11.5 C12 D12.5 【答案】C【解析】设中位数为 . , ,解得 .故 C 正确.x065.3010.50.3x

17、12x7.【四川省内江市高中 2018 届一模】下列说法中正确的是A. 先把高三年级的 2000 名学生编号:1 到 2000,再从编号为 1 到 50 的 50 名学生中随机抽取 1 名学生,其编号为 ,然后抽取编号为 的学生,这样的抽样方法是分层抽样法m50,1,50mB. 线性回归直线 不一定过样本中心点ybxaxyC. 若两个随机变量的线性相关性越强,则相关系数 的值越接近于 1rD. 若一组数据 1、 、3 的平均数是 2,则该组数据的方差是 23【答案】D【解析】对于 ,先把高三年级的 2000 名学生编号:1 到 2000,再从编号为 1 到 50 的 50 名学生中随机A抽取

18、1 名学生,其编号为 ,然后抽取编号为 的学生,这样的抽样方法是系统m50,1,50m抽样,故 错误;对于 ,线性回归直线 一定过样本中心点 ,故 错误;对于 ,若Bybxa,xyBC两个随机变量的线性相关性越强,则相关系数 r 的绝对值越接近于 1,故 错误;对于 ,若一组数据CD1、 、3 的平均数是 2,则 ,则该组数据的方差是 ,故 正aa22233确,故选 D8.【广东珠海市 2017 届上学期调研测试(1) ,4】已知甲、乙两组数据如图茎叶图所示,若它们的中位数相同,平均数也相同,则图中的 的比值 ( ),mnA B C 381329D1【答案】A【解析】因为乙的中位数是 ,所以

19、,可求得甲的平均数是 ,因此乙的平均数也是 ,进而得23m2323, ,故选 A. 学!科网8n3m9.【云南省昆明市 2018 届第二次统考】 “搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是 2017 年 9 月到 2018 年 2 月这半年中,某个关键词的搜索指数变化的走势图.根据该走势图,下列结论正确的是 ( )A. 这半年中,网民对该关键词相关的信息关注度呈周期性变化B. 这半年中,网民对该关键词相关的信息关注度不断减弱C. 从网民对该关键词的搜索指数来看,去年

20、10 月份的方差小于 11 月份的方差D. 从网民对该关键词的搜索指数来看,去年 12 月份的平均值大于今年 1 月份的平均值【答案】D【解析】选项 A 错,并无周期变化,选项 B 错,并不是不断减弱,中间有增强。C 选项错,10 月的波动大小 11 月分,所以方差要大。D 选项对,由图可知,12 月起到 1 月份有下降的趋势,所以会比 1 月份。选 D.10.【云南省、四川省、贵州省 2017 届高三上学期百校大联考数学,4】从某项综合能力测试中抽取 100人的成绩,统计如下,则这 100 个成绩的平均数为( )A3 B2.5 C3.5 D2.75【答案】A【解析】设这 100 个成绩的平均

21、数即为 ,则 x1203401520311.【山西省平遥中学 2018 届 3 月考】某学校 、 两个班的数学兴趣小组在一次数学对抗赛中的成绩绘AB制茎叶图如下,通过茎叶图比较两班数学兴趣小组成绩的平均值及方差 班数学兴趣小组的平均成绩高于 班的平均成绩AB 班数学兴趣小组的平均成绩高于 班的平均成绩BA 班数学兴趣小组成绩的标准差大于 班成绩的标准差 班数学兴趣小组成绩的标准差大于 班成绩的标准差其中正确结论的编号为( )A. B. C. D. 【答案】B12. 【湖南省邵阳市 2018 届上学期期末】在某次高中数学竞赛中,随机抽取 90 名考生,其分数如图所示,若所得分数的平均数,众数,中

22、位数分别为 , , ,则 , , 的大小关系为( )A. B. C. D. 【答案】D【解析】经计算得平均值 ,众数为 ,中位数为 ,故 ,选 .=50+602 =5513.【河南省八市学评 2018 届第一次测评】某校对高二一班的数学期末考试成绩进行了统计,发现该班学生的分数都在 90 到 140 分之间,其频率分布直方图如图所示,若 130140 分数段的人数为 2,则 100120分数段的人数为( )A. 12 B. 28 C. 32 D. 40【答案】B【解析】130140 分数段的纵坐标为 1-(0.045+0.025+0.015+0.01)10=0.05 ,所以高二一班人数为2/0

23、.05=40,所以 100120 分数段的人数为 (0.025+0.045)1040=28,故选 B. 14.【广东省茂名市五大联盟学校 2018 届 3 月联考】下列茎叶图中的甲,乙的平均数,方差,极差及中位数,相同的为( )A. 极差 B. 方差 C. 平均数 D. 中位数【答案】C【解析】从茎叶图中数据的分布,可知方差不同,极差不同,甲的中位数为 ,乙的中位数为,计算平均数: , ,甲、乙的平均数都为 ,故选 C.15.【广东省茂名市五大联盟学校 2018 届 3 月联考】下列茎叶图中的甲,乙的平均数,方差,极差及中位数,相同的为( )A. 极差 B. 方差 C. 平均数 D. 中位数【

24、答案】C16.【重庆市 2018 届上学期期末】根据如下样本数据:x3 5 7 9y6 a3 2得到回归方程 ,则1.42.xA. B. 变量 与 线性正相关5a xyC. 当 11 时,可以确定 3 D. 变量 与 之间是函数关系xy【答案】A【解析】由题意可得: , ,回归方程过样本中心点,则: 57964x3214aay,求解关于实数 的方程可得: ,1.4612.aa5由 可知变量 与 线性负相关;当 11 时,无法确定 y 的值;变量 与 之间是相关关系,0bxyxxy不是函数关系,故选 A.17. 【 四川省 2018 届高三春季诊断性测试】我国古代数学名著九章算术有一抽样问题:“

25、今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一百零八人,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有 7488 人,南面有 6912 人,这三面要征调300 人,而北面共征调 108 人(用分层抽样的方法) ,则北面共有_人 ”【答案】8100【解析】因为共抽调 300 人,北面抽掉了 108 人,所以西面和南面共 14400 人中抽出了 192 人,所以抽样比为 ,所以北面共有 人,故填 8100.18.【山东省淄博市 2018 届 3 月模拟】某校高三年级 3 个学部共有 600 名学生,编号为:001,002,600,从 001

26、到 300 在第一学部,从 301 到 495 在第二学部,496 到 600 在第三学部.采用系统抽样的方法从中抽取 50 名学生进行成绩调查,且随机抽取的号码为 003,则第二学部被抽取的人数为_【答案】17【解析】 由题意得,号码的间隔为 ,则第一组随机抽取的号码为 , 则抽取的号码,构成一个等差数列,则通项公式为 ,由 ,即 ,即 ,共有 人19.【江苏省南通、徐州、扬州等六市 2018 届二模】某班 40 名学生参加普法知识竞赛,成绩都在区间上,其频率分布直方图如图所示,则成绩不低于 60 分的人数为_401,【答案】30【解析】根据频率分布直方图可得成绩不低于 60 分的学生的频率

27、为,成绩不低于 60 分的学生的人数为为 .0.15.30.25.10.75 40.75320.【江苏省常州 2018 届高三上学期期末】若一组样本数据 , , , , 的平20157x2186均数为 ,则该组样本数据的方差为( )7【答案】 2【解析】因为该组样本数据的平均数为 2017,所以 ,解得20157201862017x,则该组样本数据的方差为2019x22222570179S .21.【安徽省马鞍山市 2018 届一模】已知样本容量为 200,在样本的频率分布直方图中,共有 个小矩形,n若中间一个小矩形的面积等于其余 个小矩形面积和的 ,则该组的频数为_.1n13【答案】50【解

28、析】设 个小矩形面积和为 ,则中间小矩形面积的 ,根据直方图的性质可得1nPP,中间一个小矩形的面积等于 ,即该组的频数为 ,故答案为3,4P11,2053450.5022.【安徽省池州市 2018 届上学期期末】某种产品的广告费支出 与销售额 之间有如下对应数据(单位:xy百万元) ,根据下表求出 关于 的线性回归方程为 ,yx6.517.yx24 8y300a69则表中 的值为_a【答案】54【解析】 ,代入回归方程 可得 ,所以24568x6.517.yx50y,故答案为 .530794ay423.【甘肃省武威市一高 2018 届一模】某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如表所示:根据表中数据,问是否有 的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”95%_ (填有或没有)附: 22nadbcKd【答案】有【解析】 , ,所以有 的把握认为“南方学生22106104.76738K.23.84195%和北方学生在选用甜品的饮食习惯方面有差异”.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报