1、第2讲 统计与统计案例,专题三 概率与统计,板块三 专题突破核心考点,考情考向分析,1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等. 2.在概率与统计的交汇处命题,以解答题中档难度出现.,热点分类突破,真题押题精练,内容索引,热点分类突破,热点一 抽样方法,1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少. 2.系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. 3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.,例1 (1)(2018绵阳诊断)为了
2、解某高校高中学生的数学运算能力,从编号为0001,0002,2000的2 000名学生中采用系统抽样的方法抽取一个容量为50的样本,并把样本编号从小到大排列,已知抽取的第一个样本编号为0003,则最后一个样本编号是 A.0047 B.1663 C.1960 D.1963,解析,答案,解析 2 0005040,故最后一个样本编号为349401963.,(2)(2018东莞统考)某机构对某镇的学生的身体素质状况按年级段进行分层抽样调查,得到了如下表所示的数据,则 _.,解析,答案,37 500,(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的. (2)系统抽样又称“等距”抽样,被抽到的各
3、个号码间隔相同. (3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.,跟踪演练1 (1)(2018福州检测)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是 A.简单随机抽样 B.按性别分层抽样 C.按年龄段分层抽样 D.系统抽样,答案,解析,解析 我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健
4、步走”活动情况差异不大.了解某地区的“微信健步走”活动情况,按年龄段分层抽样,这种方式具有代表性,比较合理.,(2)(2018江西省重点中学盟校联考)要从已编号(170)的70枚最新研制的某型导弹中随机抽取7枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的7枚导弹的编号可能是 A.5,10,15,20,25,30,35 B.3,13,23,33,43,53,63 C.1,2,3,4,5,6,7 D.1,8,15,22,29,36,43,答案,解析 根据系统抽样的定义可知,编号间距为70710, 则满足条件的可能是3,13,23,33,43,53,63.,解析,热点二 用样
5、本估计总体,2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数 利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数.,(2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.,例2 (1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为 A.11 B.3 C.9 D.17
6、,答案,解析,解析 设没记清的数为x,若x2,,若2x4,则这列数为2,2,2,x,4,5,10,,若x5,则这列数为 2,2,2,4,5,x,10或2,2,2,4,5,10,x,,解析 由频率分布直方图可得年收入不超过6万的家庭的概率为 (0.0050.01)200.3, 所以年收入不超过6万的家庭大约为3 0000.3900(户).,(2)(2018龙岩质检)党的十八大以来,脱贫攻坚取得显著成绩.2013年至2016年4年间,累计脱贫5 564万人,2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.,答案,解析,某地区对当地3 000户家庭的2017年年收入情况调查统计,所得年收
7、入的频率分布直方图如图所示,数据(单位:千元)的分组依次为20,40),40,60),60,80),80,100,则年收入不超过6万的家庭大约为 A.900户 B.600户 C.300户 D.150户,(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等. (2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.,跟踪演练2 (
8、1)(2018北京朝阳区模拟)某商场对一个月内每天的顾客人数进行统计得到如图所示的样本茎叶图,则该样本的中位数和众数分别是 A.46,45 B.45,46 C.46,47 D.47,45,答案,解析,解析 由茎叶图可知,出现次数最多的是45,将所有数从小到大排列后,中间两数为45,47, 故中位数为46.,(2)(2018河南省六市模拟)为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位:元)都在10,50内,其中支出金额在30,50内的学生有117人,频率分布直方图如图所示,则n等于,答案,解析,A.180 B.160 C.150 D.200,1.线
9、性回归方程,热点三 统计案例,2.随机变量,解答,例3 (2018广东省省际名校联考)某高三理科班共有60名同学参加某次考试,从中随机挑选出5名同学,他们的数学成绩x与物理成绩y如下表:,数据表明y与x之间有较强的线性关系. (1)求y关于x的线性回归方程;,(145120)(11090)(130120)(9090)(120120)(10290)(105120)(7890)(100120)(7090) 500001804001 080,,62510002254001 350,,解答,(2)该班一名同学的数学成绩为110分,利用(1)中的回归方程,估计该同学的物理成绩;,(3)本次考试中,规定数
10、学成绩达到125分为优秀,物理成绩达到100分为优秀.若该班数学优秀率与物理优秀率分别为50%和60%,且除去抽走的5名同学外,剩下的同学中数学优秀但物理不优秀的同学共有5人.能否在犯错误的概率不超过0.01的前提下认为数学优秀与物理优秀有关?,解答,解 由题意可知,该班数学优秀人数及物理优秀人数分别为30,36. 抽出的5人中,数学优秀但物理不优秀的共1人, 故全班数学优秀但物理不优秀的共6人. 于是可以得到如下22列联表:,因此在犯错误的概率不超过0.01的前提下,可以认为数学优秀与物理优秀有关.,(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系
11、,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心( ),应引起关注. (2)独立性检验问题,要确定22列联表中的对应数据,然后代入公式求解K2即可.,跟踪演练3 (2018河南省中原名校质检)下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码x年份2013.,(1)已知y与x具有线性相关关系,求y关于x的线性回归方程,并预测2019年该百货零售企业的线下销售额;,解答,由于2 0192 0136,,所以预测2019年该百货零售企业的线下销售额为448.5万元.,(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售
12、额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?,解答,由于6.1095.024,所以可以在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关.,解 由题意可得22列联表如下:,真题押题精练,1.(2017山东改编)如图所示的茎叶图记录
13、了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为_.,真题体验,解析,3,5,答案,解析 甲组数据的中位数为65, 由甲、乙两组数据的中位数相等得y5. 又甲、乙两组数据的平均值相等,,x3.,解析,166,答案,3.(2016全国改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下列叙述不正确的是_.(填序号),各月的平均最低气温都在0 以上; 七月的平均温差比一月的平均温差大; 三月和十一月的平均最高气温基
14、本相同; 平均最高气温高于20 的月份有5个.,解析,答案,解析 由题意知,平均最高气温高于20 的有七月,八月,故不正确.,4.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取_件.,18,解析,答案,押题预测,押题依据 从茎叶图中提取数字的特征(如平均数、众数、中位数等)是高考命题的热点题型.,解析,押题依据,答案,解析 甲地用户的平均满意度分数为,乙地用户的平均满意度分数为,解析 由题图知,(0.040.12x0.140.05)21,
15、解得x0.15, 所以学习时间在6至10小时之间的频率是(0.150.14)20.58, 所求人数为1000.5858.,2.某校为了解高三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘制成频率分布直方图,如图所示,则这100名学生中学习时间在6至10小时之间的人数为_.,押题依据 频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查学生的基本分析能力,是高考的热点.,58,解析,押题依据,答案,3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:,(1)在给定的坐标系中画出表中数据的散点图;,押题依据 线性回归分析在生活中具有很强的应用价值,是高考的一个重要考点.,解答,押题依据,解 散点图如图.,解答,解答,(3)试预测加工10个零件大约需要多少小时?,解 将x10代入线性回归方程,,故预测加工10个零件大约需要8.05小时.,