1、随堂讲义第一部分知识复习专题 专题七概率与统计、推理与证明、算法初步、框图、复数第二讲统计、统计案例,从近三年高考试题的统计分析来看,抽样方法,频率分布直方图、茎叶图、样本的数字特征等多以选择题、填空题的形式考查,一般为容易题回归分析与独立性检验是高考的新趋势预测2015年高考中,本讲内容仍为考查的热点之一,有关统计与概率、统计案例的解答题要引起足够的重视,栏目链接,Z 主 干考点 梳 理,考点1 随机抽样,Z 主 干考点 梳 理,三种抽样方法的比较列表如下:,较少,简单随机,较多,简单随机,系统,差异,栏目链接,考点2 用样本估计总体,Z 主 干考点 梳 理,1频率分布直方图(1)绘制频率分
2、布直方图的步骤求_;决定_;将数据分组;列_;画_(2)由频率分布直方图估计平均数平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,极差,组距和组数,频率分布表,频率分布直方图,栏目链接,Z 主 干考点 梳 理,栏目链接,考点3 线性回归方程,Z 主 干考点 梳 理,栏目链接,考点4 回归分析及独立性检验,Z 主 干考点 梳 理,1回归分析的基本思想及其初步应用对相关系数r:(1)r0,表明两个变量_;(2)r0,表明两个变量_;(3)r的绝对值越近1,表明两个变量的线性相关性_;(4)r的绝对值越近0,表明两个变量的线性相关性_;(5)当|r|大于0.75时,认为两个
3、变量有很强的_,正相关,负相关,越强,越弱,线性相关关系,栏目链接,Z 主 干考点 梳 理,2独立性检验假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:,栏目链接,Z 主 干考点 梳 理,栏目链接,考点自测,Z 主 干考点 梳 理,1某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生,15,栏目链接,Z 主 干考点 梳 理,2(2014山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12
4、,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(),C,栏目链接,Z 主 干考点 梳 理,A6 B8 C12 D18,栏目链接,Z 主 干考点 梳 理,3对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图1;对变量u ,v 有观测数据(ui,vi)(i1,2,10),得散点图2.由这两个散点图可以判断(),C,栏目链接,G 高考热点突 破,A变量x与y正相关,u与v正相关B变量x与y正相关,
5、u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关,由这两个散点图可以判断,变量x与y负相关,u与v正相关故选C.,栏目链接,G 高考热点突 破,C,栏目链接,栏目链接,突破点1 随机抽样,G 高考热点突 破,例1 某校共有学生2 000名,各年级男、女生人数如下表所示已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为(),A24B18C16D12,栏目链接,C,G 高考热点突 破,思路点拨:本题可以先根据概率求出二年级女生人数,然后算出三年级的总人数,最后算出在三年级抽取的人数,栏目链接
6、,G 高考热点突 破,规律方法(1)解决此类题目首先要深刻理解各种抽样方法的特点和适用范围,如分层抽样,适用于数目较多且各部分之间具有明显差异的总体(2)系统抽样中编号的抽取和分层抽样中各层人数的确定是高考重点考查的内容,栏目链接,G 高考热点突 破,跟踪训练,1(2014天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取_名学生,60,栏目链接,突破2 频率分布直方图或频率分布表,G 高考热点突 破,例2某地区为了
7、解7080岁老人的日平均睡眠时间(单位:h),随机选择了50位老人进行调查,下表是这50位老人日睡眠时间的频率分布表,栏目链接,G 高考热点突 破,在上述统计数据的分析中,一部分计算见算法流程图,则输出的S的值是_,栏目链接,G 高考热点突 破,由算法流程图知:SG1F1G2F2G3F3G4F4G5F54.50.125.50.26.50.47.50.28.50.086.42.,6.42,栏目链接,G 高考热点突 破,规律方法(1)解决该类问题时应正确理解图表中各个量的意义,从图表中掌握信息是解决该类问题的关键(2)本题中S实际上是样本的近似平均数我们可以根据频率分布表或频率分布直方图来大致求出
8、样本的平均数,具体作法是,用频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,栏目链接,G 高考热点突 破,跟踪训练,2某企业3个分厂同时生产同一种电子产品,第一、二、三分厂的产量之比为121,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为_h.,1 013,栏目链接,G 高考热点突 破,栏目链接,突破点3 众数、中位数、平均数、方差、标准差,G 高考热点突 破,例3随机抽取某中
9、学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如下图所示,栏目链接,G 高考热点突 破,(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm的同学被抽中的概率,栏目链接,G 高考热点突 破,栏目链接,G 高考热点突 破,规律方法(1)本题考查了茎叶图的识图问题和平均数的计算,其中从茎叶图中读出数据是关键,为此,首先要弄清“茎”和“叶”分别代表什么(2)要熟练掌握众数、中位数、平均数、方差、标准差的计算方法,栏目链接,跟踪训练,G 高考热点突 破,3在发生某公共卫
10、生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A甲地:总体均值为3,中位数为4B乙地:总体均值为1,总体方差大于0C丙地:中位数为2,众数为3D丁地:总体均值为2,总体方差为3,D,栏目链接,G 高考热点突 破,根据信息可知,连续10天内,每天新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存
11、在,那么方差不会为3.故选D.,栏目链接,突破点4 线性回归方程,G 高考热点突 破,例4(2014新课标卷)某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:,(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入,栏目链接,G 高考热点突 破,附:回归直线的斜率和截距的最小二乘法估计公式分别为:,栏目链接,G 高考热点突 破,栏目链接,G 高考热点突 破,规律方法(1)正确作出散点图,由散点图可知两个变量是否具有线性相关关系,若具有线性相关关系,则
12、可通过线性回归方程估计和预测变量的值(2)正确记忆求b,a的公式和准确地计算,是解题的保证,栏目链接,G 高考热点突 破,跟踪训练,A,栏目链接,G 高考热点突 破,栏目链接,突破点5 独立性检验,G 高考热点突 破,例5为考察是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下22列联表:,利用22列联表的独立性检验判断是否喜欢饮酒与性别有无关系,栏目链接,G 高考热点突 破,栏目链接,G 高考热点突 破,栏目链接,G 高考热点突 破,跟踪训练,5在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动(1)根据以上数据建立一个22列联表;(2)判断休闲方式与性别是否有关系,栏目链接,G 高考热点突 破,(1)22列联表如下:,栏目链接,G 高考热点突 破,栏目链接,G 高考热点突 破,小结反思1三种简单随机抽样方法要注意记清它们的区别,避免混淆;2频率分布直方图或频率分布表中信息要能正确理解,注意区别直方图与条形图;3对样本总体的估计注意用好几个特殊数:方差、标准差、众数、中位数、平均数等,栏目链接,