1、专题三十九 统计与统计案例,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92随机抽样与样本估计总体 1.(2017课标,理3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 【答案】 A 由题图可知2014年8月到9月的月接待游客量在减少,故A错误.,考点92,
2、考点93,试做真题,高手必备,萃取高招,对点精练,2.(2016课标,理4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下面叙述不正确的是( )A.各月的平均最低气温都在0 以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温高于20 的月份有5个,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,【答案】 D 由题图可知,0 在虚线圈内,所以各月的平均最低气温都在0 以上,A正确;易知B,C正确;平均最高气温高于
3、20 的月份有3个,分别为六月、七月、八月,D错误.故选D.,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,3.(2013课标,理3)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样 【答案】 C 因为学段层次差异较大,所以在不同学段中抽取宜用分层抽样.,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,4.(2015课标,理18)某
4、公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,(2)根据用户满意度评分,将用户的满
5、意度从低到高分为三个等级:,记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,【解】 (1)两地区用户满意度评分的茎叶图如下:通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,(2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”; CA2表示事件:“A地区
6、用户的满意度等级为非常满意”; CB1表示事件:“B地区用户的满意度等级为不满意”; CB2表示事件:“B地区用户的满意度等级为满意”, 则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1CB2CA2. P(C)=P(CB1CA1CB2CA2)=P(CB1CA1)+P(CB2CA2) =P(CB1)P(CA1)+P(CB2)P(CA2).,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,1.三种抽样方法的比较,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,2.频率分布直方图的性质 (1)小长方形的面积=_. (2)各小长方形的面积之和等于1
7、.,3.茎叶图 (1)用茎叶图表示数据有两个优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. (2)茎是指中间的一列数,叶是从茎的旁边生长出来的数. 在样本数据较少时,用茎叶图表示数据的效果较好.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,4.众数、中位数、平均数,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,7.平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离
8、散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,典例导引1(1)某学校采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做视力检查.现将800名学生从1到800进行编号.已知从3348这16个数中抽到的数是39,则在第1小组116中随机抽到的数是( ) A.5 B.7 C.11 D.13 (2)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级
9、本科生中抽取_名学生.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,【解析】 (1)把800名学生分成50组,每组16人,各小组抽到的数构成一个公差为16的等差数列,39在第3组,所以第1小组抽到的数为39-32=7,故选B. (2)根据题意,应从一年级本科生中抽取的学生人数为,【答案】 (1)B (2)60,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,高招1抽样方法中的计算问题,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,典例导引2(1)为了调查某工厂工人生产某种产品的能力,随机抽查了
10、20名工人某天生产该产品的数量,产量的分组区间为45,55), 55,65),65,75),75,85),85,95,频率分布直方图如图所示,若数据落在第3组和第5组的频率和等于数据落在第4组的频率的2倍,则这20名工人中一天生产该产品的数量在75,85)内的人数是 .,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(2)为了了解高一年级学生的体能情况,某校抽取了部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,若图中从左到右各个小长方形的高之比为24171593,且样本数据落在第2小组的频数为12. 样本数据落在第2小组的频率为 ; 抽取的学生中一分钟跳
11、绳次数在第3小组的人数为 .,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,【解析】 (1)设样本数据落在75,85)内的频率为x,则由各小组的频率之和为1,可知0.02010+0.03510+x+2x=1,解得x=0.15,所以这20名工人中一天生产该产品的数量在75,85)内的人数为200.15=3. (2)因为在频率分布直方图中,各个小长方形的高之比=各个小长方形的面积之比=各组的频率之比,所以样本数据落在第2小组的频率为 因为各小组的频数之比=小长方形的高之比,所以设抽取的学生中一分钟跳绳次数在第3小组的人数为x,则417=12x,解得x=51. 【答案】 (1)3 (2
12、)0.08 51,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,高招2频率分布直方图中的规律,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,典例导引3(2017广东深圳一模)某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费. (1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式; (
13、2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值; (3)在满足(2)的条件下,估计1月份该市居民用户平均用电费用(同一组中的数据用该组区间的中点值作代表).,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(3)由题意可知 当x=50时,y=0.550=25,P(y=25)=0.1; 当x=150时,y=0.5150=
14、75,P(y=75)=0.2; 当x=250时,y=0.8250-60=140,P(y=140)=0.3; 当x=350时,y=0.8350-60=220,P(y=220)=0.2; 当x=450时,y=450-140=310,P(y=310)=0.15; 当x=550时,y=550-140=410,P(y=410)=0.05. 故 =250.1+750.2+1400.3+2200.2+3100.15+ 4100.05=170.5(元).,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,高招3“组中值”的应用技巧,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题
15、,高手必备,萃取高招,对点精练,考点92,考点93,(2)某城市100户居民的月平均用电量(单位:千瓦时),以160,180), 180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图.求直方图中x的值; 求月平均用电量的众数和中位数; 在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(3)某车间20名工人年龄数据如下表:,求
16、这20名工人年龄的众数与极差; 以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; 求这20名工人年龄的方差.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,【答案】 B,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,高招4用样本的数字特征估计总体问题的类型及解法,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,典例导引5(2017广东模拟)某市为了解各校国学课程的教学效果,组织全市各学校高二年级全体学生参加了国学知识水平测试,测
17、试成绩从高到低依次分为A,B,C,D四个等级.随机调阅了甲、乙两所学校各60名学生的成绩,得到如下的分布图:,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(1)试确定图中a与b的值; (2)若将等级A,B,C,D依次按照90分、80分、60分、50分转换成分数,试分别估计两校学生成绩的平均值; (3)从两校获得A等级的同学中按比例抽取5人参加集训,集训后由于成绩相当,决定从中随机选2人代表本市参加省级比赛,求两人来自同一学校的概率.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,高招5解决统计与概率综合问
18、题的规律,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,1.(2017广东佛山模拟)本学期王老师任教两个平行班高三A班、高三B班、两个班都是50名学生,如图反映的是两个班在本学期5次数学测试中的班级平均分对比,根据图表判断下列结论不正确的是( ) 历次数学测试班级平均分跟踪A.A班的数学成绩平均水平好于B班 B.B班的数学成绩没有A班稳定 C.下次考试B班的数学平均分数高于A班 D.在第1次考试中,A,B两个班的总平均分为98,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,2.(2017湖南长沙一模)空气质
19、量指数(简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级:050为优;51100为良;101150为轻度污染;151200为中度污染;201300为重度污染;大于300为严重污染.某环保人士从当地某年的AQI记录数据中,随机抽取10天的AQI数据,用茎叶图记录如下.根据该统计数据,估计此地该年AQI大于100的天数约为 .(该年为365天) 【答案】 146 【解析】 茎叶图中大于100的有4天,所以 ,解得n=146,故该年AQI大于100的天数约为146.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,3.(2017广西南宁一摸)某购物中心为了了解顾客
20、使用新推出的某购物卡的顾客的年龄分布情况,随机调查了100位到购物中心购物的顾客年龄,并整理后画出频率分布直方图如图所示,年龄落在区间55,65),65,75),75,85内的频率之比为421.(1)求顾客年龄值落在区间75,85内的频率; (2)拟利用分层抽样从年龄在55,65),65,75)的顾客中选取6人召开一个座谈会,现从这6人中选出2人,求这两人在不同年龄组的概率.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,【解】 (1)设顾客年龄值落在区间75,85内的频率为x,则顾客年龄值落在区间55,65),65,75)内的频率分别为4x和2x. 依题意得(0.004+0.0
21、12+0.019+0.030)10+4x+2x+x=1,解得x=0.05,所以顾客年龄值落在区间75,85内的频率为0.05. (2)根据题意得,需从年龄在55,65),65,75)中分别抽取4人和2人.设年龄在55,65)的4人分别为a,b,c,d,在65,75)的2人分别为m,n,则所抽取的结果共有15种:(a,b),(a,c),(a,d),(a,m),(a,n),(b,c),(b,d),(b,m), (b,n),(c,d),(c,m),(c,n),(d,m),(d,n),(m,n). 设“这两人在不同年龄组”为事件A,事件A包含的基本事件有8种: (a,m),(a,n),(b,m),(b
22、,n),(c,m),(c,n),(d,m),(d,n).,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,考点93变量间的相关关系与独立性检验,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,2.(2017课标,理18)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖
23、法的箱产量不低于50 kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;,(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,【解】 (1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于50 kg的频率为 (0.012+0.014+0.024+0.034+0.040)5=0.62, 故P(B)的估计值为0.62. 新养殖法的
24、箱产量不低于50 kg的频率为 (0.068+0.046+0.010+0.008)5=0.66. 故P(C)的估计值为0.66. 因此,事件A的概率估计值为0.620.66=0.409 2.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(2)根据箱产量的频率分布直方图得列联表,(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)5=0.340.5,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,3.(2016课标,理18)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年
25、份代码1-7分别对应年份2008-2014. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,4.(2015课标,理19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:
26、千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,3.独立性检验 列出的两个变量的频数表称作列联表.假设有两个分类变量X,Y,它们的可能取值分别为x1,x2和y1,y2
27、,其样本频数22列联表为:,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,典例导引6(2017湖南郴州第二次质检)为了探究车流量与PM2.5的浓度是否相关,现采集到北方某城市2016年12月份某星期星期一到星期日某一时间段车流量与PM2.5的数据如下表:,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(1)由散点图知y与x具有线性相关关系,求y关于x的线性回归方程; (2)利用(1)所求的回归方程,预测该市车流量为8万辆时PM2.5的浓度; 规定:当一天内PM2.5的浓度平均值在(0,50内,空气质量等级为优;当一天内PM2.5的浓度平均值在(50,100内,空气质
28、量等级为良.为使该市某日空气质量为优或良,则应控制当天车流量在多少万辆以内?(结果以万辆为单位,保留整数.),试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,高招6线性回归方程的求解规律,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,典例导引7某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时). (1)应收集
29、多少名女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为0,2,(2,4, (4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过4小时的概率.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,(3)在样本数据中,有60名女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,【解】 (1)300
30、=90,故应收集90名女生的样本数据. (2)方法一(通法):由频率分布直方图,得该校学生每周平均体育运动时间超过4小时的概率的估计值为(0.150+0.125+0.075+0.025)2=0.75. 方法二(优法):由频率分布直方图,得1-2(0.100+0.025)=0.75,故该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. (3)由(2)知,300位学生中有3000.75=225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:,试做真题
31、,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,高招7独立性检验的一般步骤,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,2.(2017四川四市一模)张三同学从7岁起到13岁每年生日时对自己的身高测量后记录如下表:,(1)求身高y关于年龄x的线性回归方程; (2)利用(1)中的线性回归方程,分析张三同学7岁至13岁身高的变化情况,如17岁之前都符合这一变化,请预测张三同学15岁时的身高. 附:回归直
32、线的斜率和截距的最小二乘法估计公式分别为:,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,3.(2017河北石家庄一模)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成的一个样本,对他们的这项血液指标进行了检测,得到了如下茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.(1)依据上述样本数据研究此项血液指标与性别的关系,列出22列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系? (2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望.,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,试做真题,高手必备,萃取高招,对点精练,考点92,考点93,