压缩包目录
-
全部
- 【步步高】(江苏专用)2017版高考数学一轮复习 第十一章 统计 11.1 随机抽样 理.doc--点击预览
- 【步步高】(江苏专用)2017版高考数学一轮复习 第十一章 统计 11.1 随机抽样课件 理.ppt
- 【步步高】(江苏专用)2017版高考数学一轮复习 第十一章 统计 11.2 用样本估计总体 理.doc--点击预览
- 【步步高】(江苏专用)2017版高考数学一轮复习 第十一章 统计 11.2 用样本估计总体课件 理.ppt
文件预览区
|
|
资源描述
1【步步高】 (江苏专用)2017 版高考数学一轮复习 第十一章 统计 11.1 随机抽样 理1.简单随机抽样(1)定义:从个体数为 N 的总体中逐个不放回地取出 n 个个体作为样本( nN),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数表法.2.系统抽样(1)定义:将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法称为系统抽样.(2)假设要从容量为 N 的总体中抽取容量为 n 的样本,系统抽样的步骤为:①采用随机的方法将总体中的 N 个个体编号;②将编号按间隔 k 分段,当 是整数时,取 k= ;当 不是整数时,从总体中剔除一些个体,Nn Nn Nn使剩下的总体中个体的个数 N′能被 n 整除,这时取 k= ,并将剩下的总体重新编号;N′n(3)在第一段中用简单随机抽样确定起始的个体编号 l;(4)按照一定的规则抽取样本,通常将编号为 l, l+ k, l+2 k,…, l+( n-1) k 的个体抽出.3.分层抽样(1)定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层” .(2)分层抽样的步骤是:①将总体按一定标准分层;②计算各层的个体数与总体的个体数的比;③按各层个体数占总体的个体数的比确定各层应抽取的样本容量;④在每一层进行抽样(可用简单随机抽样或系统抽样).(3)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样.2【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √ )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × )(3)系统抽样在起始部分抽样时采用简单随机抽样.( √ )(4)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的样本,需要剔除 2 个学生,这样对被剔除者不公平.( × )(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )1.(教材改编)某公司有员工 500 人,其中不到 35 岁的有 125 人,35~49 岁的有 280 人,50 岁以上的有 95 人,为了调查员工的身体健康状况,从中抽取 100 名员工,则应在这三个年龄段分别抽取人数为______________.答案 25,56,19解析 因为 125∶280∶95=25∶56∶19,所以抽取人数分别为 25 人,56 人,19 人.2.(2015·四川改编)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是____________.答案 分层抽样解析 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.将参加英语口语测试的 1 000 名学生编号为 000,001,002,…,999,从中抽取一个容量为 50 的样本,按系统抽样的方法分为 50 组,如果第一组编号为 000,001,002,…,019,且第一组随机抽取的编号为 015,则抽取的第 35 个编号为________.答案 695解析 由题意可知,第一组随机抽取的编号 l=15,分段间隔数 k= = =20,则抽取的第 35 个编号为 a35=15+(35-1)×20=695.Nn 1 000504.(教材改编)某公司共有 1 000 名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为 80 的样本,已告知广告部门被抽取了 4 个员工,则广告部门的员工人数为________.答案 50解析 = , x=50.1 00080 x435.(2014·天津)某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为 4∶5∶5∶6,则应从一年级本科生中抽取________名学生.答案 60解析 根据题意,应从一年级本科生中抽取的人数为 ×300=60.44+ 5+ 5+ 6题型一 简单随机抽样例 1 (1)总体由编号为 01,02,…,19,20 的 20 个个体组成.利用下面的随机数表选取 5个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为________.7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481(2)下列抽取样本的方式不属于简单随机抽样的有________.①从无限多个个体中抽取 100 个个体作为样本.②盒子里共有 80 个零件,从中选出 5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从 20 件玩具中一次性抽取 3 件进行质量检验.④某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.答案 (1)01 (2)①②③④解析 (1)由题意知前 5 个个体的编号为 08,02,14,07,01.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的 5 名同学是 56 名中特指的,不存在随机性,不是等可能抽样.思维升华 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数表法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数4字舍去.下列抽样试验中,适合用抽签法的有________.①从某厂生产的 5 000 件产品中抽取 600 件进行质量检验;②从某厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验;③从甲、乙两厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验;④从某厂生产的 5 000 件产品中抽取 10 件进行质量检验.答案 ②解析 ①,④中的总体中个体数较多,不适宜抽签法,③中甲、乙两厂的产品质量有区别,也不适宜抽签法.题型二 系统抽样例 2 (1)(2015·湖南)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为 1~35 号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间[139,151]上的运动员人数是________.(2)某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调查,将 840 人按1,2,…,840 随机编号,则抽取的 42 人中,编号落入区间[481,720]的人数为________.答案 (1)4 (2)12解析 (1)由题意知,将 1~35 号分成 7 组,每组 5 名运动员,成绩落在区间[139,151]的运动员共有 4 组,故由系统抽样法知,共抽取 4 名.(2)由 =20,即每 20 人抽取 1 人,所以抽取编号落入区间[481,720]的人数为 =84042 720- 48020=12.24020引申探究1.本例(2)中条件不变,若第三组抽得的号码为 44,则在第八组中抽得的号码是________.答案 144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取 8 人,则样本容量为________.答案 285解析 因为在编号[481,720]中共有 720-480=240 人,又在[481,720]中抽取 8 人,所以抽样比应为 240∶8=30∶1,又因为单位职工共有 840 人,所以应抽取的样本容量为=28.84030思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.将参加夏令营的 600 名学生编号为 001,002,…,600.采用系统抽样方法抽取一个容量为 50 的样本,且随机抽得的号码为 003.这 600 名学生分住在三个营区,从 001 到300 在第Ⅰ营区,从 301 到 495 在第Ⅱ营区,从 496 到 600 在第Ⅲ营区,三个营区被抽中的人数依次为______________.答案 25,17,8解析 由题意及系统抽样的定义可知,将这 600 名学生按编号依次分成 50 组,每一组各有12 名学生,第 k(k∈N *)组抽中的号码是 3+12( k-1).令 3+12( k-1)≤300 得 k≤ ,因此第Ⅰ营区被抽中的人数是 25;1034令 3003+12( k-1)≤495 得 k≤42,因此第Ⅱ营区被抽中的人数是 42-25=17.故抽取1034三个营的人数分别为 25,17,8.题型三 分层抽样命题点 1 求总体或样本容量例 3 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为 120 件,80 件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为 n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=________.答案 13解析 ∵ = ,∴ n=13.360 n120+ 80+ 60命题点 2 求某层入样的个体数例 4 (2015·福建)某校高一年级有 900 名学生,其中女生 400 名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为 45 的样本,则应抽取的男生人数为________.答案 25解析 由题意知,男生共有 500 名,根据分层抽样的特点,在容量为 45 的样本中男生应抽取人数:45× =25.500900思维升华 分层抽样问题类型及解题思路6(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)(2014· 广东改编 )已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为____________.(2)(2014·湖北)甲、乙两套设备生产的同类型产品共 4 800 件,采用分层抽样的方法从中抽取一个容量为 80 的样本进行质量检测.若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为________件.答案 (1)200,20 (2)1 800解析 (1)该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为 10 000×2%=200,其中抽取的高中生近视人数为 2 000×2%×50%=20.(2)设乙设备生产的产品总数为 x 件,则甲设备生产的产品总数为(4 800- x)件.由分层抽样特点,结合题意可得 = ,解得 x=1 800.5080 4 800- x4 800五审图表找规律典例 (14 分)某单位有 2 000 名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数 管理 技术开发 营销 生产 共计老年 40 40 40 80 200中年 80 120 160 240 600青年 40 160 280 720 1 200共计 160 320 480 1 040 2 000(1)若要抽取 40 人调查身体状况,则应怎样抽样?(2)若要开一个 25 人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?7(3)若要抽 20 人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取 40 人调查身体状况↓(观察图表中的人数分类统计情况)样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样↓要开一个 25 人的座谈会↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响↓(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽 20 人调查对广州亚运会举办情况的了解↓可认为亚运会是大众体育盛会,一个单位人员对情,况了解相当将单位人员看作一个整体↓(从表中数据看总人数为 2 000 人)人员较多,可采用系统抽样规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取,抽取比例为 = .[1 分]402 000 150200× =4(人),600× =12(人),150 1501 200× =24(人).150故老年人、中年人、青年人各抽取 4 人、12 人、24 人.[5 分](2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,抽取比例为 = ,[6 分]252 000 180160× =2(人),320× =4(人),180 180480× =6(人),1 040× =13(人),[9 分]180 1808故管理、技术开发、营销、生产各部门抽取 2 人、4 人、6 人、13 人.[10 分](3)用系统抽样,对全部 2 000 人随机编号,号码从 0001~2000,每 100 号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加 100,200,…,1 900,共 20 人组成一个样本.[14 分]温馨提醒 (1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.[方法与技巧]1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.[失误与防范]进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.A 组 专项基础训练(时间:30 分钟)1.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是________.①简单随机抽样;②按性别分层抽样;③按学段分层抽样;9④系统抽样.答案 ③解析 不同的学段在视力状况上有所差异,所以应该按照学段分层抽样.2.某校选修乒乓球课程的学生中,高一年级有 30 名,高二年级有 40 名.现用分层抽样的方法在这 70 名学生中抽取一个样本,已知在高一年级的学生中抽取了 6 名,则在高二年级的学生中应抽取的人数为________.答案 8解析 设样本容量为 N,则 N× =6,∴ N=14,3070∴高二年级所抽学生人数为 14× =8.40703.某初级中学有学生 270 人,其中一年级 108 人,二、三年级各 81 人,现要利用抽样方法抽取 10 人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为 1,2,…,270,使用系统抽样时,将学生统一随机编号为 1,2,…,270,并将整个编号依次分为 10 段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250②5,9,100,107,111,121,180,195,200,265③11,38,65,92,119,146,173,200,227,254④30,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是________.(填字母)a.②、③都不能为系统抽样 b.②、④都不能为分层抽样c.①、④都可能为系统抽样 d.①、③都可能为分层抽样答案 d解析 因为③为系统抽样,所以 a 不对;因为②为分层抽样,所以 b 不对;因为④不为系统抽样,所以 c 不对.4.从编号为 1~50 的 50 枚最新研制的某种型号的导弹中随机抽取 5 枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取 5 枚导弹的编号可能是________.①5,10,15,20,25 ②3,13,23,33,43③1,2,3,4,5 ④2,4,6,16,32答案 ②解析 间隔距离为 10,故可能的编号是 3,13,23,33,43.5.(2015·北京改编)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有 320 人,则该样本中的老年教师人数为10________.类别 人数老年教师 900中年教师 1 800青年教师 1 600合计 4 300答案 180解析 由题意得,抽样比为 = ,∴该样本的老年教师人数为 900× =180(人).3201 600 15 156.某学校高一、高二、高三年级的学生人数之比为 3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为 50 的样本,则应从高二年级抽取________名学生.答案 15解析 抽取比例与学生比例一致.设应从高二年级抽取 x 名学生,则 x∶50=3∶10.解得 x=15.7.某校共有学生 2 000 名,各年级男、女学生人数如下表.已知在全校学生中随机抽取 1名,抽到二年级女生的概率是 0.19.现用分层抽样的方法在全校抽取 64 名学生,则应在三年级抽取的学生人数为________.一年级 二年级 三年级女生 373 x y男生 377 370 z答案 16解析 依题意可知二年级的女生有 380 人,那么三年级的学生人数应该是 2 000-373-377-380-370=500,即总体中各个年级的人数比为 3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为 64× =16.288.用系统抽样法从 160 名学生中抽取容量为 20 的样本,将 160 名学生从 1~160 编号,按编号顺序平均分成 20 组(1~8 号,9~16 号,…,153~160 号),若第 16 组抽出的号码为123,则第 2 组中应抽出个体的号码是________.答案 11解析 由题意可知,系统抽样的组数为 20,间隔为 8,设第 1 组抽出的号码为 x,则由系统抽样的法则可知,第 n 组抽出个体的号码应该为 x+( n-1)×8,所以第 16 组应抽出的号码为 x+(16-1)×8=123,解得 x=3,所以第 2 组中应抽出个体的号码为 3+(2-1)×8=11.9.将某班的 60 名学生编号为 01,02,…,60,采用系统抽样方法抽取一个容量为 5 的样本,且随机抽得的一个号码为 04,则剩下的四个号码依次是______________.11答案 16,28,40,52解析 编号组数为 5,间隔为 =12,605因为在第一组抽得 04 号:4+12=16,16+12=28,28+12=40,40+12=52,所以其余 4 个号码为 16,28,40,52.10.某政府机关有在编人员 100 人,其中副处级以上干部 10 人,一般干部 70 人,工人 20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为 20 的样本,试确定用何种方法抽取,请具体实施抽取.解 用分层抽样方法抽取.具体实施抽取如下:(1)∵20∶100=1∶5,∴ =2, =14, =4,105 705 205∴从副处级以上干部中抽取 2 人,从一般干部中抽取 14 人,从工人中抽取 4 人.(2)副处级以上干部与工人的人数较少,他们分别按 1~10 编号与 1~20 编号,然后采用抽签法分别抽取 2 人和 4 人;对一般干部 70 人采用 00,01,02,…,69 编号,然后用随机数表法抽取 14 人.(3)将 2 人,4 人,14 人的编号汇合在一起就取得了容量为 20 的样本.B 组 专项能力提升(时间:20 分钟)11.(2014·湖南改编)对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1, p2, p3,则________.① p1= p2p3 ② p2= p3p1③ p1= p3p2 ④ p1= p2= p3答案 ④解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此 p1= p2= p3.12.采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32 人中,编号落入区间[1,450]的人做问卷 A,编号落入区间[451,750]的人做问卷 B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为________.答案 10解析 由系统抽样的特点知:抽取号码的间隔为 =30,抽取的号码依次为960329,39,69,…,939.落入区间[451,750]的有 459,489,…,729,这些数构成首项为 459,公12差为 30 的等差数列,设有 n 项,显然有 729=459+( n-1)×30,解得 n=10.所以做问卷 B的有 10 人.13.200 名职工年龄分布如图所示,从中随机抽取 40 名职工作样本,采用系统抽样方法,按 1~200 编号,分为 40 组,分别为 1~5,6~10,…,196~200,第 5 组抽取号码为 22,第 8 组抽取号码为________.若采用分层抽样,40 岁以下年龄段应抽取________人.答案 37 20解析 将 1~200 编号分为 40 组,则每组的间隔为 5,其中第 5 组抽取号码为 22,则第 8 组抽取的号码应为 22+3×5=37;由已知条件 200 名职工中 40 岁以下的职工人数为200×50%=100,设在 40 岁以下年龄段中应抽取 x 人,则 = ,解得 x=20.40200 x10014.一个总体中有 90 个个体,随机编号 0,1,2,…,89,依从小到大的编号顺序平均分成9 个小组,组号依次为 1,2,3,…,9.现用系统抽样方法抽取一个容量为 9 的样本,规定如果在第 1 组随机抽取的号码为 m,那么在第 k 组中抽取的号码个位数字与 m+ k 的个位数字相同,若 m=8,则在第 8 组中抽取的号码是________.答案 76解析 由题意知: m=8, k=8,则 m+ k=16,也就是第 8 组抽取的号码个位数字为 6,十位数字为 8-1=7,故抽取的号码为 76.15.某公路设计院有工程师 6 人,技术员 12 人,技工 18 人,要从这些人中抽取 n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加 1 个,则在采用系统抽样时,需要在总体中先剔除 1 个个体,求 n.解 总体容量为 6+12+18=36.当样本容量是 n 时,由题意知,系统抽样的间隔为 ,分层抽样的比例是 ,抽取的工程师36n n36人数为 ×6= ,技术员人数为 ×12= ,技工人数为 ×18= ,n36 n6 n36 n3 n36 n2所以 n 应是 6 的倍数,36 的约数,即 n=6,12,18.当样本容量为( n+1)时,总体容量是 35 人,系统抽样的间隔为 ,因为 必须是整数,35n+ 1 35n+ 1所以 n 只能取 6.即样本容量 n=6.1【步步高】 (江苏专用)2017 版高考数学一轮复习 第十一章 统计 11.2 用样本估计总体 理1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体分布的密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s= .1n[ x1- x 2+ x2- x 2+ …+ xn- x 2](3)方差: s2= [(x1- )2+( x2- )2+…+( xn- )2](xn是样本数据, n 是样本容量, 是样1n x x x x本平均数).【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示 ,频率=组距× .频 率组 距 频 率组 距(2)频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中组距是一个固2定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据 x1, x2,…, xn的平均数为 ,那么 mx1+ a, mx2+ a, mx3+ a,…, mxn+ a 的平均x数是 m + a.x(2)数据 x1, x2,…, xn的方差为 s2.①数据 x1+ a, x2+ a,…, xn+ a 的方差也为 s2;②数据 ax1, ax2,…, axn的方差为 a2s2.【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )1.(2015·陕西改编)某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校女教师的人数为________.答案 137解析 由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.2.若某校高一年级 8 个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.答案 91.5 和 91.5解析 ∵这组数据由小到大排列为 87,89,90,91,92,93,94,96,∴中位数为 ×(91+92)12=91.5.3平均数为 ×(87+89+90+91+92+93+94+96)18=91.5.3.在“世界读书日”前夕,为了了解某地 5 000 名居民某天的阅读时间,从中抽取了 200名居民的阅读时间进行统计分析.在这个问题中,5 000 名居民的阅读时间的全体是________.答案 总体解析 调查的目的是“了解某地 5 000 名居民某天的阅读时间” ,所以“5 000 名居民的阅读时间的全体”是调查的总体.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了 11 场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案 19,135.(教材改编)甲、乙两人在相同条件下各射靶 10 次,每次命中环数如下:甲 4 7 10 9 5 6 8 6 8 8乙 7 8 6 8 6 7 8 7 5 9试问 10 次射靶的情况较稳定的是________.答案 乙解析 甲 = =7.1,x4+ 7+ 10+ 9+ 5+ 6+ 8+ 6+ 8+ 810乙 = =7.1.x7+ 8+ 6+ 8+ 6+ 7+ 8+ 7+ 5+ 910s = [(4-7.1) 2+(7-7.1) 2+…+(8-7.1) 2]=3.09,2甲110s = [(7-7.1) 2+(8-7.1) 2+…+(9-7.1) 2]=1.29.2乙110s s ,2甲 2乙∴乙较稳定.4题型一 频率分布直方图的绘制与应用例 1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从 A, B 两地区分别随机调查了 40 个用户,根据用户对产品的满意度评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图图①B 地区用户满意度评分的频数分布表满意度评分分组 [50,60)[60,70) [70,80)[80,90)[90,100]频数 2 8 14 10 6(1)在图②中作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B 地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分 低于 70 分 70 分到 89 分 不低于 90 分满意度等级 不满意 满意 非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解 (1)如图所示.5通过两地区用户满意度评分的频率分布直方图可以看出, B 地区用户满意度评分的平均值高于 A 地区用户满意度评分的平均值; B 地区用户满意度评分比较集中,而 A 地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记 CA表示事件:“ A 地区用户的满意度等级为不满意” ; CB表示事件:“ B 地区用户的满意度等级为不满意” .由直方图得 P(CA)的估计值为(0.01+0.02+0.03)×10=0.6, P(CB)的估计值为(0.005+0.02)×10=0.25.所以 A 地区用户的满意度等级为不满意的概率大.思维升华 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为 1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为 =50,20 0.16+ 0.24 ×1所以第三组人数为 50×0.36=18,有疗效的人数为 18-6=12.(2)某校从参加高一年级期中考试的学生中随机抽出 60 名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:6①求分数在[70,80)内的频率,并补全这个频率分布直方图;②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解 ①设分数在[70,80)内的频率为 x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+ x=1,可得 x=0.3,所以频率分布直方图如图所示.②平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).题型二 茎叶图的应用例 2 (1)(2015·山东)为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温;②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温;③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为________.(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x, y 的值分别为__________.7答案 (1)①④ (2)5,8解析 (1)甲地 5 天的气温为:26,28,29,31,31,其平均数为 甲 = =29;x26+ 28+ 29+ 31+ 315方差为 s = [(26-29) 2+(28-29) 2+(29-29) 2+(31-29) 2+(31-29) 2]=3.6;2甲15标准差为 s 甲 = .3.6乙地 5 天的气温为:28,29,30,31,32,其平均数为 乙 = =30;x28+ 29+ 30+ 31+ 325方差为 s = [(28-30) 2+(29-30) 2+(30-30) 2+(31-30) 2+(32-30) 2]=2;2乙15标准差为 s 乙 = .2∴ 甲 < 乙 , s 甲 > s 乙.x x(2)由茎叶图及已知得 x=5,又乙组数据的平均数为 16.8,即=16.8,解得 y=8.9+ 15+ 10+ y+ 18+ 245引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好.解 由原题可知 x=5,则甲组平均分为 =17.4.9+ 12+ 15+ 24+ 275而乙组平均分为 16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差.解 ①由茎叶图知,乙组中五名学生的成绩为 9,15,18,18,24.故中位数为 18,众数为 18.② s2= [(9-16.8) 2+(15-16.8) 2+(18-16.8) 2×2+(24-16.8) 2]=23.76.15思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(2014·课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了 50位市民.根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:8(1)分别估计该市的市民对甲,乙两部门评分的中位数;(2)分别估计该市的市民对甲,乙两部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民对甲,乙两部门的评价.解 (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是 67.66+ 682(2)由所给茎叶图知,50 位市民对甲,乙部门的评分高于 90 的比率分别为=0.1, =0.16,故该市的市民对甲,乙部门的评分高于 90 的概率的估计值分别为550 8500.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.)题型三 用样本的数字特征估计总体的数字特征例 3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.9(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解 (1)由题图象可得甲、乙两人五次测试的成绩分别为甲:10 分,13 分,12 分,14 分,16 分;乙:13 分,14 分,12 分,12 分,14 分.甲 = =13;x10+ 13+ 12+ 14+ 165乙 = =13,x13+ 14+ 12+ 12+ 145s = [(10-13) 2+(13-13) 2+(12-13) 2+(14-13) 2+(16-13) 2]=4;2甲15s = [(13-13) 2+(14-13) 2+(12-13) 2+(12-13) 2+(14-13) 2]=0.8.2乙15(2)由 s s 可知乙的成绩较稳定.2甲 2乙从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2015·广东)某工厂 36 名工人的年龄数据如下表.工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄1 40 10 36 19 27 28 342 44 11 31 20 43 29 393 40 12 38 21 41 30 434 41 13 39 22 37 31 385 33 14 43 23 34 32 426 40 15 45 24 42 33 537 45 16 39 25 37 34 378 42 17 38 26 44 35 499 43 18 36 27 42 36 39(1)用系统抽样法从 36 名工人中抽取容量为 9 的样本,且在第一分段里用随机抽样法抽到的年龄数据为 44,列出样本的年龄数据;(2)计算(1)中样本的均值 和方差 s2;x(3)36 名工人中年龄在 - s 与 + s 之间的有多少人?所占的百分比是多少(精确到 0.01%)?x x解 (1)44,40,36,43,36,37,44,43,37.10(2) = =40.x44+ 40+ 36+ 43+ 36+ 37+ 44+ 43+ 379s2= [(44-40) 2+(40-40) 2+(36-40) 2+(43-40) 2+(36-40) 2+(37-40) 2+(44-40)192+(43-40) 2+(37-40) 2]= .1009(3)40- = ,40+ = 在 的有 23 个,占 63.89%.103 1103 103 1303 (1103, 1303)9.高考中频率分布直方图的应用典例 (14 分)(2015·广东)某城市 100 户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中 x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在[220,240)的用户中应抽取多少户?规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+ x+0.005+0.002 5)×20=1 得: x=0.007 5,所以直方图中 x 的值是 0.007 5.[3 分](2)月平均用电量的众数是 =230.[4 分]220+ 2402因为(0.002+0.009 5+0.011)×20=0.45a2② a2a1③ a1= a2④ a1, a2的大小与 m 的值有关答案 ②解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是 20,乙选手叶上的数字之和是 25,故 a2a1.6.样本中共有五个个体,其值分别为 a,0,1,2,3.若该样本的平均值为 1,则样本方差为___________.答案 2解析 由题意可知样本的平均值为 1,所以 =1,解得 a=-1,所以样本的方a+ 0+ 1+ 2+ 35差为 [(-1-1) 2+(0-1) 2+(1-1) 2+(2-1) 2+(3-1) 2]=2.157.将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示:则 7 个剩余分数的方差为________.答案 367解析 由题意知 =91,解得 x=4.所以 s2= [(87-91)87+ 94+ 90+ 91+ 90+ 90+ x+ 917 172+(94-91) 2+(90-91) 2+(91-91) 2+(90-91) 2+(94-91) 2+(91-91) 2]= (16+9+1+0+1+9+0)= .17 3678.从某小学随机抽取 100 名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知 a=____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取 18 人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.14答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴ a= =0.030.由题意知,身高在[120,130),[130,140),[140,150]内的1- 0.70010学生分别为 30 人,20 人,10 人,∴由分层抽样可知抽样比为 = ,1860 310∴在[140,150]中选取的学生应为 3 人.9.某校高一某班的某次数学测试成绩(满分为 100 分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.解 (1)分数在[50,60]的频率为 0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为 2,所以全班人数为 =25.20.08(2)分数在[80,90]之间的频数为 25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为 ÷10=0.016.42510.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于 100 克的个数是36.15(1)求样本容量及样本中净重大于或等于 98 克并且小于 104 克的产品的个数;(2)已知这批产品中每个产品的利润 y(单位:元)与产品净重 x(单位:克)的关系式为y=Error! 求这批产品平均每个的利润.解 (1)产品净重小于 100 克的频率为(0.050+0.100)×2=0.300.设样本容量为 n.∵样本中产品净重小于 100 克的个数是 36,∴ =0.300,∴ n=120.∵样本中净重大于或等于 98 克并且小于 104 克的产品的频率为36n(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于 98 克并且小于 104 克的产品的个数是 120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为 120×0.100=12,120×0.750=90,120×0.150=18,∴这批产品平均每个的利润为 ×(3×12+5×90+4×18)=4.65(元).1120B 组 专项能力提升(时间:30 分钟)11.某学校随机抽取 20 个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为 5 将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.16答案 ①解析 由于频率分布直方图的组距为 5,排除③、④,又[0,5),[5,10)两组各一人,排除②,①符合条件,故①正确.12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的 60株树木中,有________株树木的底部周长小于 100 cm.答案 24解析 底部周长在[80,90)的频率为 0.015×10=0.15,底部周长在[90,100)的频率为 0.025×10=0.25,样本容量为 60,所以树木的底部周长小于 100 cm 的株数为(0.15+0.25)×60=24.13.(2015·湖北)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的 a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案 (1)3 (2)6 000解析 由频率分布直方图及频率和等于 1 可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+ a×0.1=1,解得 a=3.于是消费金额在区间[0.5,0.9]内频率为 0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填 3,6 000.14.若某产品的直径长与标准值的差的绝对值不超过 1 mm 时,则视为合格品,否则视为不17合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取 5 000 件进行检测,结果发现有 50 件不合格品.计算这 50 件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数 频率[-3,-2) 0.10[-2,-1) 8(1,2] 0.50(2,3] 10(3,4]合计 50 1.00(1)将上面表格中缺少的数据填在相应位置;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有 20 件不合格品.据此估算这批产品中的合格品的件数.解 (1)如下表所示频率分布表.分组 频数 频率[-3,-2) 5 0.10[-2,-1) 8 0.16(1,2] 25 0.50(2,3] 10 0.20(3,4] 2 0.04合计 50 1.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为 x 件,依题意 = ,解得 x= -20=1 505 000 20x+ 20 5 000×2050980.所以该批产品的合格品件数是 1 980.15.(2014·广东)某车间 20 名工人年龄数据如下表:年龄(岁) 19 28 29 30 31 32 40工人数(人) 1 3 3 5 4 3 1(1)求这 20 名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图;18(3)求这 20 名工人年龄的方差.解 (1)这 20 名工人年龄的众数为:30;这 20 名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图如下:(3)这 20 名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这 20 名工人年龄的方差为:(30-19) 2+ (30-28) 2+ (30-29) 2+ (30-30) 2+ (30-31) 2+ (30-32)120 320 320 520 420 3202+ (30-40) 2=12.6.120
展开阅读全文
相关搜索