压缩包目录
-
全部
- 2018版高考数学一轮复习第十一章统计与概率11.1随机抽样理201706020291.doc--点击预览
- 2018版高考数学一轮复习第十一章统计与概率11.1随机抽样课件理2017060202199.ppt
- 2018版高考数学一轮复习第十一章统计与概率11.2用样本估计总体理201706020292.doc--点击预览
- 2018版高考数学一轮复习第十一章统计与概率11.2用样本估计总体课件理2017060202200.ppt
- 2018版高考数学一轮复习第十一章统计与概率11.3变量间的相关关系统计案例理201706020293.doc--点击预览
- 2018版高考数学一轮复习第十一章统计与概率11.3变量间的相关关系统计案例课件理2017060202201.ppt
文件预览区
|
|
资源描述
1第十一章 统计与概率 11.1 随机抽样 理1.简单随机抽样(1)定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样方法有两种——抽签法和随机数法.2.系统抽样的步骤一般地,假设要从容量为 N 的总体中抽取容量为 n 的样本.(1)先将总体的 N 个个体编号;(2)确定分段间隔 k,对编号进行分段.当 (n 是样本容量)是整数时,取 k= ;Nn Nn(3)在第 1 段用简单随机抽样确定第一个个体编号 l (l≤ k);(4)按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号( l+ k),再加 k得到第 3 个个体编号( l+2 k),依次进行下去,直到获取整个样本.3.分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法.【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √ )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × )(3)抽签法中,先抽的人抽中的可能性大.( × )(4)系统抽样在第 1 段抽样时采用简单随机抽样.( √ )(5)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的样本,需要剔除 2 个学生,这样对被剔除者不公平.( × )(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )21.(教材改编)某公司有员工 500 人,其中不到 35 岁的有 125 人,35~49 岁的有 280 人,50 岁以上的有 95 人,为了调查员工的身体健康状况,从中抽取 100 名员工,则应在这三个年龄段分别抽取人数为( )A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20答案 B解析 因为 125∶280∶95=25∶56∶19,所以抽取人数分别为 25,56,19.2.(2015·四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法 B.系统抽样法C.分层抽样法 D.随机数法答案 C解析 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.(1)某学校为了了解 2016 年高考数学学科的考试成绩,在高考后对 1 200 名学生进行抽样调查,其中文科 400 名考生,理科 600 名考生,艺术和体育类考生共 200 名,从中抽取120 名考生作为样本.(2)从 10 名家长中抽取 3 名参加座谈会.Ⅰ.简单随机抽样法 Ⅱ.系统抽样法 Ⅲ.分层抽样法问题与方法配对正确的是( )A.(1)Ⅲ,(2)Ⅰ B.(1)Ⅰ,(2)ⅡC.(1)Ⅱ,(2)Ⅲ D.(1)Ⅲ,(2)Ⅱ答案 A解析 通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法.4.将参加英语口语测试的 1 000 名学生编号为 000,001,002,…,999,从中抽取一个容量为 50 的样本,按系统抽样的方法分为 50 组,如果第一组编号为 000,001,002,…,019,且第一组随机抽取的编号为 015,则抽取的第 35 个编号为________.答案 695解析 由题意可知,第一组随机抽取的编号 l=15,分段间隔数 k= = =20,则抽取的第 35 个编号为 a35=15+(35-1)×20=695.Nn 1 0005035.某学校高一,高二,高三年级的学生人数之比为 3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为 50 的样本,则应从高二年级抽取________名学生.答案 15解析 设应从高二年级抽取 x 名学生,则 x∶50=3∶10,解得 x=15.题型一 简单随机抽样例 1 (1)以下抽样方法是简单随机抽样的是( )A.在某年明信片销售活动中,规定每 100 万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 2709 的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔 30 分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取 2 人、14 人、4 人了解对学校机构改革的意见D.用抽签方法从 10 件产品中选取 3 件进行质量检验(2)总体由编号为 01,02,…,19,20 的 20 个个体组成.利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为( )7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481A.08 B.07 C.02 D.01答案 (1)D (2)D解析 (1)选项 A、B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项 C 不是简单随机抽样,因为总体的个体有明显的层次;选项 D 是简单随机抽样.(2)由题意知前 5 个个体的编号为 08,02,14,07,01.思维升华 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.(1)下列抽样试验中,适合用抽签法的有( )4A.从某厂生产的 5 000 件产品中抽取 600 件进行质量检验B.从某厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验C.从甲、乙两厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验D.从某厂生产的 5 000 件产品中抽取 10 件进行质量检验(2)下列抽取样本的方式不属于简单随机抽样的有________________.①从无限多个个体中抽取 100 个个体作为样本.②盒子里共有 80 个零件,从中选出 5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从 20 件玩具中一次性抽取 3 件进行质量检验.④某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.答案 (1)B (2)①②③④解析 (1)A,D 中的总体个体数较多,不适宜抽签法,C 中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选 B.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的 5 名同学是 56 名中特指的,不存在随机性,不是等可能抽样.题型二 系统抽样例 2 (1)(2015·湖南)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为 1~35 号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间[139,151]上的运动员人数是( )A.3 B.4 C.5 D.6(2)某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调查,将 840 人按1,2,…,840 随机编号,则抽取的 42 人中,编号落入区间[481,720]的人数为( )A.11 B.12 C.13 D.14答案 (1)B (2)B解析 (1)由题意知,将 1~35 号分成 7 组,每组 5 名运动员,成绩落在区间[139,151]的运动员共有 4 组,故由系统抽样法知,共抽取 4 名.故选 B.5(2)由 =20,即每 20 人抽取 1 人,所以抽取编号落在区间[481,720]的人数为 =84042 720- 48020=12.24020引申探究1.本例(2)中条件不变,若第三组抽得的号码为 44,则在第八组中抽得的号码是________.答案 144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取 8 人,则样本容量为________.答案 28解析 因为在编号[481,720]中共有 720-480=240 人,又在[481,720]中抽取 8 人,所以抽样比应为 240∶8=30∶1,又因为单位职工共有 840 人,所以应抽取的样本容量为=28.84030思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.(1)(2017·马鞍山月考)高三(1)班有学生 52 人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为 4 的样本,已知 5 号、31 号、44 号学生在样本中,则样本中还有一个学生的编号是( )A.8 B.13 C.15 D.18(2)(2016·烟台模拟)采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32人中,编号落入区间[1,450]的人做问卷 A,编号落入区间[451,750]的人做问卷 B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为( )A.7 B.9 C.10 D.15答案 (1)D (2)C解析 (1)分段间隔为 =13,故还有一个学生的编号为 5+13=18,故选 D.524(2)由系统抽样的特点知:抽取号码的间隔为 =30,抽取的号码依次为960329,39,69,…,939.落入区间[451,750]的有 459,489,…,729,这些数构成首项为 459,公差为 30 的等差数列,设有 n 项,显然有 729=459+( n-1)×30,解得 n=10.所以做问卷 B的有 10 人.6题型三 分层抽样命题点 1 求总体或样本容量例 3 (1)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为 n 的样本,其中甲种产品有 18 件,则样本容量 n等于( )A.54 B.90 C.45 D.126(2)甲、乙两套设备生产的同类型产品共 4 800 件,采用分层抽样的方法从中抽取一个容量为 80 的样本进行质量检测.若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为________件.答案 (1)B (2)1 800解析 (1)依题意得 ×n=18,解得 n=90,即样本容量为 90.33+ 5+ 7(2)分层抽样中各层的抽样比相同.样本中甲设备生产的产品有 50 件,则乙设备生产的产品有 30 件.在 4 800 件产品中,甲、乙设备生产的产品总数比为 5∶3,所以乙设备生产的产品的总数为 1 800 件.命题点 2 求某层入样的个体数例 4 (1) (2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有 320 人,则该样本中的老年教师人数为( )类别 人数老年教师 900中年教师 1 800青年教师 1 600合计 4 300A.90 B.100 C.180 D.300(2)(2015·福建)某校高一年级有 900 名学生,其中女生 400 名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为 45 的样本,则应抽取的男生人数为________.答案 (1)C (2)25解析 (1)由题意抽样比为 = ,3201 600 15∴该样本中的老年教师人数为 900× =180.15(2)由题意知,男生共有 500 名,根据分层抽样的特点,在容量为 45 的样本中男生应抽取人数为 45× =25.500900思维升华 分层抽样问题类型及解题思路7(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.(2)某公司共有 1 000 名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为 80 的样本,已告知广告部门被抽取了 4 个员工,则广告部门的员工人数为________.答案 (1)200,20 (2)50解析 (1)该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为 10 000×2%=200,其中抽取的高中生近视人数为 2 000×2%×50%=20.(2) = , x=50.1 00080 x4五审图表找规律典例 (12 分)某单位有 2 000 名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数 管理 技术开发 营销 生产 共计老年 40 40 40 80 200中年 80 120 160 240 600青年 40 160 280 720 1 200共计 160 320 480 1 040 2 000(1)若要抽取 40 人调查身体状况,则应怎样抽样?(2)若要开一个 25 人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?8(3)若要抽 20 人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取 40 人调查身体状况↓(观察图表中的人数分类统计情况)样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样↓要开一个 25 人的座谈会↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响↓(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽 20 人调查对广州亚运会举办情况的了解↓ 可认为亚运会是大众体育盛会,一个单位人员对情况了解相当将单位人员看作一个整体↓(从表中数据看总人数为 2 000)人员较多,可采用系统抽样规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取,[1 分]抽取比例为 = .[2 分]402 000 150故老年人、中年人、青年人各抽取 4 人、12 人、24 人.[4 分](2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5 分]抽取比例为 = ,[6 分]252 000 180故管理、技术开发、营销、生产各部门抽取 2 人、4 人、6 人、13 人.[8 分](3)用系统抽样,对全部 2 000 人随机编号,号码从 0001~2000,每 100 号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加 100,200,…,1 900,共 20 人组成一个样本.[12 分]91.某校选修乒乓球课程的学生中,高一年级有 30 名,高二年级有 40 名.现用分层抽样的方法在这 70 名学生中抽取一个样本,已知在高一年级的学生中抽取了 6 名,则在高二年级的学生中应抽取的人数为( )A.6 B.8C.10 D.12答案 B解析 设样本容量为 N,则 N× =6,∴ N=14,3070∴高二年级所抽学生人数为 14× =8.40702.(2017·榆林月考)打桥牌时,将洗好的扑克牌(52 张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从 52 张总体抽取一个 13 张的样本.这种抽样方法是( )A.系统抽样 B.分层抽样C.简单随机抽样 D.非以上三种抽样方法答案 A解析 符合系统抽样的特点,故选 A.3.对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 p1, p2, p3,则( )A. p1= p2p3 B. p2= p3p1C. p1= p3p2 D. p1= p2= p3答案 D解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此 p1= p2= p3.4.为了解 1 000 名学生的学习情况,采用系统抽样的方法,从中抽取容量为 40 的样本,则分段的间隔为( )A.50 B.40 C.25 D.20答案 C解析 由 =25,可得分段的间隔为 25.1 000405.某初级中学有学生 270 人,其中一年级 108 人,二、三年级各 81 人,现要利用抽样方法抽取 10 人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为 1,2,…,270,使用系统抽样时,将学生统一随机编号为 1,2,…,270,并将整个编号依次分为 10 段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250②5,9,100,107,111,121,180,195,200,26510③11,38,65,92,119,146,173,200,227,254④30,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是( )A.②、③都不能为系统抽样 B.②、④都不能为分层抽样C.①、④都可能为系统抽样 D.①、③都可能为分层抽样答案 D解析 因为③可以为系统抽样,所以选项 A 不对;因为②可以为分层抽样,所以选项 B 不对;因为④不为系统抽样,所以选项 C 不对,故选 D.6.将参加夏令营的 600 名学生编号为 001,002,…,600.采用系统抽样方法抽取一个容量为 50 的样本,且随机抽得的号码为 003.这 600 名学生分住在三个营区,从 001 到 300 在第Ⅰ营区,从 301 到 495 在第Ⅱ营区,从 496 到 600 在第Ⅲ营区,三个营区被抽中的人数依次为( )A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9答案 B解析 由题意及系统抽样的定义可知,将这 600 名学生按编号依次分成 50 组,每一组各有12 名学生,第 k(k∈N *)组抽中的号码是 3+12( k-1).令 3+12( k-1)≤300 得 k≤ ,因此第Ⅰ营区被抽中的人数是 25;1034令 3003+12( k-1)≤495 得 k≤42,因此第Ⅱ营区被抽中的人数是 42-25=17.故选 B.10347.(2016·山西大同一中月考)用简单随机抽样的方法从含有 10 个个体的总体中,抽取一个容量为 3 的样本,其中某一个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )A. , B. ,110 110 310 15C. , D. ,15 310 310 310答案 A解析 在抽样过程中,个体 a 每一次被抽中的概率是相等的,因为总体容量为 10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为 ,故选 A.1108.(2017·天津质检)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查,已知该校11一年级、二年级、三年级、四年级的本科生人数之比为 4∶5∶5∶6,则应从一年级本科生中抽取________名学生.答案 60解析 设应从一年级本科生中抽取 x 名学生,则 = ,解得 x=60.x300 44+ 5+ 5+ 69.(2016·潍坊模拟)某高中在校学生有 2 000 人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:高一年级 高二年级 高三年级跑步 a b c登山 x y z其中 a∶ b∶ c=2∶3∶5,全校参与登山的人数占总人数的 .为了了解学生对本次活动的满25意程度,从中抽取一个 200 人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________.答案 36解析 根据题意,可知样本中参与跑步的人数为 200× =120,所以从高二年级参与跑步的35学生中应抽取的人数为 120× =36.32+ 3+ 510.一个总体中有 90 个个体,随机编号 0,1,2,…,89,以从小到大的编号顺序平均分成9 个小组,组号依次为 1,2,3,…,9.现用系统抽样方法抽取一个容量为 9 的样本,规定如果在第 1 组随机抽取的号码为 m,那么在第 k 组中抽取的号码个位数字与 m+ k 的个位数字相同,若 m=8,则在第 8 组中抽取的号码是________.答案 76解析 由题意知 m=8, k=8,则 m+ k=16,也就是第 8 组抽取的号码个位数字为 6,十位数字为 8-1=7,故抽取的号码为 76.11.200 名职工年龄分布如图所示,从中随机抽取 40 名职工作样本,采用系统抽样方法,按 1~200 编号,分为 40 组,分别为 1~5,6~10,…,196~200,第 5 组抽取号码为 22,第 8 组抽取号码为________.若采用分层抽样,40 岁以下年龄段应抽取________人.答案 37 2012解析 将 1~200 编号分为 40 组,则每组的间隔为 5,其中第 5 组抽取号码为 22,则第 8 组抽取的号码应为 22+3×5=37;由已知条件 200 名职工中 40 岁以下的职工人数为200×50%=100,设在 40 岁以下年龄段中应抽取 x 人,则 = ,解得 x=20.40200 x10012.某校共有学生 2 000 名,各年级男、女学生人数如下表.已知在全校学生中随机抽取 1名,抽到二年级女生的概率是 0.19.现用分层抽样的方法在全校抽取 64 名学生,则应在三年级抽取的学生人数为________.一年级 二年级 三年级女生 373 x y男生 377 370 z答案 16解析 依题意可知二年级的女生有 380 人,那么三年级的学生人数应该是 2 000-373-377-380-370=500,即总体中各个年级的人数比为 3∶3∶2,故用分层抽样法应在三年级抽取的学生人数为 64× =16.2813.某公路设计院有工程师 6 人,技术员 12 人,技工 18 人,要从这些人中抽取 n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加 1 个,则在采用系统抽样时,需要在总体中先剔除 1 个个体,求 n.解 总体容量为 6+12+18=36.当样本容量是 n 时,由题意知,系统抽样的间隔为 ,分层抽样的比例是 ,抽取的工程师36n n36人数为 ×6= ,技术员人数为 ×12= ,技工人数为 ×18= ,n36 n6 n36 n3 n36 n2所以 n 应是 6 的倍数,36 的约数,即 n=6,12,18.当样本容量为( n+1)时,总体容量是 35 人,系统抽样的间隔为 ,因为 必须是整数,35n+ 1 35n+ 1所以 n 只能取 6.即样本容量 n=6.*14.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历 35 岁以下 35~ 50 岁 50 岁以上本科 80 30 20研究生 x 20 y(1)用分层抽样的方法在 35~50 岁年龄段的专业技术人员中抽取一个容量为 5 的样本,将该样本看成一个总体,从中任取 2 人,求至少有 1 人学历为研究生的概率;13(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其中 35 岁以下48 人,50 岁以上 10 人,再从这 N 个人中随机抽取出 1 人,此人的年龄为 50 岁以上的概率为 ,求 x, y 的值.539解 (1)用分层抽样的方法在 35~50 岁中抽取一个容量为 5 的样本,设抽取学历为本科的人数为 m,∴ = ,解得 m=3.3050 m5抽取的样本中有研究生 2 人,本科生 3 人,分别记作 S1, S2; B1, B2, B3.从中任取 2 人的所有等可能基本事件共有 10 个:( S1, B1),( S1, B2),( S1, B3),( S2, B1),(S2, B2),( S2, B3),( S1, S2),( B1, B2),( B1, B3),( B2, B3),其中至少有 1 人的学历为研究生的基本事件有 7 个:( S1, B1),( S1, B2),( S1, B3),( S2, B1),( S2, B2),( S2, B3),(S1, S2),∴从中任取 2 人,至少有 1 人学历为研究生的概率为 .710(2)由题意,得 = ,解得 N=78,10N 539∴35~50 岁中被抽取的人数为 78-48-10=20,∴ = = , 4880+ x 2050 1020+ y解得 x=40, y=5,即 x, y 的值分别为 40,5.1第十一章 统计与概率 11.2 用样本估计总体 理1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图 .2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s= .1n[ x1- x 2+ x2- x 2+ …+ xn- x 2](3)方差: s2= [(x1- )2+( x2- )2+…+( xn- )2](xn是样本数据, n 是样本容量, 是样1n x x x x本平均数).【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示 ,频率=组距× .频 率组 距 频 率组 距(2)频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.22.平均数、方差的公式推广(1)若数据 x1, x2,…, xn的平均数为 ,那么 mx1+ a, mx2+ a, mx3+ a,…, mxn+ a 的平均x数是 m + a.x(2)数据 x1, x2,…, xn的方差为 s2.①数据 x1+ a, x2+ a,…, xn+ a 的方差也为 s2;②数据 ax1, ax2,…, axn的方差为 a2s2.【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )1.(教材改编)若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5 和 91.5 B.91.5 和 92C.91 和 91.5 D.92 和 92答案 A解析 这组数据由小到大排列为 87,89,90,91,92,93,94,96,∴中位数是 =91.5,91+ 922平均数 = =91.5.x87+ 89+ 90+ 91+ 92+ 93+ 94+ 9682.(2015·陕西)某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校女教师的人数为( )3A.93 B.123 C.137 D.167答案 C解析 由题干扇形统计图可得该校女教师人数为 110×70%+150×(1-60%)=137.故选 C.3.(2016·四川宜宾模拟)若数据 x1, x2, x3,…, xn的平均数为 =5,方差 s2=2,则数据x3x1+1,3 x2+1,3 x3+1,…,3 xn+1 的平均数和方差分别为( )A.5,2 B.16,2C.16,18 D.16,9答案 C解析 ∵ x1, x2, x3,…, xn的平均数为 5,∴ =5,x1+ x2+ x3+ …+ xnn∴ +1=3×5+1=16,3x1+ 3x2+ 3x3+ …+ 3xnn∵ x1, x2, x3,…, xn的方差为 2,∴3 x1+1,3 x2+1,3 x3+1,…,3 xn+1 的方差是 32×2=18.4.(2016·江苏)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.答案 0.1解析 = =5.1,x4.7+ 4.8+ 5.1+ 5.4+ 5.55则方差 s2= [(4.7-5.1) 2+(4.8-5.1) 2+(5.1-5.1) 2+(5.4-5.1) 2+(5.5-5.1) 2]=0.1.155.为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有________株树木的底部周长小于 100 cm.答案 24解析 底部周长在[80,90)的频率为 0.015×10=0.15,4底部周长在[90,100)的频率为 0.025×10=0.25,样本容量为 60,所以树木的底部周长小于 100 cm 的株数为(0.15+0.25)×60=24.题型一 频率分布直方图的绘制与应用例 1 (2016·北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过 w 立方米的部分按 4 元/立方米收费,超出 w 立方米的部分按 10 元/立方米收费.从该市随机调查了 10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果 w 为整数,那么根据此次调查,为使 80%以上居民在该月的用水价格为 4 元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当 w=3 时,估计该市居民该月的人均水费.解 (1)如图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于 3 立方米的频率为 0.85,又 w 为整数,∴为使 80%以上的居民在该月的用水价格为 4 元/立方米, w 至少定为 3.(2)当 w=3 时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为 10.5 元.思维升华 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为 1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从 A, B 两地区分别随机调查了 40 个用户,根据用户对产品的满意度评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图5图①B 地区用户满意度评分的频数分布表满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数 2 8 14 10 6(1)在图②中作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均数及分散程度(不要求计算出具体值,给出结论即可).B 地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分 低于 70 分 70 分到 89 分 不低于 90 分满意度等级 不满意 满意 非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解 (1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出, B 地区用户满意度评分的平均数高于 A 地区用户满意度评分的平均数; B 地区用户满意度评分比较集中,而 A 地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.6记 CA表示事件:“ A 地区用户的满意度等级为不满意” ; CB表示事件:“ B 地区用户的满意度等级为不满意” .由直方图得 P(CA)的估计值为(0.01+0.02+0.03)×10=0.6, P(CB)的估计值为(0.005+0.02)×10=0.25.所以 A 地区用户的满意度等级为不满意的概率大.题型二 茎叶图的应用例 2 (1)(2015·山东)为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温;②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温;③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③ B.①④ C.②③ D.②④(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x, y 的值分别为( )A.2,5 B.5,5 C.5,8 D.8,8答案 (1)B (2)C解析 (1)甲地 5 天的气温为 26,28,29,31,31,其平均数为 甲 = =29;x26+ 28+ 29+ 31+ 315方差为 s = [(26-29) 2+(28-29) 2+(29-29) 2+(31-29) 2+(31-29) 2]=3.6;2甲15标准差为 s 甲 = .3.6乙地 5 天的气温为 28,29,30,31,32,其平均数为 乙 = =30;x28+ 29+ 30+ 31+ 3257方差为 s = [(28-30) 2+(29-30) 2+(30-30) 2+(31-30) 2+(32-30) 2]=2;2乙15标准差为 s 乙 = .2∴ 甲 < 乙 , s 甲 > s 乙.x x(2)由茎叶图及已知得 x=5,又乙组数据的平均数为 16.8,即=16.8,解得 y=8.9+ 15+ 10+ y+ 18+ 245引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好.解 由原题可知 x=5,则甲组平均数为 =17.4.9+ 12+ 15+ 24+ 275而乙组平均数为 16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差.解 ①由茎叶图知,乙组中五名学生的成绩为 9,15,18,18,24.故中位数为 18,众数为 18.② s2= [(9-16.8) 2+(15-16.8) 2+(18-16.8) 2×2+(24-16.8) 2]=23.76.15思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(1)某学校随机抽取 20 个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为 5 将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )8(2)将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示:则 7 个剩余分数的方差为( )A. B. C.36 D.1169 367 677答案 (1)A (2)B解析 (1)由于频率分布直方图的组距为 5,排除 C、D,又[0,5),[5,10)两组各一人,排除B,应选 A.(2)由题意知 =91,解得 x=4.所以 s2= [(87-91)87+ 94+ 90+ 91+ 90+ 90+ x+ 917 172+(94-91) 2+(90-91) 2+(91-91) 2+(90-91) 2+(94-91) 2+(91-91) 2]= (16+9+1+0+1+9+0)= .17 367题型三 用样本的数字特征估计总体的数字特征例 3 (1)抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下:运动员 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次甲 87 91 90 89 93乙 89 90 91 88 92则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.答案 2解析 甲 = (87+91+90+89+93)=90,x15乙 = (89+90+91+88+92)=90,x15s = [(87-90) 2+(91-90) 2+(90-90) 2+(89-90) 2+(93-90) 2]=4,2甲15s = [(89-90) 2+(90-90) 2+(91-90) 2+(88-90) 2+(92-90) 2]=2.2乙159(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价.解 ①由图象可得甲、乙两人五次测试的成绩分别为甲:10 分,13 分,12 分,14 分,16 分;乙:13 分,14 分,12 分,12 分,14 分.甲 = =13;x10+ 13+ 12+ 14+ 165乙 = =13,x13+ 14+ 12+ 12+ 145s = [(10-13) 2+(13-13) 2+(12-13) 2+(14-13) 2+(16-13) 2]=4;2甲15s = [(13-13) 2+(14-13) 2+(12-13) 2+(12-13) 2+(14-13) 2]=0.8.2乙15②由 s s ,可知乙的成绩较稳定.2甲 2乙从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2016·全国乙卷)某公司计划购买 1 台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200 元.在机器使用期间,如果备件不足再购买,则每个 500 元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台这种机器在三年使用期内更换的易损零件数,得以下柱状图:10记 x 表示 1 台机器在三年使用期内需更换的易损零件数, y 表示 1 台机器在购买易损零件上所需的费用(单位:元), n 表示购机的同时购买的易损零件数.(1)若 n=19,求 y 与 x 的函数解析式;(2)若要求“需更换的易损零件数不大于 n”的频率不小于 0.5,求 n 的最小值;(3)假设这 100 台机器在购机的同时每台都购买 19 个易损零件,或每台都购买 20 个易损零件,分别计算这 100 台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1 台机器的同时应购买 19 个还是 20 个易损零件?解 (1)当 x≤19 时, y=3 800;当 x19 时, y=3 800+500( x-19)=500 x-5 700.所以 y 与 x 的函数解析式为y=Error! (x∈N).(2)由柱状图知,需更换的零件数不大于 18 的频率为 0.46,不大于 19 的频率为 0.7,故 n的最小值为 19.(3)若每台机器在购机的同时都购买 19 个易损零件,则这 100 台机器中有 70 台在购买易损零件上的费用为 3 800 元,20 台的费用为 4 300 元,10 台的费用为 4 800 元,因此这 100台机器在购买易损零件上所需费用的平均数为(3 800×70+4 300×20+4 800×10)=4 000(元),1100若每台机器在购机同时都购买 20 个易损零件,则这 100 台机器中有 90 台在购买易损零件上的费用为 4 000 元,10 台的费用为 4 500 元,因此这 100 台机器在购买易损零件上所需费用的平均数为(4 000×90+4 500×10)=4 050(元).1100比较两个平均数可知,购买 1 台机器的同时应购买 19 个易损零件.9.高考中频率分布直方图的应用考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.11典例 (12 分)(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成 9 组,制成了如图所示的频率分布直方图.(1)求直方图中 a 的值;(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由;(3)估计居民月均用水量的中位数.规范解答解 (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为 0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.[3 分]由 1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5× a+0.5× a,解得 a=0.30.[5 分](2)由(1)知,100 位居民月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 000×0.12=36 000.[8 分](3)设中位数为 x 吨.因为前 5 组的频率之和为 0.04+0.08+0.15+0.21+0.25=0.730.5.而前 4 组的频率之和为0.04+0.08+0.15+0.21=0.48mC. n= m D.不能确定答案 A解析 由题意可得 = ,xx1+ x2+ …+ xnn= ,yy1+ y2+ …+ ymm=zx1+ x2+ …+ xn+ y1+ y2+ …+ ymn+ m= · + ·nn+ m x1+ x2+ …+ xnn mn+ m y1+ y2+ …+ ymm= · + · = a +(1- a) ,nn+ m x mn+ m y x y所以 = a, =1- a,nn+ m mn+ m又 0a ,所以 0 ,故 nm.12 nn+ m12 mn+ m6.(2016·北京朝阳区期末)在一段时间内有 2 000 辆车通过高速公路上的某处,现随机抽取其中的 200 辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定正常行驶速度为 90 km/h~120 km/h,试估计 2 000 辆车中,在这段时间内以正常速度通过该处的汽车约有( )A.30 辆 B.300 辆C.170 辆 D.1 700 辆答案 D14解析 以正常速度通过该处的汽车频率为 1-(0.01+0.005)×10=0.85,所以以正常速度通过该处的汽车约有 0.85×2 000=1 700(辆).7.样本中共有五个个体,其值分别为 a,0,1,2,3.若该样本的平均数为 1,则样本方差为________.答案 2解析 由题意可知样本的平均数为 1,所以 =1,a+ 0+ 1+ 2+ 35解得 a=-1,所以样本的方差为[(-1-1) 2+(0-1) 2+(1-1) 2+(2-1) 2+(3-1) 2]=2.158.(2015·湖北)某电子商务公司对 10 000 名网络购物者在 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的 a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案 (1)3 (2)6 000解析 由频率分布直方图及频率和等于 1 可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+ a×0.1=1,解得 a=3.于是消费金额在区间[0.5,0.9]内的频率为 0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为 0.6×10 000=6 000.9.若样本数据 x1, x2,…, x10的标准差为 8,则数据 2x1-1,2 x2-1,…,2 x10-1 的标准差为________.答案 16解析 若 x1, x2,…, xn的标准差为 s,则 ax1+ b, ax2+ b,…, axn+ b 的标准差为 as.由题意 s=8,则上述标准差为 2×8=16.10.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则15(1)图中的 x=________;(2)若上学所需时间不少于 1 小时的学生可申请在学校住宿,则该校 600 名新生中估计有________名学生可以申请住宿.答案 (1)0.012 5 (2)72解析 (1)由频率分布直方图知 20x=1-20×(0.025+0.006 5+0.003+0.003),解得x=0.012 5.(2)上学时间不少于 1 小时的学生的频率为 0.12,因此估计有 0.12×600=72(人)可以申请住宿.11.某校高一某班的某次数学测试成绩(满分为 100 分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.解 (1)分数在[50,60]的频率为 0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为 2,所以全班人数为 =25.20.08(2)分数在[80,90]之间的频数为 25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为 ÷10=0.016.42512.某市为了考核甲、乙两部门的工作情况,随机访问了 50 位市民.根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:16(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解 (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是75,75,故样本的中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本的中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是 67.66+ 682(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为=0.1, =0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为550 8500.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.
展开阅读全文
相关搜索
资源标签