1、章末分层突破自我校对分层抽样线性回归分析频率分布直方图方差与标准差抽样方法常用的抽样方法有三种(1)简单随机抽样是最简单、最基本的抽样方法;(2)系统抽样要求把总体均衡地分成几部分,然后从每部分中抽取相同数目的个体;(3)分层抽样则是根据样本的差异分成几层,然后在各层中按各层在总体中所占的比例进行抽样,不要求各部分抽取的样本数相同,但各层之间要有明显的差异三种抽样的共同点都是等概率抽样,即抽样过程中每个个体被抽取的概率相等,体现了这三种抽样方法的客观性和公平性某单位 200 名职工的年龄分布情况如图 21,现要从中抽取 40 名职工作样本用系统抽样法,将全体职工随机按 1200 编号,并按编号
2、顺序平均分为 40 组(1 5 号,610 号,196200 号)若第 5 组抽出的号码为22,则第 8 组抽出的号码应是_,若用分层抽样方法,则 40 岁以下年龄段应抽取_人图 21【精彩点拨】 按各种抽样方法的步骤抽取样本即可【规范解答】 法一:由系统抽样知第 1 组抽出的号码为 2,则第 8 组抽出的号码为 25737;当用分层抽样抽取,则 40 岁以下年龄段应抽取4020 名12法二:由系统抽样知,第 5 组抽出的号码为 22,而分段间隔为 5,则第 6组抽取的应为 27,第 7 组抽取的应为 32,第 8 组抽取的号码应为 37.由图知 40 岁以下的人数为 100 人,则抽取的比例
3、为 ,100 2040200 15 15为抽取人数【答案】 37 20再练一题1某地区有小学 150 所,中学 75 所,大学 25 所现采用分层抽样的方法从这些学校中抽取 30 所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取_所学校【解析】 根据分层抽样的特点求解从小学中抽取30 18(所)学校;从中学中抽取 30 9(所)学校150150 75 25 75150 75 25【答案】 18 9用样本估计总体用样本估计总体的方式有两种,一是用样本的频率分布估计总体分布,二是用样本的数字特征估计总体的数字特征在用样本的频率分布估计总体分布时,主要是利用统计图表分析估计总体的分布规律
4、,要求掌握图表的绘制方法,明确图表中数据的有关意义,学会从图表中获取有关信息并会加以整理样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差我们常通过样本的数字特征估计总体的数字特征某学校为了了解学生的日平均睡眠时间(单位: h),随机选择了 n 名同学进行调查下表是这 n 名同学的日睡眠时间的频率分布表.序号(i) 分组( 睡眠时间) 频数(人数) 频率1 4,5) 6 0.122 5,6) 0.203 6,7) a4 7,8) b5 8,9) 0.08(1)求 n 的值;若 a20,将表中数据补全,并画出频率分布直
5、方图;(2)统计方法中,同一组数据常用该组区间的中点值(例如区间4,5)的中点值是 4.5)作为代表若据此计算的上述数据的平均值为 6.52,求 a,b 的值【精彩点拨】 (1)根据频率、频数与样本容量的关系求出相关数据,补全表,然后结合画频率直方图的步骤画出图形;(2)根据平均数的定义及题意列出方程组求解【规范解答】 (1)由频率分布表可知n 50.60.12补全数据如下表:序号 (i) 分组(睡眠时间) 频数(人数) 频率1 4,5) 6 0.122 5,6) 10 0.203 6,7) 20 0.404 7,8) 10 0.205 8,9) 4 0.08频率分布直方图如下:(2)由题意得
6、Error!解得Error!再练一题2甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图 22 所示,则平均分数较高的是_,成绩较为稳定的是_图 22【解析】 由题意得甲 (6869707172)70,x 15s (6870) 2(6970) 2(7070) 2(7170) 2(7270) 22,2甲15乙 (6368696971)68.x 15s (6368) 2(6868) 2(6968) 2(6968) 2(7168) 27.2.2乙15 甲 乙 , s ”“”或x x“”)图 24【解析】 由茎叶图中数据求得 1 215,且由方差公式可得x xs (7) 2 (6) 2( 1)21
7、 26 27 2 ,s (8) 2(7) 2(2)2118 432 2 1822 27 28 2 ,故 s1s2.1174【答案】 1已知一组数据 4,6,5,8,7,6,那么这组数据的平均数为_【解析】 6.x 4 6 5 8 7 66【答案】 62为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单位: cm),所得数据均在区间 80,130上,其频率分布直方图如图 25 所示,则在抽测的 60 株树木中,有_株树木的底部周长小于 100 cm.图 25【解析】 底部周长在80,90)的频率为 0.015100.15,底部周长在90,100)的频率为 0.025100.
8、25,样本容量为 60,所以树木的底部周长小于100 cm 的株数为 (0.150.25) 6024.【答案】 243已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_【解析】 (4.74.85.15.45.5)5.1,则方差x 15s2 (4.75.1) 2(4.85.1) 2(5.15.1) 2(5.45.1) 2(5.55.1) 215 (0.160.0900.090.16)0.1.15【答案】 0.14在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图26 所示,若将运动员按成绩由好到差编为 135 号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间139,151上的运动员人数是_图 26【解析】 由茎叶图可知,在区间139,151上的人数为 20,再由系统抽样的性质可知人数为 20 4 人735【答案】 45某学校高一、高二、高三年级的学生人数之比为 334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为 50 的样本,则应从高二年级抽取_名学生【解析】 由题意知高二年级的学生人数占该校高中人数的 ,故应从高310二年级抽取 50 15 名学生310【答案】 15