1、专题 4 用样本估计总体1用样本估计总体的两种情况(1)用样本的频率分布估计总体的分布(2)用样本的数字特征估计总体的数字特征2用样本的频率分布估计总体分布(1)频率分布直方图;(2)频率分布折线图和总体密度曲线及茎叶图频率分布折线图的作法;总体密度曲线的含义;茎叶图的特点3用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数的定义;(2)样本方差、标准差的含义及求法例 1 调查某校高三年级男生的身高,随机抽取 40 名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168
2、170 168 160 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图变式 1 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于 134 cm 的人数占总人数的百分比例 2 某赛季甲、乙两名篮球运动员每场得分情况如下:甲的得分:12,15,24,25,31,31,36,37,36,39,44,49,50.乙的得分:8,13
3、,14,16,23,26,28,33,38,39,51,9,17.(1)用茎叶图表示上面的数据;(2)根据你所画的茎叶图,分析甲、乙运动员的得分情况变式 2 有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取了 16 台,记录了上午 8:0011:00 间各自的销售情况(单位:元)画出茎叶图,分析两城市自动售货机的销售情况例 3 从甲、乙两种玉米苗中各抽 10 株,分别测得它们的株高如下(单位:cm):甲:25 41 40 37 22 14 19 39 21 42乙:27 16 44 27 44 16 40 40 16 40问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?变式 3
4、甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测 10 个,它们的尺寸分别为(单位:mm):甲:10.2 10.1 10.9 8.9 9.9 10.3 9.7 10 9.9 10.1乙:10.3 10.4 9.6 9.9 10.1 10 9.8 9.7 10.2 10分别计算上面两个样本的平均数与标准差如果图纸上的设计尺寸为 10 mm,从计算结果看,用哪台机床加工这种零件较合适A 级1用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A总体容量越大,估计越精确B总体容量越小,估计越精确C样本容量越大,估计越精确D样本容量越小,估计越精确2频率分布直方图中,小长方形的面
5、积等于( )A组距 B频率 C组数 D频数3一个样本数据按从小到大的顺序排列为 13,14,19,x,23,27,28,31,其中位数为 22,则 x 为( )A21 B22 C20 D234从总体中抽取的样本数据有 n1 个 a,n 2 个 b,n 3 个 c,则总体平均数的估计值为( )A. B.a b c3 n1 n2 n33C. D.n1a n2b n3c3 n1a n2b n3cn1 n2 n35一个容量为 n 的样本,分成若干组,已知甲组的频数和频率分别为 36 和 ,则容量14n_,且频率为 的乙组的频数是_166已知一样本 x1,x 2,x n,其标准差 s8.5,另一样本 3
6、x15,3x 25,3x n5,其标准差 s_.7某商店大米的价格是 3.00 元/千克,面粉的价格是 3.60 元/千克,大米与面粉的销量分别是 1 000 千克,500 千克,则该商店出售的粮食的平均价格是_元/千克B 级8容量为 20 的样本数据,分组后的频数如下表:则样本数据落在区间10,40)的频率为( )A0.35 B0.45 C0.55 D0.659.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示) ,则该样本的中位数、众数、极差分别是( ) A46,45,56 B46,45,53C47,45,56 D45,47,5310某同学使用计算器求 30 个数据的平
7、均数时,错将其中一个数据 105 输入为 15,那么由此求出的平均数与实际平均数的差等于( )A3.5 B3 C3 D0.511如图是容量为 100 的样本的频率分布直方图,试根据图形中的数据填空(1)样本数据落在范围6,10) 内的频率为_;(2)样本数据落在范围10,14) 内的频数为_12已知样本 9,10,11,x,y 的平均数是 10,方差是 4,则 xy_.13某校 100 名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60), 60,70),70,80),80,90),90,100 (1)求图中 a 的值;(2)根据频率分布直方图,估计这 100 名学生
8、语文成绩的平均分;(3)若这 100 名学生语文成绩某些分数段的人数( x)与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在50,90)之外的人数.14某车间 20 名工人年龄数据如下表:(1)求这 20 名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图;(3)求这 20 名工人年龄的方差详解答案典型例题例 1 解 (1)最低身高为 151 cm,最高身高为 180 cm,它们的差是 18015129,即极差为 29;确定组距为 3,组数为 10,列表如下:(2)频率分布直方图,如图所示变式 1 解 (1)样本频率分布表如下:(2)其频率分
9、布直方图如下:(3)由样本频率分布表可知身高小于 134 cm 的男孩出现的频率为 0.040.070.080.19,所以我们估计身高小于 134 cm 的人数占总人数的 19%.例 2 解 (1)如图所示的茎叶图中,中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分的个位数(2)从茎叶图上可以看出:甲运动员的得分比较集中在茎为 3 的一行,且大致关于这一行对称;乙运动员的得分主要分散在四行所以甲运动员的发挥比较稳定,总体得分情况比乙运动员好变式 2 解 茎叶图如图所示根据茎叶图对两城市自动售货机进行比较,从茎叶图上可以看出:甲城市自动售货机的销售量不均匀,有最多的,5
10、8 元有最少的,5 元;乙城市自动售货机的销售量没有特殊销售量,分布比较均匀因此乙城市自动售货机销售量比较稳定例 3 解 (1) 甲 (25414037221419392142) 30030(cm) ,x110 110乙 (27164427441640401640) 31031(cm) x110 110 甲 s 乙 ,所以乙比甲稳定,用乙较合适x x强化提高1C 2.B 3.A 4.D5144 24解析 抽样时要保证每个个体被抽到的机会均等,则 ,所以 n364144,设频率14 36n为 的乙组的频数为 x,同理 ,x24.16 16 x144625.5解析 s3s25.5.73.208B
11、根据频率的定义求解由表知10,40)的频数为 2 349,所以样本数据落在区间10,40)的频率为 0.45.9209A 由题意知,各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是 46,众数是 45,最大数为 68,最小数为 12,极差为 681256.10B 少输入 90, 3,平均数少 3,求出的平均数减去实际的平均数等于3.9030110.32 36解析 样本数据落在6,10)内的频率为 40.080.32,落在 10,14)内的频率为40.
12、090.36,频数 n1000.3636.1291解析 由题意得Error!即Error!解得Error! ,或Error! .所以 xy91.13解 (1)由频率分布直方图知(2 a0.020.030.04)101,解得 a0.005.(2)由频率分布直方图知这 100 名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073(分) (3)由频率分布直方图知语文成绩在50,60),60,70) ,70,80) ,80,90)各分数段的人数依次为0.005101005,0.041010040,0.031010030,0.021010020
13、.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40 20,30 40,20 25.12 43 54故数学成绩在50,90)之外的人数为 100(5 204025)10.14解 (1)这 20 名工人年龄的众数为:30;这 20 名工人年龄的极差为: 401921.(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图如下:(3)这 20 名工人年龄的平均数为:(19 28329330531432340)2030;所以这 20 名工人年龄的方差为:(3019) 2 (3028) 2 (3029) 2 (3030) 2 (3031) 2 (3032)120 320 320 520 420 3202 (3040) 212.6.120