1、2.2.2用样本的数字特征估计总体的数字特征,1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.,1.众数、中位数、平均数(1)众数:在一组数据中,出现次数_的数据叫做这一组数据的众数.(2)中位数:将一组数据按_依次排列,把处在_位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.(3)平均数:假设样本数据是x1,x2,xn, 表示这组数据的平均数,则 =_.,最多,大小,最中间
2、,2.方差、标准差假设样本数据是x1,x2,x3,xn, 是平均数,则(1)方差是s2=_.(2)标准差为s=_.,1.已知一组数据为20,30,40,50,50,60,70,80,其中平均数、中位数和众数的大小关系是()A.平均数中位数众数B.平均数中位数众数C.中位数众数平均数D.众数=中位数=平均数【解析】选D.平均数为 =50,中位数为50,众数为50,都相等.,2.一组样本数据按从小到大的顺序排列为12,15,20,x,23,28,30,50,其中,中位数为22,则x=()A.21B.15C.22D.35【解析】选A.因为共有八个数,因此,当按从小到大的顺序排列后,中位数等于最中间两
3、数的平均数,即x+23=222,解得x=21.,3.设x1=4,x2=5,x3=6,则该样本的标准差为.【解析】由 =5得s= 答案:,一、众数、中位数、平均数的应用初中我们曾经学过众数、中位数、平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.根据下图回答下列问题:,探究1:通过频率分布直方图可以看出众数在哪个区域内?提示:从这些样本数据的频率分布直方图可以看出,月均用水量的众数在最高的矩形的区域内,即2,2.5).探究2:如何从频率分布直方图中估计中位数呢?提示:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.在频率分布直方图中,
4、矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.,探究3:如何在样本数据的频率分布直方图中估计出平均数的值?提示:平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和为平均数.,【探究总结】对众数、中位数、平均数的三点说明(1)众数通常用来表示样本数据的最大集中点,容易计算.但是它只能表达样本数据中很少的一部分信息,因为它忽视了其他数据信息.(2)中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响,容易计算,它仅利用了中间数据的信息.(3)平均数受样本中的每一个数据的
5、影响,“越离群”的数据,对平均数的影响也越大.,二、标准差与方差根据方差和标准差的公式思考下面的问题.,探究1:标准差、方差的取值范围是什么?标准差、方差为0的样本数据有什么特点?提示:标准差、方差的取值范围均为0,+).标准差、方差为0时,样本各数据全相等,都等于样本平均数.表明数据没有波动幅度,数据没有离散性.探究2:标准差的大小对数据的离散程度有何影响?提示:标准差越大,表明各数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小.它用来描述样本数据的离散程度.在实际应用中,标准差常被理解为稳定性.,【探究总结】1.方差的三点运算性质假设一组数据x1,x2,xn的平均数为 ,
6、方差为s2,则(1)新数据x1+b,x2+b,xn+b的平均数为 +b,方差仍为s2.(2)新数据ax1,ax2,axn的平均数为a ,方差为a2s2.(3)新数据ax1+b,ax2+b,axn+b的平均数为a +b,方差为a2s2.,2.数字特征的选择当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,此时需要一个新的统计量标准差(方差)刻画样本数据的离散程度.在实际应用中,常综合样本的多个统计数据,对总体进行估计,为解决问题做出决策.,类型一 众数、中位数、平均数的应用1.(2014石家庄高一检测)对某商店一个月内每
7、天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是(),A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53,2.高一(2)班有男生27名,女生21名,在一次物理测试中,男生的平均分是82分,中位数是75分,女生的平均分是80分,中位数是80分.(1)求这次测试全班平均分(精确到0.01).(2)估计全班成绩在80分以下(含80分)的学生至少有多少人?(3)分析男生的平均分与中位数相差较大说明了什么?,【解题指南】1.根据茎叶图的特点和众数、中位数、极差的定义可得出结果.2.根据各种数的定义及意义解决问题.【自主解答】1.选
8、A.直接列举求解.由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.,2.(1)由平均数公式得 = (8227+8021)81.13(分).(2)因为男生的中位数是75分,所以至少有14人得分不超过75分.又因为女生的中位数是80分,所以至少有11人得分不超过80分.所以全班至少有25人得分不超过80分.(3)男生的平均分与中位数的差别较大,说明男生中两极分化现象严重,得分高
9、的和得分低的相差较大.,【规律总结】1.中位数的求法(1)当数据个数为奇数时,中位数是按大小顺序排列的中间那个数.(2)当数据个数为偶数时,中位数为按大小顺序排列的最中间的两个数的平均数.,2.数据特征的分析如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息.所以,应当深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,并结合实际情况,灵活应用.,【变式训练】如图是某班学生在一次数学考试中的成绩的频率分布直方图.根据直方图估计其成绩的众数是 ,中位数是
10、,平均数是.,【解析】由频率分布直方图可知,其众数为 75设中位数为x,由图知0.01100.0210(x70)0.030.5,所以x 平均数为(550.01650.02750.03850.025950.015)1076.5答案:75 76.5,类型二 标准差、方差的应用1.(2014福州高一检测)若a1,a2,a20这20个数据的平均数为,方差为0.20,则a1,a2,a20, 这21个数据的方差约为.,2.(2013长春高一检测)甲、乙两位学生参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809
11、085(1)用茎叶图表示这两组数据.(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.,【解题指南】1.由平均数和方差的定义直接求解.2.先画出茎叶图,再利用平均数和方差结合的形式分析稳定性.【自主解答】1. 答案:0.19,2.(1)作出茎叶图如下:,(2)派甲参赛比较合适.理由如下: (702+804+902+8+9+1+2+4+8+3+5)=85, (701+804+903+5+0+0+3+5+0+2+5)=85, (78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(
12、95-85)2=35.5, (75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2=41,因为所以甲的成绩较稳定,派甲参赛比较合适.,【规律总结】1.标准差的性质(1)全组数据每一数据都加上一个相同的常数C后计算得到的标准差不变.(2)若每一数据值都乘以一个相同的非零常数C,则所得到的标准差等于原标准差乘以这个常数的绝对值.(3)每个数据值都乘以同一个非零常数C,再加上另一个常数d,所得数据的标准差等于原标准差乘以这个常数的绝对值.,2.计算标准差的五个步骤第一步:算出样本数据的平均数 ;第二步:算出每个样
13、本数据与样本平均数的差xi- (i=1,2,n);第三步:算出(xi- )2(i=1,2,n);第四步:算出(xi- )2(i=1,2,n)这n个数的平均数,即为样本方差s2;第五步:算出方差的算术平方根,即为样本标准差s.,【拓展延伸】方差的两种化简形式方差描述一组数据围绕平均数波动的幅度.在应用时注意其公式 的两个简化形式: 其中x1=x1-a,x2=x2-a,xn=xn-a,a是接近原数据平均数的一个常数.,【变式训练】皮划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:甲27,38,30,37,35,31.乙33,29,38,34,28,36.根据
14、以上数据,试判断他们谁最优秀.,【解析】 (27+38+30+37+35+31)=33, (33+29+38+34+28+36)=33, (27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2= (-6)2+52+(-3)2+42+22+(-2)2= , (33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2= (-4)2+52+12+(-5)2+32=,所以 说明二人的最大速度的平均值相同,但乙比甲更稳定.故乙比甲更优秀,即乙最优秀.,类型三 由频率分布表或直方图求数字特征1.(2013黄
15、冈高二检测)某行业从2013年开始实施绩效工资改革,为了解该行业职工工资收入情况,调查了1 000名该行业的职工,并由所得数据画出了如图所示的频率分布直方图,由图可知中位数为元.现要从这1 000人中再用分层抽样的方法抽出100人做进一步调查,则月收入在3 500,4 000)(元)内应抽出人.,2.已知一组数据:125121123125127129125128130129126124125127126122124125126128(1)填写下面的频率分布表:,(2)作出频率分布直方图.(3)根据频率分布直方图求这组数据的众数、中位数和平均数.,【解题指南】1.根据频率分布直方图求解中位数,求
16、出月收入在3 500,4 000)的频率,计算应抽取的人数.2.先由频数分别求出各组的频率,完成频率分布表,画出频率分布直方图,再由频率分布直方图中数字特征的意义作答.,【自主解答】1.设中位数为x,可知(x-3 000)0.000 5=0.2,x=3 400,由图3 500,4 000)(元)收入段的频率是0.000 5500=0.25,故用分层抽样方法抽出100人做进一步调查,在3 500,4 000)(元)收入段应抽出人数为0.25100=25.答案:3 40025,2.(1),(2),(3)在124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5.
17、又因为前两个小矩形的频率和为0.25.所以设第三个小矩形底边的一部分长为x.则x0.2=0.25,得x=1.25.所以中位数为124.5+1.25=125.75.使用“组中值”求平均数为121.50.1+123.50.15+125.50.4+127.50.2+129.50.15=125.8.,【规律总结】利用频率分布直方图求数字特征的方法(1)众数是最高的矩形的底边的中点的横坐标.(2)中位数左右两侧直方图的面积相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.(4)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均
18、数.,【变式训练】某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,求:(1)高一参赛学生的成绩的众数、中位数.(2)高一参赛学生的平均成绩.,【解析】(1)根据直方图得第一、二、三、四、五组的频率分别为:0.30,0.40,0.15,0.10,0.05.用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65.又因为第一个小矩形的面积为0.3,所以设第二个小矩形底边的一部分长为x,则x0.04=0.2,得x=5,所以中位数为60+5=65.(2)依题意,平均成绩为550.3+650.4+750.15+850.1+950.05=67,所以平均成绩约为67.,