1、2.2.2 用样本的数字特征估计总体的数字特征,1.能从样本数据中提取基本的数字特征(如平均数、众数、中位数),并进行合理的解释. 2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差. 3.会用样本的基本数字特征估计总体的基本数字特征.,1.本课重点是用样本平均数和标准差估计总体的平均数与标准差. 2.本课难点是能应用相关知识解决简单的实际问题.,1.众数、中位数、平均数的概念 (1)众数:一组数据中_的数. (2)中位数:一组数据按大小顺序排列后,处于_位置的 数.如果个数是偶数,则取_两个的平均数. (3)平均数:一组数据的_除以数据个数所得到的数. 2.标准差与方差的概念 标准
2、差是样本数据到平均数的一种_,一般用s表示, 即样本数据x1,x2,xn的标准差,出现次数最多,中间,中间,和,平均距离,S=_, 方差 S2=_.,1.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93计算平均分时,一般要去掉一个最高分和一个最低分,其目的是什么? 提示:消除极端值的影响.,2.对数字特征的理解中,下列说法正确的是_. 数据5,4,4,3,5,2的众数为4; 数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半; 方差与标准差具有相同的单位; 如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变. 【解析】中的
3、众数应为4和5;正确;不正确;正确,平均数也应减去该常数,方差不变. 答案:,3.若M个数的平均数是X,N个数的平均数是Y,则M+N个数的平均数是_. 【解析】M个数的和为MX,N个数的和为NY,则M+N个数的和为 MX+NY,所以其平均数为 答案:,4.已知五个数据3,5,7,4,6,则该样本的标准差为_. 【解析】答案:,1.众数、中位数、平均数的特点 (1)众数:众数容易计算;众数只能表示样本数据中的很少一部分信息;众数可以反映一组数据的多数水平. (2)中位数:中位数易计算,能较好地表现数据信息;中位数不受少数极端数据的影响;中位数通常用来描述分类变量的中心位置. (3)平均数:平均数
4、代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.,2.对方差与标准差概念的理解 (1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小. (2)标准差、方差的取值范围:0,+). 标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.,(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.,众数、中位数、平均数的计算 【技法点拨】 利用样本数字特征进行决策时的两
5、个关注点 (1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.,(2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.,【典例训练】 1.10名工人某天生产同一零件,生产的件数是15,17,14,10, 15,17,17,16,14,12,设其平均数为a,中位数为b,众数为 c,则有( ) (A)abc (B)bca (C)cab (D)cba 2.某房间中10个人的平均身高为1.74米,身高为1.85米的第11个人进入
6、房间后,这11个人的平均身高是_.,3.下面是某快餐店所有工作人员一周的收入表: (1)计算所有人员的周平均收入; (2)这个平均收入能反映打工人员的周收入的一般水平吗?为什么? (3)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗?,【解析】1.选D.平均数中位数b=15,众数c=17.cba. 2.原来的10个人的身高之和为17.4米,所以,这11个人的平 均身高为 即这11个人的平均身高为1.75米. 答案:1.75米 3.(1)周平均收入=750(元).,(2)这个平均收入不能反映打工人员的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一
7、个异常值,对平均收入产生了较大的影响,并且他不是打工人员. (3)去掉老板的收入后的周平均收入 (450+350+400+ 320+320+410)=375(元).这能代表打工人员的周收入水平.,【思考】在题3中,为什么(3)中去掉老板的收入后,再计算平均收入,能代表打工人员的周收入的水平? 提示:因为老板收入是个特殊数据,对平均值产生很大的影响,因此从统计分析的某一角度进行分析时,应剔除.,【变式训练】(2012黄冈模拟)如图是某赛季甲、乙两名篮球运动员每场比赛得分茎叶图,则在这几场比赛得分中甲的中位数与乙的众数之和是( ) (A)50 (B)41 (C)51 (D)61.5,【解析】选C.
8、甲的中位数是 =27,乙的众数是24,所以甲的中位数与乙的众数之和是51.,标准差(方差)的计算及应用 【技法点拨】 1.计算标准差的五个步骤 (1)算出样本数据的平均数 . (2)算出每个样本数据与样本数据平均数的差:(3)算出(2)中的xi- (i=1,2,3,,n)平方. (4)算出(3)中n个平方数的平均数,即为样本方差.,(5)算出(4)中方差的算术平方根,即为样本标准差. 2.标准差(方差)的两个作用 (1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小. (2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准
9、差以确定稳定性.,【典例训练】 1.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) (A)甲地:总体均值为3,中位数为4 (B)乙地:总体均值为1,总体方差大于0 (C)丙地:中位数为2,众数为3 (D)丁地:总体均值为2,总体方差为3,2.(2012菏泽高一检测)从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下: (1)计算甲、乙两人射击命中环数的平均数与方差. (2)比较
10、两人成绩,决定应该选哪一人参赛.,【解析】1.选D.根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.,2.(1)(2) 应该选派乙参赛.,【想一想】在实际决策中,是否一定采用方差小的一种方案? 提示:当平均数差异较大时,不必考虑方差;在体育比赛中,若两人平均水平都比对手稍差,则应选派方差大的,以期超水平发挥.,【变式训练】(2012东北三校联考)甲、乙两位同学在
11、高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列叙述正确的是( ),(A)x甲x乙;乙比甲成绩稳定 (B)x甲x乙;甲比乙成绩稳定 (C)x甲x乙;乙比甲成绩稳定 (D)x甲x乙;甲比乙成绩稳定 【解析】选C.由题意可知又由方差公式可得,因为 故乙的成绩波动较小,乙的成绩比甲稳定 【误区警示】方差越小越稳定,而在计算方差时务必要计算准确无误.,各数字特征的综合应用 【技法点拨】 用频率分布直方图估计众数、中位数、平均数 (1)众数:取最高小长方形底边中点的横坐标作为众数. (2)中位数:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x
12、轴交点的横坐标称为中位数. (3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.,【典例训练】 1.某校为了了解学生的课外阅读情况,随机抽查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ),(A)0.6 h (B)0.9 h (C)1.0 h (D)1.5 h,2.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求: (1)这50名学生成绩的众数与中位数; (2)这50名学生的平均
13、成绩.,【解析】1.选 2.(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小矩形框的中间值的横坐标即为所求,所以众数应为75. 在频率分布直方图中,中位数的左右两边频数应相等,即频率也相等,从而小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.,0.00410+0.00610+0.0210=0.04+0.06+0.2=0.3,前三个小矩形面积的和为0.3. 而第四个小矩形面积为0.0310=0.3,0.3+0.30.5, 中位数应位于第四个小矩形内, 设其底边为x,高为0.03,令0.03x=0.2,得x6.7
14、, 故中位数应为70+6.7=76.7.,(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可. 平均成绩为45(0.00410)+55(0.00610)+65(0.0210)+75(0.0310)+85(0.02410)+95(0.01610)=76.2. 综上,(1)众数是75,中位数约为76.7;(2)平均成绩为76.2.,【归纳】频率分布直方图中中位数的求法. (1)利用小矩形的面积和初步判断中位数所在的区间. (2)利用中位数左右两边的小矩形的面积和相等,列出关于中位数的方程,如题2的第(1)问. (3)解方程,求出中位数
15、.,【变式训练】为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则,(1)这20名工人中一天生产该产品数量在55,75)的人数是_. (2)这20名工人中一天生产该产品数量的中位数为_. (3)这20名工人中一天生产该产品数量的平均数为_. 【解析】(1)(0.04010+0.02510)20=13. (2)设中位数为x,则0.2+(x-55)0.04=0.5,x=62.5. (3)0.250+0.460+0.2570+0.180+0.0590=64. 答案:(1)13 (2)62.5 (3)64,【易错误区】估计总体数字特征时的易错点 【典
16、例】(2012吉林模拟)在教学调查中,甲、乙、丙三个班的数学测试成绩分布如图,假设三个班的平均分都是75分,s1,s2,s3分别表示甲、乙、丙三个班数学测试成绩的标准差,则有:( ),(A)s3s1s2 (B)s2s1s3 (C)s1s2s3 (D)s3s2s1 【解题指导】,【解析】选D.所给图是成绩分布图,平均分是75分,在图1中,集中在75分附近的数据最多,图3中从50分到100分均匀分布,所有成绩不集中在任何一个数据附近,图2介于两者之间.由标准差的意义可得s3s2s1,故选D.,【阅卷人点拨】通过阅卷后分析,对解答本题的常见错误及解题启示总结如下:(注:此处的见解析过程),【即时训练
17、】(福建师大附中高一检测)甲、乙两位运动员5 场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分 别为 则下列判断正确的是( ) (A) 甲比乙成绩稳定 (B) 乙比甲成绩稳定 (C) 甲比乙成绩稳定 (D) 乙比甲成绩稳定,【解析】选D.甲的平均得分 方差乙的平均得分 方差乙比甲成绩稳定.,1.某同学使用计算器求30个数据的平均数时,错将其中一个 数据105输入为15,那么由此求出的平均数与实际平均数的 差是( ) (A)3.5 (B)-3 (C)3 (D)-0.5 【解析】选B.错将数据105输入为15,则平均数少 即与实际平均数的差是-3.,2.一位同学种了甲、乙两种树苗各1株,分别
18、观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米),则甲、乙两种树苗高度的数据的中位数之和是( )(A)44 (B)54 (C)50 (D)52,【解析】选D.根据茎叶图可得,甲树苗9次得到的树苗高度分 别为19,20,21,23,24,31,32,33,37;乙树苗10次得到的树苗高 度分别为10,10,14,24,26,30,44,46,46,47,则甲树苗高度的 中位数为24,乙树苗高度的中位数为 因此2428 52.,3.某射手在一次训练中五次射击的成绩分别为9.4,9.4,9.4, 9.6,9.7,则该射手五次射击的成绩的方差是( ) (A)0.127 (B)0.01
19、6 (C)0.08 (D)0.216 【解析】选,4.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是_.,【解析】数据从小到大排列后可得其中位数为平均数为答案:91.5,91.5,5.下面是某校学生日睡眠时间的抽样频率分布表(单位:h), 试估计该学生的日平均睡眠时间.,【解析】方法一:总睡眠时间约为 6.255+6.7517+7.2533+7.7537+8.256+8.752= 739(h). 故平均睡眠时间约为7.39 h. 方法二:求每组中值与对应频率之积的和 6.250.05+6.750.17+7.250.33+7.750.37+8.250.06+8.750.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为7.39 h.,