1、- 1 -第三节 用样本估计总体考纲传真 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题1频率分布直方图(1)画频率分布直方图的步骤:(2)频率分布直方图:反映样本频率分布的直方图横轴表示样本数据,纵轴表示 ,每个小矩形的面积表示样本落在该组内的频率频 率组 距2频
2、率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线3茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数4样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数(2)中位数:把 n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(3)平均数:把 称为 x1, x2, xn这 n
3、 个数的平均数xx1 x2 xnn(4)标准差与方差:设一组数据 x1, x2, x3, xn的平均数为 ,则这组数据的标准差和方x差分别是- 2 -s ;1n x1 x 2 x2 x 2 xn x 2s2 (x1 )2( x2 )2( xn )21n x x x常用结论1频率分布直方图中各小矩形的面积之和为 1.2频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数(2)中位数左边和右边的小长方形的面积和是相等的(3)平均数是频率分布直方图的“重心” ,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和3若数据 x1, x2, xn的平均
4、数为 ,方差为 s2,则数据xmx1 a, mx2 a, mx3 a, mxn a 的平均数是 m a,方差为 m2s2.x基础自测1(思考辨析)判断下列结论的正误(正确的打“” ,错误的打“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势( )(2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次( )答案 (1) (2) (3) (4)2为评估一种农作物的种植效果,选了 n 块地作试验田这 n 块地的
5、亩产量(单位:kg)分别为 x1, x2, xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A x1, x2, xn的平均数B x1, x2, xn的标准差C x1, x2, xn的最大值D x1, x2, xn的中位数B 标准差反映样本数据的离散波动大小,故选 B.3数据 1,3,4,8 的平均数与方差分别是( )A2,2.5 B2,10.5C4,2 D4,6.5D 平均数为 4,方差为 6.5.1 3 4 84 1 4 2 3 4 2 4 4 2 8 4 244某学生在一门功课的 22 次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )
6、- 3 -A117 B118C118.5 D119.5B 22 次考试中,所得分数最高的为 98,最低的为 56,所以极差为 985642,将分数从小到大排列,中间两数为 76,76,所以中位数为 76,所以此学生该门功课考试分数的极差与中位数之和为 4276118.5(教材改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于 35岁的 80 名教师按年龄分组,分组区间为35,40),40,45),45,50),50,55),55,60,由此得到频率分布直方图如图,则这 80 名教师中年龄小于 45 岁的有_人48 由频率分布直方图可知 45 岁以下的教师的频率为 5(0.0
7、400.080)0.6,所以共有800.648(人). 样本的数字特征的计算与应用1在某次测量中,得到的 A 样本数据为 81,82,82,84,84,85,86,86,86,若 B 样本数据恰好是 A 样本数据分别加 2 后所得的数据,则 A, B 两个样本的下列数字特征对应相同的是( )A众数 B平均数C标准差 D中位数C 由题意可得 A, B 两组数据的众数分别是 86 和 88,排除 A; B 组数据的平均数比 A 组数据的平均数大 2,排除 B; B 组数据的中位数比 A 组数据的中位数大 2,排除 D; A, B 两组数据的标准差相同,C 正确,故选 C.2甲、乙两人在一次射击比赛
8、中各射靶 5 次,两人成绩的条形统计图如图所示,则( )甲 乙- 4 -A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差C 根据条形统计图可知甲的中靶情况为 4 环、5 环、6 环、7 环、8 环;乙的中靶情况为 5环、5 环、5 环、6 环、9 环. 甲 (45678)6, 乙 (5369)6,甲的成绩x15 x 15的方差为2,乙的成绩的方差为 4 6 2 5 6 2 6 6 2 7 6 2 8 6 252.4;甲的成绩的极差为 4 环,乙的成绩的极差 5 6 23 6 6 2 9 6 25为
9、4 环;甲的成绩的中位数为 6 环,乙的成绩的中位数为 5 环,综上可知 C 正确,故选 C.3某人 5 次上班途中所花的时间(单位:分钟)分别为 x, y,10,11,9.已知这组数据的平均数为 10,方差为 2,则| x y|的值为( )A1 B2C3 D4D 由题意可知Error!Error!( x y)2 x2 y22 xy,即 2082 xy400, xy96.( x y)2 x2 y22 xy16,| x y|4,故选 D.规律方法 众数、中位数、平均数、方差的意义及常用结论1 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中
10、位数、众数描述其集中趋势,方差和标准差描述波动大小.2 方差的简化计算公式: ,或写成 s2s21n x21 x2 x2n nx2,即方差等于原数据平方的平均数减去平均数的平方.1n x21 x2 x2n x2茎叶图【例 1】 某良种培育基地正在培育一小麦新品种 A,将其与原有的一个优良品种 B 进行对照试验,两种小麦各种植了 25 亩,所得亩产量的数据(单位:千克)如下:品种 A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种 B:-
11、5 -363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出品种 A 与 B 亩产量数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种 A 与 B 的亩产量及其稳定性进行比较,写出统计结论解 (1)画出茎叶图如图所示(2)由于每个品种的数据都只有 25 个,样本容量不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据(3)通过观察茎叶图可以看
12、出:品种 A 的亩产量的平均数(或均值)比品种 B 高;品种 A的亩产量的标准差(或方差)比品种 B 大,故品种 A 的亩产量的稳定性较差规律方法 茎叶图中的两个关注点1 重复出现的数据要重复记录,不能遗漏.2 给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.易错警示:茎叶图中数字大小排列不一定从小到大排列,一定要看清楚.(1)空气质量指数(Air Quality Index,简称 AQI)是定量描述空气质量状况的指数,空气质量按照 AQI 大小分为六级,050 为优;51100为良;101150 为轻度污染;151200 为中度污
13、染;201300 为重度污染;大于 300 为严重污染从某地一环保人士某年的 AQI 记录数据中,随机抽取10 个,用茎叶图记录如图根据该统计数据,估计此地该年 AQI 大于 100 的天数约为_(该年为 365 天)(2)如图所示的茎叶图是甲、乙两位选手在某次比赛中的比赛得分,则下列说法正确的是( )A甲的平均数大于乙的平均数B甲的中位数大于乙的中位数- 6 -C甲的方差大于乙的方差D甲的平均数等于乙的中位数(1)146 (2)C (1)该样本中 AQI 大于 100 的频数是 4,频率为 ,25由此估计该地全年 AQI 大于 100 的频率为 ,25估计此地该年 AQI 大于 100 的天
14、数约为 365 146.25(2)由茎叶图可知, 甲 (594532382426111214)29, 乙x19 x (514330342025272812)1930, s (30216 23 29 25 23 218 217 215 2)2甲19235.3, s (21213 20 24 210 25 23 22 218 2)120.9,甲的中位数为 26,2乙19乙的中位数为 28.所以甲的方差大于乙的方差故选 C.频率分布直方图【例 2】 某城市 100 户居民的月平均用电量(单位:千瓦时),以160,180),180,200),200,220),220,240),240,260),260
15、,280),280,300分组的频率分布直方图如图(1)求直方图中 x 的值(2)求月平均用电量的众数和中位数(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在220,240的用户中应抽取多少户?解 (1)(0.0020.009 50.0110.012 5 x0.0050.002 5)201,解得x0.007 5.即直方图中 x 的值为 0.007 5.(2)月平均用电量的众数是 230.220 2402(0.0020.009 50.011)200.450.5,(0.0020.009 50
16、.0110.012 5)200.70.5,月平均用电量的中位数在220,240)内- 7 -设中位数为 a,则 0.450.012 5( a220)0.5,解得 a224,即中位数为 224.(3)月平均用电量在220,240的用户有 0.012 52010025(户)同理可得月平均用电量在240,260)的用户有 15 户,月平均用电量在260,280)的用户有 10 户,月平均用电量在280,300的用户有 5 户,故抽取比例为 .1125 15 10 5 15月平均用电量在220,240)的用户中应抽取 25 5(户)15规律方法 频率、频数、样本容量的计算方法1频 率组 距 组 距 频
17、 率 .2频 数样 本 容 量 频 率 , 频 数频 率 样 本 容 量 , 样 本 容 量 频 率 频 数 .从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组 75,85) 85,95) 95,105) 105,115) 115,125频数 6 26 38 22 8(1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品的 80%”的规定?解 (1)如图所
18、示:- 8 -(2)质量指标值的样本平均数为800.06900.261000.381100.221200.08100.x质量指标值的样本方差为 s2(20) 20.06(10)20.2600.3810 20.2220 20.08104.所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104.(3)质量指标值不低于 95 的产品所占比例的估计值为 0.380.220.080.68.由于该估计值小于 0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品的 80%”的规定1(2017全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集
19、并整理了 2014 年 1 月至 2016 年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是( )A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在 7,8 月D各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变化比较平稳A 对于选项 A,由图易知月接待游客量每年 7,8 月份明显高于 12 月份,故 A 错;对于选项 B,观察折线图的变化趋势可知年接待游客量逐年增加,故 B 正确;- 9 -对于选项 C,D,由图可知显然正确故选 A.2(2018全国卷)某地区经过一年的新农村建设,农村的经
20、济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A 设新农村建设前经济收入的总量为 x,则新农村建设后经济收入的总量为 2x.建设前种植收入为 0.6x,建设后种植收入为 0.74x,故 A 不正确;建设前其他收入为 0.04x,建设后其他收入为 0.1x,故 B 正确;建设前养殖收入为 0.3x,建设后养殖收入为 0.6x,故 C 正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的 58%,故 D 正确